位置: IT常识 - 正文

【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

编辑:rootadmin
【数据挖掘】-支持向量机(SVM)+代码实现

目录

从例子出发

算法原理

超平面

支持向量

如何处理不清晰的边界

​非线性可分的情况

常见的核函数​

算法的优点

代码的实现

总结


从例子出发

推荐整理分享【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:数据挖掘需要学哪些,数据挖掘需要学哪些,数据挖掘工程师,数据挖掘工具,数据挖掘的基本流程,数据挖掘工具,数据挖掘工具,数据挖掘需要学哪些,内容如对您有帮助,希望把文章链接给更多的朋友!

 算法原理

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比,支持向量机,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。

具体来说就是在线性可分时,在原空间寻找两类样本的最优分类超平面。在线性不可分时,加入松弛变量并通过使用非线性映射将低维度输入空间的样本映射到高维度空间使其变为线性可分,这样就可以在该特征空间中寻找最优分类超平面。

 超平面

支持向量【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

假设找到一条线可以分割红豆和绿豆 红豆和绿豆中距离这条线最近的几个样本点被称为支持向量(Support Vector) 这些点到这条线的距离称为间隔 在决定最佳超平面时只有支持向量起作用,而其他数据点并不起作用

如何处理不清晰的边界

非线性可分的情况

SVM中采取的办法是: 把不可划分的样本映射到高维空间中

在SVM中借助“核函数”,来实现映射到高维的操作

 常见的核函数

算法的优点

 支持向量机算法可以解决小样本情况下的机器学习问题,简化了通常的分类和回归等问题。 由于采用核函数方法克服了维数灾难和非线性可分的问题,所以向高维空间映射时没有增加计算的复杂性。换句话说,由于支持向量计算法的最终决策函数只由少数的支持向量所确定,所以计算的复杂性取决于支持向量的数目,而不是样本空间的维数。 支持向量机算法利用松弛变量可以允许一些点到分类平面的距离不满足原先要求,从而避免这些点对模型学习的影响。

 算法的缺点 

支持向量机算法对大规模训练样本难以实施。这是因为支持向量机算法借助二次规划求解支持向量,这其中会涉及m阶矩阵的计算,所以矩阵阶数很大时将耗费大量的机器内存和运算时间。 经典的支持向量机算法只给出了二分类的算法,而在数据挖掘的实际应用中,一般要解决多分类问题,但支持向量机对于多分类问题解决效果并不理想。 SVM算法效果与核函数的选择关系很大,往往需要尝试多种核函数,即使选择了效果比较好的高斯核函数,也要调参选择恰当的参数。另一方面就是现在常用的SVM理论都是使用固定惩罚系数C,但正负样本的两种错误造成的损失是不一样的。

 代码的实现from sklearn import datasetsfrom sklearn import svm#引入svm包import numpy as npnp.random.seed(0)iris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices= np.random.permutation(len(iris_x))iris_x_train = iris_x[indices[:-10]]iris_y_train= iris_y[indices[:-10]]iris_x_test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel = 'linear')clf.fit(iris_x_train,iris_y_train)#拟合#调用该对象的测试方法,主要接收一个参数:测试数据集

iris_x__test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel= 'linear')clf.fit(iris_x_train,iris_y_train) #拟合#调用该对象的测试方法,主要接收一个参数:测试数据集iris_y_predict= clf.predict(iris_x_test)#调用该对象的打分方法,计算出准确率score=clf.score(iris_x_test,iris_y_test,sample_weight=None)print('iris_y_predict=')print(iris_y_predict)print('iris_y_test= ')print(iris_y_test)print('Accuracy:"',score)

 

总结

支持向量机算法分类和回归方法的中都支持线性性和非线性类型的数据类型。非线性类型通常是二维平面不可分,为了使数据可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易区分,这样就达到数据分类或回归的目的,而实现这一目标的函数称为核函数。

工作原理:当低维空间内线性不可分时,可以通过高位空间实现线性可分。但如果在高维空间内直接进行分类或回归时,则存在确定非线性映射函数的形式和参数问题,而最大的障碍就是高维空间的运算困难且结果不理想。通过核函数的方法,可以将高维空间内的点积运算,巧妙转化为低维输入空间内核函数的运算,从而有效解决这一问题。

本文链接地址:https://www.jiuchutong.com/zhishi/300749.html 转载请保留说明!

上一篇:Vue.js介绍(vue.js简介)

下一篇:Vue.js 状态管理:Pinia 与 Vuex(vuex状态机)

  • word怎么插入封面(怎么在word里插封面)

    word怎么插入封面(怎么在word里插封面)

  • voip通话环境不支持录屏(通话环境设置)

    voip通话环境不支持录屏(通话环境设置)

  • iphone7频繁跳出运营商(苹果7老是弹出来登陆id)

    iphone7频繁跳出运营商(苹果7老是弹出来登陆id)

  • 滴滴出行实名认证不是本人怎么修改(滴滴出行实名认证有风险吗)

    滴滴出行实名认证不是本人怎么修改(滴滴出行实名认证有风险吗)

  • x10荣耀上市时间(x10荣耀什么时候发布)

    x10荣耀上市时间(x10荣耀什么时候发布)

  • 华为手机中病毒的表现(华为手机中病毒怎么解决)

    华为手机中病毒的表现(华为手机中病毒怎么解决)

  • 电信卡停机保号多久手机号码会被注销(电信卡停机保号后怎么样才能再开机)

    电信卡停机保号多久手机号码会被注销(电信卡停机保号后怎么样才能再开机)

  • 手机接收不到信息是怎么回事(手机接收不到信号是什么原因)

    手机接收不到信息是怎么回事(手机接收不到信号是什么原因)

  • wps怎么统一改数字字体(wps怎么批量修改数字格式)

    wps怎么统一改数字字体(wps怎么批量修改数字格式)

  • 朋友圈仅自己可见的信息在哪看到(朋友圈仅自己可见后改成公开)

    朋友圈仅自己可见的信息在哪看到(朋友圈仅自己可见后改成公开)

  • 华为titcl10是什么型号(华为trt_tl10什么型号)

    华为titcl10是什么型号(华为trt_tl10什么型号)

  • 京东待收货怎么取消(京东待收货怎么退款)

    京东待收货怎么取消(京东待收货怎么退款)

  • 乐视手机怎么导入联系人(乐视手机怎么导出联系人到sim卡)

    乐视手机怎么导入联系人(乐视手机怎么导出联系人到sim卡)

  • ios13.1自动调节亮度(ios13.6.1自动调节亮度)

    ios13.1自动调节亮度(ios13.6.1自动调节亮度)

  • 华为手机录音怎么循环播放(华为手机录音怎么录)

    华为手机录音怎么循环播放(华为手机录音怎么录)

  • 华为P30怎么解除滑动解锁(华为p30怎么解除限制)

    华为P30怎么解除滑动解锁(华为p30怎么解除限制)

  • 微信朋友圈怎么看自己的评论(微信朋友圈怎么转发)

    微信朋友圈怎么看自己的评论(微信朋友圈怎么转发)

  • 荣耀20s和荣耀20对比(荣耀20s和荣耀20se有区别吗)

    荣耀20s和荣耀20对比(荣耀20s和荣耀20se有区别吗)

  • ios12.3更新失败(ios12.1无法更新)

    ios12.3更新失败(ios12.1无法更新)

  • x278+128和8+256的区别(x278+128是高配还是低配)

    x278+128和8+256的区别(x278+128是高配还是低配)

  • 苹果收到闪信是病毒吗(苹果手机收到闪信是中毒了吗)

    苹果收到闪信是病毒吗(苹果手机收到闪信是中毒了吗)

  • qbupdate.exe - qbupdate是什么进程 有什么作用

    qbupdate.exe - qbupdate是什么进程 有什么作用

  • tensorflow使用显卡gpu进行训练详细教程(tensorflow dlib)

    tensorflow使用显卡gpu进行训练详细教程(tensorflow dlib)

  • 税率如何计算公式
  • 当月红冲发票账务怎么处理
  • 房地产按揭是什么意思
  • 其他应收款减值测试注意什么
  • 实收资本增加的原因
  • 两免三减半的范围
  • 银行的电子退库是什么,怎么做账
  • 违约金收入是否征税
  • 企业所得税的税率
  • 外商独资投资性公司
  • 会计核算形式
  • 开具有误拒收的增值税专用发票怎么办?
  • 房屋估价入账需要计算什么税款?
  • 补发工资计算公式
  • 供电局发票金额可以多开吗
  • 经营损失计入哪类费用
  • 个人去税务局开居间费发票
  • 增值税税负率税率怎么算
  • 农业企业销售林木是否要交印花税?
  • 委托代销商品委托方发出商品的分录
  • 收到认证费用计入什么科目
  • 应收账款应计利息公式如何理解
  • 政府高薪补贴
  • 所得税费用什么时候结转
  • 怎么用苹果电脑查找苹果手机
  • 上个月退货会计分录
  • 合并范围外关联方交易是否抵消
  • 代扣个人缴纳社保费
  • 收到汇算清缴退税账务处理
  • php函数式编程
  • 入固定资产含税吗
  • 摊销租赁费的会计分录
  • 实行核定征收印花税的纳税期限为一个月税额较小的
  • PHP:imagecreatefromgif()的用法_GD库图像处理函数
  • 企业税负率过高的坏处
  • 不开票销售收入怎么做账务处理
  • 小规模企业应交税费
  • 股东以房产投资公司
  • ecs怎么用
  • php网站访问量大怎么优化
  • 未抵扣的进项发票,开出红字信息表,需要做进项税转出吗
  • 一般情况下指什么
  • 物业管理企业会计核算的特点如何?
  • 初次购买金税盘怎么做账
  • 子公司注销合并报表少数股东权益的处理
  • 企业间拆借资金是否合法
  • 自产产品对外捐赠确认收入吗
  • 支付一年房租费怎么做账
  • 凭证扣除 28号
  • 收到快递赔付款怎么做账
  • 增值税收入的确认时间
  • 建筑升降机厂家
  • 小规模企业所得税优惠政策最新2023
  • 会计中结转属于什么科目
  • 私营企业固定资产折旧
  • Advanced Pagination for MySQL(mysql高级分页)
  • VMWare linux mysql 5.7.13安装配置教程
  • sqlserver 查看表
  • solaris开放指定端口
  • freebsd ports安装
  • 手机找回删除的文件
  • win8 boot manager
  • cocos2dx游戏案例
  • opengl教程48讲
  • jquery 瀑布流
  • perl计算时间差
  • centos安装完成后桌面没有图标
  • unity5用什么语言
  • javascript getattribute
  • javascript教程 csdn
  • javascript中select下拉框的用法总结
  • 使用粗盐热敷十大危害
  • js的iframe
  • jquery事件的响应
  • 如何计算增值税税负率公式
  • 北京大兴国税局领导班子
  • 福建失业金领取几个月
  • 车辆购置税查询电话
  • 股权转让税务备案时间
  • 税法上接受捐赠是什么
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设