位置: IT常识 - 正文

【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

编辑:rootadmin
【数据挖掘】-支持向量机(SVM)+代码实现

目录

从例子出发

算法原理

超平面

支持向量

如何处理不清晰的边界

​非线性可分的情况

常见的核函数​

算法的优点

代码的实现

总结


从例子出发

推荐整理分享【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:数据挖掘需要学哪些,数据挖掘需要学哪些,数据挖掘工程师,数据挖掘工具,数据挖掘的基本流程,数据挖掘工具,数据挖掘工具,数据挖掘需要学哪些,内容如对您有帮助,希望把文章链接给更多的朋友!

 算法原理

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比,支持向量机,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。

具体来说就是在线性可分时,在原空间寻找两类样本的最优分类超平面。在线性不可分时,加入松弛变量并通过使用非线性映射将低维度输入空间的样本映射到高维度空间使其变为线性可分,这样就可以在该特征空间中寻找最优分类超平面。

 超平面

支持向量【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

假设找到一条线可以分割红豆和绿豆 红豆和绿豆中距离这条线最近的几个样本点被称为支持向量(Support Vector) 这些点到这条线的距离称为间隔 在决定最佳超平面时只有支持向量起作用,而其他数据点并不起作用

如何处理不清晰的边界

非线性可分的情况

SVM中采取的办法是: 把不可划分的样本映射到高维空间中

在SVM中借助“核函数”,来实现映射到高维的操作

 常见的核函数

算法的优点

 支持向量机算法可以解决小样本情况下的机器学习问题,简化了通常的分类和回归等问题。 由于采用核函数方法克服了维数灾难和非线性可分的问题,所以向高维空间映射时没有增加计算的复杂性。换句话说,由于支持向量计算法的最终决策函数只由少数的支持向量所确定,所以计算的复杂性取决于支持向量的数目,而不是样本空间的维数。 支持向量机算法利用松弛变量可以允许一些点到分类平面的距离不满足原先要求,从而避免这些点对模型学习的影响。

 算法的缺点 

支持向量机算法对大规模训练样本难以实施。这是因为支持向量机算法借助二次规划求解支持向量,这其中会涉及m阶矩阵的计算,所以矩阵阶数很大时将耗费大量的机器内存和运算时间。 经典的支持向量机算法只给出了二分类的算法,而在数据挖掘的实际应用中,一般要解决多分类问题,但支持向量机对于多分类问题解决效果并不理想。 SVM算法效果与核函数的选择关系很大,往往需要尝试多种核函数,即使选择了效果比较好的高斯核函数,也要调参选择恰当的参数。另一方面就是现在常用的SVM理论都是使用固定惩罚系数C,但正负样本的两种错误造成的损失是不一样的。

 代码的实现from sklearn import datasetsfrom sklearn import svm#引入svm包import numpy as npnp.random.seed(0)iris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices= np.random.permutation(len(iris_x))iris_x_train = iris_x[indices[:-10]]iris_y_train= iris_y[indices[:-10]]iris_x_test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel = 'linear')clf.fit(iris_x_train,iris_y_train)#拟合#调用该对象的测试方法,主要接收一个参数:测试数据集

iris_x__test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel= 'linear')clf.fit(iris_x_train,iris_y_train) #拟合#调用该对象的测试方法,主要接收一个参数:测试数据集iris_y_predict= clf.predict(iris_x_test)#调用该对象的打分方法,计算出准确率score=clf.score(iris_x_test,iris_y_test,sample_weight=None)print('iris_y_predict=')print(iris_y_predict)print('iris_y_test= ')print(iris_y_test)print('Accuracy:"',score)

 

总结

支持向量机算法分类和回归方法的中都支持线性性和非线性类型的数据类型。非线性类型通常是二维平面不可分,为了使数据可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易区分,这样就达到数据分类或回归的目的,而实现这一目标的函数称为核函数。

工作原理:当低维空间内线性不可分时,可以通过高位空间实现线性可分。但如果在高维空间内直接进行分类或回归时,则存在确定非线性映射函数的形式和参数问题,而最大的障碍就是高维空间的运算困难且结果不理想。通过核函数的方法,可以将高维空间内的点积运算,巧妙转化为低维输入空间内核函数的运算,从而有效解决这一问题。

本文链接地址:https://www.jiuchutong.com/zhishi/300749.html 转载请保留说明!

上一篇:Vue.js介绍(vue.js简介)

下一篇:Vue.js 状态管理:Pinia 与 Vuex(vuex状态机)

  • 允许不完美(允许不完美的事实例子素材)

    允许不完美(允许不完美的事实例子素材)

  • 苹果4个摄像头的手机(苹果4个摄像头的是哪款手机)

    苹果4个摄像头的手机(苹果4个摄像头的是哪款手机)

  • 电脑软件打开立马闪退(电脑软件打开应用程序没反应)

    电脑软件打开立马闪退(电脑软件打开应用程序没反应)

  • oppoa53m怎么录屏(oppoa53怎样录制屏幕)

    oppoa53m怎么录屏(oppoa53怎样录制屏幕)

  • 微信小程序怎么关闭让他从此都没有(微信小程序怎么批量删除)

    微信小程序怎么关闭让他从此都没有(微信小程序怎么批量删除)

  • 京东怎么发起退款申请(京东怎么发起退货退款申请)

    京东怎么发起退款申请(京东怎么发起退货退款申请)

  • 苹果为什么更新不了版本(苹果为什么更新不了系统)

    苹果为什么更新不了版本(苹果为什么更新不了系统)

  • 荣耀20多长(荣耀20多长多宽)

    荣耀20多长(荣耀20多长多宽)

  • 华为hfc是什么意思(华为hc是什么意思)

    华为hfc是什么意思(华为hc是什么意思)

  • 苹果se基带是高通还是英特尔(iphone se 基带芯片)

    苹果se基带是高通还是英特尔(iphone se 基带芯片)

  • 快手给别人点亮不显示怎么办(快手里面的点亮是什么意思,如何点亮)

    快手给别人点亮不显示怎么办(快手里面的点亮是什么意思,如何点亮)

  • 淘宝怎么看以前的购买记录(淘宝怎么看以前快递的物流)

    淘宝怎么看以前的购买记录(淘宝怎么看以前快递的物流)

  • 小米扫地机器人充电完成后会自动离开吗(小米扫地机器人怎么样)

    小米扫地机器人充电完成后会自动离开吗(小米扫地机器人怎么样)

  • 手机如何充电才能保证电池使用最长久(手机如何充电才耐用)

    手机如何充电才能保证电池使用最长久(手机如何充电才耐用)

  • 微信高耗电怎么关闭(最新版微信耗电过高)

    微信高耗电怎么关闭(最新版微信耗电过高)

  • 库乐队有什么用(苹果14的库乐队有什么用)

    库乐队有什么用(苹果14的库乐队有什么用)

  • ipad有没有录音功能(ipad有没有录音转文字功能)

    ipad有没有录音功能(ipad有没有录音转文字功能)

  • iphonex怎么改闹钟铃声(iphonex怎么改闹钟的音乐)

    iphonex怎么改闹钟铃声(iphonex怎么改闹钟的音乐)

  • qq音乐app收藏歌曲(qq音乐怎么收藏的歌单)

    qq音乐app收藏歌曲(qq音乐怎么收藏的歌单)

  • 抖屏是什么意思(抖屏有什么用)

    抖屏是什么意思(抖屏有什么用)

  • 索尼xperia1如何开启开发者选项

    索尼xperia1如何开启开发者选项

  • 华为有没有测量距离(华为有没有测量血压的手表)

    华为有没有测量距离(华为有没有测量血压的手表)

  • 打电话拉黑会提示什么(打电话拉黑提示什么)

    打电话拉黑会提示什么(打电话拉黑提示什么)

  • 华为抖音动态壁纸怎么设置锁屏(华为抖音动态壁纸怎么设置不了)

    华为抖音动态壁纸怎么设置锁屏(华为抖音动态壁纸怎么设置不了)

  • 小规模税控盘抵扣增值税报表怎么填
  • 社保局发放的稳岗补贴怎么入账
  • 库存现金账务处理
  • 应交增值税账面和申报表不符
  • 跨月专用发票怎么冲销
  • 企业所得税准予扣除
  • 月末计提账务处理
  • 车间消耗品的会计分录
  • 企业必须要现金流入吗
  • 个人独资企业法人承担什么责任
  • 长期股权投资的明细科目有哪些
  • 房地产营改增后开票
  • 税务行政强制行为遵循的原则
  • 差额发票开具的步骤
  • 普通机打发票可以抵税吗
  • 折旧计算所得税吗
  • 公积金提取条件
  • 建筑行业简易征收税率是5%吗?
  • 没有认缴到位的股票
  • 业务招待费是收入的
  • 工程项目发包是什么意思
  • 银行的贷款损失准备会计分录
  • 治理层和管理层包括哪些
  • 汇算清缴所得税补缴怎么处理
  • 怎么用U盘装系统win7
  • 苹果手机录音转mp3怎么转
  • 未实缴出资的股权转让后还要承担法律后果吗
  • 在建工程进项税可以抵扣吗
  • 发票已到货未到会计处理
  • lsass.exe是什么进程
  • php imagick
  • 固定资产自行建造的会计处理
  • twig教程
  • 小公司不交社保违法吗
  • php get_headers
  • 动态模型图如何制作
  • 电费打发票用哪个软件
  • 填报的资产总额在季初和季末存在差异是什么意思
  • parted命令详解
  • php如何自学
  • 应收账款坏账准备计提方法
  • 没有实收资本的股权原值
  • 帝国cms使用手册
  • 高速费会计分录怎么写
  • 销售自己使用过的物品免税吗
  • 税务登记后要马上报税吗
  • 存货发出的计价方式有哪些
  • 房租预付款会计分录
  • 收到政府补贴现金流
  • 现金往来款怎么做账
  • 广发银行的主营业务
  • 发票已付款,可以开红字吗
  • 材料抵扣进项税额
  • 长期待摊费用是当月摊销还是次月摊销
  • 纳税申报准备什么材料
  • 免征增值税进项税怎么弄
  • mysql8设置时区
  • sql server临时表创建语句
  • mysql5.7分区表
  • win7系统远程
  • windows隐藏
  • windows7录音怎么录
  • win8系统运行窗口怎么打开
  • .exe是啥
  • win7旗舰版提示不是正版
  • windows 8怎么样
  • win7账户不见了
  • python 变参
  • perl脚本输出变量
  • jQuery使用$.ajax进行异步刷新的方法(附demo下载)
  • listary 替代
  • sed删除文件中的目录
  • shell定时删除指定目录下的文件夹
  • python最简单
  • javascript对象定义
  • 海关进口增值税如何入账
  • 河南省地方税务局房产税管理办法
  • 河源市人民医院上班时间
  • 360浏览器hi真不巧
  • 个体户 零申报
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设