位置: IT常识 - 正文

【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

编辑:rootadmin
【数据挖掘】-支持向量机(SVM)+代码实现

目录

从例子出发

算法原理

超平面

支持向量

如何处理不清晰的边界

​非线性可分的情况

常见的核函数​

算法的优点

代码的实现

总结


从例子出发

推荐整理分享【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:数据挖掘需要学哪些,数据挖掘需要学哪些,数据挖掘工程师,数据挖掘工具,数据挖掘的基本流程,数据挖掘工具,数据挖掘工具,数据挖掘需要学哪些,内容如对您有帮助,希望把文章链接给更多的朋友!

 算法原理

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比,支持向量机,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。

具体来说就是在线性可分时,在原空间寻找两类样本的最优分类超平面。在线性不可分时,加入松弛变量并通过使用非线性映射将低维度输入空间的样本映射到高维度空间使其变为线性可分,这样就可以在该特征空间中寻找最优分类超平面。

 超平面

支持向量【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

假设找到一条线可以分割红豆和绿豆 红豆和绿豆中距离这条线最近的几个样本点被称为支持向量(Support Vector) 这些点到这条线的距离称为间隔 在决定最佳超平面时只有支持向量起作用,而其他数据点并不起作用

如何处理不清晰的边界

非线性可分的情况

SVM中采取的办法是: 把不可划分的样本映射到高维空间中

在SVM中借助“核函数”,来实现映射到高维的操作

 常见的核函数

算法的优点

 支持向量机算法可以解决小样本情况下的机器学习问题,简化了通常的分类和回归等问题。 由于采用核函数方法克服了维数灾难和非线性可分的问题,所以向高维空间映射时没有增加计算的复杂性。换句话说,由于支持向量计算法的最终决策函数只由少数的支持向量所确定,所以计算的复杂性取决于支持向量的数目,而不是样本空间的维数。 支持向量机算法利用松弛变量可以允许一些点到分类平面的距离不满足原先要求,从而避免这些点对模型学习的影响。

 算法的缺点 

支持向量机算法对大规模训练样本难以实施。这是因为支持向量机算法借助二次规划求解支持向量,这其中会涉及m阶矩阵的计算,所以矩阵阶数很大时将耗费大量的机器内存和运算时间。 经典的支持向量机算法只给出了二分类的算法,而在数据挖掘的实际应用中,一般要解决多分类问题,但支持向量机对于多分类问题解决效果并不理想。 SVM算法效果与核函数的选择关系很大,往往需要尝试多种核函数,即使选择了效果比较好的高斯核函数,也要调参选择恰当的参数。另一方面就是现在常用的SVM理论都是使用固定惩罚系数C,但正负样本的两种错误造成的损失是不一样的。

 代码的实现from sklearn import datasetsfrom sklearn import svm#引入svm包import numpy as npnp.random.seed(0)iris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices= np.random.permutation(len(iris_x))iris_x_train = iris_x[indices[:-10]]iris_y_train= iris_y[indices[:-10]]iris_x_test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel = 'linear')clf.fit(iris_x_train,iris_y_train)#拟合#调用该对象的测试方法,主要接收一个参数:测试数据集

iris_x__test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel= 'linear')clf.fit(iris_x_train,iris_y_train) #拟合#调用该对象的测试方法,主要接收一个参数:测试数据集iris_y_predict= clf.predict(iris_x_test)#调用该对象的打分方法,计算出准确率score=clf.score(iris_x_test,iris_y_test,sample_weight=None)print('iris_y_predict=')print(iris_y_predict)print('iris_y_test= ')print(iris_y_test)print('Accuracy:"',score)

 

总结

支持向量机算法分类和回归方法的中都支持线性性和非线性类型的数据类型。非线性类型通常是二维平面不可分,为了使数据可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易区分,这样就达到数据分类或回归的目的,而实现这一目标的函数称为核函数。

工作原理:当低维空间内线性不可分时,可以通过高位空间实现线性可分。但如果在高维空间内直接进行分类或回归时,则存在确定非线性映射函数的形式和参数问题,而最大的障碍就是高维空间的运算困难且结果不理想。通过核函数的方法,可以将高维空间内的点积运算,巧妙转化为低维输入空间内核函数的运算,从而有效解决这一问题。

本文链接地址:https://www.jiuchutong.com/zhishi/300749.html 转载请保留说明!

上一篇:Vue.js介绍(vue.js简介)

下一篇:Vue.js 状态管理:Pinia 与 Vuex(vuex状态机)

  • 如何进行论坛推广,论坛推广的一些方法(如何进行论坛推销)

    如何进行论坛推广,论坛推广的一些方法(如何进行论坛推销)

  • 荣耀畅玩20后面几个摄像头(荣耀畅玩20后面四个摄像头都是干什么的?)

    荣耀畅玩20后面几个摄像头(荣耀畅玩20后面四个摄像头都是干什么的?)

  • 建行流水手机银行可以导出吗(建行流水手机银行解压密码怎么找)

    建行流水手机银行可以导出吗(建行流水手机银行解压密码怎么找)

  • 微信群500人满了还能加人吗(微信群500人满了怎么弄1000人)

    微信群500人满了还能加人吗(微信群500人满了怎么弄1000人)

  • QQ怎么完成群主发的群待办(qq怎么给人群主)

    QQ怎么完成群主发的群待办(qq怎么给人群主)

  • 微信无法更新到最新版本怎么办(微信无法更新到最新版本)

    微信无法更新到最新版本怎么办(微信无法更新到最新版本)

  • 快手小店申请退款取消了怎么在申请退款(快手小店申请退款多久才能退款)

    快手小店申请退款取消了怎么在申请退款(快手小店申请退款多久才能退款)

  • 微信怎么发邮箱给别人(微信怎么发邮箱文件给别人)

    微信怎么发邮箱给别人(微信怎么发邮箱文件给别人)

  • 拼多多保证金交1000行吗(拼多多保证金交了有什么好处)

    拼多多保证金交1000行吗(拼多多保证金交了有什么好处)

  • 学习通电脑端有摄像头吗

    学习通电脑端有摄像头吗

  • 苹果se2电池多大(苹果se2电池容量多少)

    苹果se2电池多大(苹果se2电池容量多少)

  • 抖音直播点红心要钱吗(抖音直播点红心震动怎么关闭)

    抖音直播点红心要钱吗(抖音直播点红心震动怎么关闭)

  • 惠普2600墨盒加墨后怎么还显示没墨(惠普2600墨盒加墨后不识别怎么办)

    惠普2600墨盒加墨后怎么还显示没墨(惠普2600墨盒加墨后不识别怎么办)

  • 小米8强制重启按什么键(小米8强制重启怎么弄)

    小米8强制重启按什么键(小米8强制重启怎么弄)

  • 耳机图标一直显示怎么办(耳机图标一直显示就是没有声音)

    耳机图标一直显示怎么办(耳机图标一直显示就是没有声音)

  • oppo手机新品reno耗电快(oppo手机新品reno私密照片怎么找)

    oppo手机新品reno耗电快(oppo手机新品reno私密照片怎么找)

  • 主码和外码的概念(举例说明什么是主码什么是外码)

    主码和外码的概念(举例说明什么是主码什么是外码)

  • 淘宝单张券已领取上限怎么办(淘宝单张券领取上限)

    淘宝单张券已领取上限怎么办(淘宝单张券领取上限)

  • 苹果用美图秀秀总是显示无网络(苹果用美图秀秀容易糊)

    苹果用美图秀秀总是显示无网络(苹果用美图秀秀容易糊)

  • 滴滴车怎么接单多(滴滴车怎么接单赚钱吗)

    滴滴车怎么接单多(滴滴车怎么接单赚钱吗)

  • 如何将照片作为ppt背景(如何将照片作为表情包)

    如何将照片作为ppt背景(如何将照片作为表情包)

  • qq火花删除好友还有吗(qq火花删除好友再加回来怎么恢复)

    qq火花删除好友还有吗(qq火花删除好友再加回来怎么恢复)

  • 三星s10处理器型号(3星s10处理器)

    三星s10处理器型号(3星s10处理器)

  • 如何卸载win10自带的xbox(如何卸载win10自带浏览器)

    如何卸载win10自带的xbox(如何卸载win10自带浏览器)

  • 动态磁贴/ IE 浏览器没了,微软 Win11 功能特定要求、弃用移除功能列表公布(怎么添加动态磁贴)

    动态磁贴/ IE 浏览器没了,微软 Win11 功能特定要求、弃用移除功能列表公布(怎么添加动态磁贴)

  • python中Allure框架是什么?(python框架的作用)

    python中Allure框架是什么?(python框架的作用)

  • 生产成本和销售费用是对应账户吗
  • 发票收款人和复核没写可以用吗
  • 提供劳务应收未收的款项
  • 预期信用损失影响坏账准备吗
  • 私立医院申报程序
  • 附加免税额是什么
  • 股东借款超过一年个人所得税
  • 车间报销办公费计入什么科目
  • 工程项目结算方式有哪几种
  • 跨区经营如何预缴税款
  • 何为售后租回
  • 企业购房税费政策
  • 未完工的工程款怎么支付
  • 自产产品赠送确认收入吗
  • 定额发票上盖什么章
  • 4.86的税率怎么算
  • 工程项目处理废旧钢材怎么入账的
  • 转让长期股权投资怎么算
  • 购买汽车分期付款利息怎么算
  • 金融企业哪些呆账损失可以在税前扣除?
  • win10自带播放器不见了
  • 怎样保持ppt在所有电脑上不变
  • 【免费】多种方法手把手教你如何将自己做的网页做成网络链接(直接访问)
  • 收购自然人股东的股权要注意什么
  • linux系统中如何查看日志
  • win10点击网络属性没反应
  • 后端接口返回数据类型规范
  • php chm
  • 按税收的计税依据为标准税收分为
  • 最快的XQD存储卡是什么
  • 乐观锁用法
  • 语言翻译算法
  • php随机ip访问
  • php密码加密技术phpass
  • 委托第三方收款合法吗
  • 永久性差异会计不确认收入
  • 增值税电子发票怎么下载
  • php7编译安装gd库
  • 电子发票的优点好处
  • 小规模纳税人增值税申报表怎么填
  • 人工成本的分类是
  • 关于材料采购的通知
  • 金税四期对企业纳税管理影响分析
  • 代扣代缴增值税要交附加税吗
  • 经营活动现金流量净额是什么意思
  • 矿场维护
  • 名为股权转让实为房地产转让
  • 个人所得税要计入管理费用吗
  • 福利费的进项税额可以抵扣吗
  • 端午节发放的现金福利会计处理
  • 在税收方面属于什么领域
  • 个体户查账征收个人所得税税率
  • 电信增值服务费会计科目
  • 食品企业产品
  • 企业出售产品
  • 金税盘发票认证怎么操作流程
  • 销售公司中的服务是什么
  • 政府奖励我公司的钱
  • 企业去银行
  • mysql查询包含
  • mysql存储过程菜鸟教程
  • 微软新品发布
  • ac1st19.dll
  • xp快捷桌面图标
  • windows 安装app
  • 远程桌面连接xp系统
  • ubuntu怎么切换到桌面
  • console打开
  • macos 多屏
  • 怎么判断电脑windows几
  • cocos2dx4.0教程
  • js数组操作方法
  • js处理时间格式
  • javascript快速入门
  • position属性含义
  • 宁波增值税普通发票有几联发票
  • 购进货物计入什么科目
  • 丰台和朝阳中间是哪里
  • 支部组织生活会流程
  • 保险公司的人可以查到买保险的人都买了什么保险吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设