位置: IT常识 - 正文

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

编辑:rootadmin
基于随机森林的特征选择-降维-回归预测——附代码

目录

摘要:

1.随机森林:

2.随机森林的特征选取:

3.基于Matlab自带的随机森林函数进行特征选取具体步骤

(1)加载数据

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

(3)使用随机森林进行特征选择

(4)评价各个特征之间的相关性

(5)使用筛选后的特征进行测试

4.本文Matlab代码


摘要:

推荐整理分享基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于随机森林的气温预测论文,基于随机森林的气温预测论文,基于随机森林的收入预论文,基于随机森林的欺诈检测,基于随机森林的气温预测论文,基于随机森林的电影评分预测,基于随机森林的特征选择,基于随机森林的电影评分预测,内容如对您有帮助,希望把文章链接给更多的朋友!

演示如何通过Matlab自带的随机森林函数进行特征选择,筛选出大量特征数据中对于回归预测最重要的特征,并对各特征进行重要性排序,充分反应不同特征的重要性。演示如何在种植随机树林时为数据集选择适当的拆分预测变量选择技术。随机森林特征筛选一种特征选择技术,特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。

已写好输入输出结构,方便使用者通过替换自己的数据实现不同的功能,注释详细

适合数学建模等直接应用

1.随机森林:

随机森林算法(Random Forest,RF)是一种 新型机器学习算法,是利用多棵决策树对样本进行训练并集成预测的一种分类器,它采用Boot‐ strap重抽样技术从原始样本中随机抽取数据构 造多个样本,然后对每个重抽样样本采用节点的 随机分裂技术构造多棵决策树,最后将多棵决策树组合,并通过投票得出最终预测结果。

根据下列算法而建造每棵树 :

1.用N来表示训练用例(样本)的个数,M表示特征数目。

2.输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。

3.从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。

4.对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。

5.每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用)。

2.随机森林的特征选取:

随机森林算法利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,这一特点对于大量特征参与分类时非常适用,因为众多特征之间的高相关性会产生高维问题,会显著降低提取的精度。现阶段机器学习模型的特征空间往往庞大且复杂,呈现出高维性、非线性等复杂特点,面对这样的海量高维数据,剔除冗余特征进行特征筛选,已成为当今信息与科学技术面临的重要问题之一。实际上,特征选择正是从输入特征中优选了重要性高、信息量丰富的特征来提高地物信息提取的精度,在遥感应用中有着重要的应用潜力。

在特征重要性的基础上,特征选择的步骤如下:

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

1.计算每个特征的重要性,并按降序排序

2.确定要剔除的比例,依据特征重要性剔除相应比例的特征,得到一个新的特征集

3.用新的特征集重复上述过程,直到剩下m个特征(m为提前设定的值

4.根据上述过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集

3.基于Matlab自带的随机森林函数进行特征选取具体步骤(1)加载数据

加载Matlab自带的数据集。建立一个随机森林预测模型,该模型根据汽车的气缸数、发动机排量、马力、重量、加速度、车型年份和原产国来预测汽车的燃油经济性。使用Load函数进行数据的加载。

各单词解释:

【Cylinders,Displacement,Horsepower,Weight,Acceleration,Model_Year,Origin】

【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

使用templateTree和fitrensemble这两个函数建立随机森林,并先使用全部的特征进行车辆经济性进行预测。输入为【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】,输出为【车辆经济性】,随机森林中的决策树数量设置为100。训练模型并进行预测分析,具体结果如下,使用全部特征进行预测的准确度为87.1417.

(3)使用随机森林进行特征选择

根据第二点所述,利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,编写相关程序进行随机森林特征筛选,具体结果与各个特征变量的重要性情况如下所示:

(4)评价各个特征之间的相关性

当随机森林评价完成特征的重要性后,还需要对各个特征变量之间的相关性进行评估,以更加明显的看出何种特征最能影响预测结果,使用皮尔逊系数作为各个特征变量之间的相关性评价指标,从下图可以看出,越接近黄色表示相关性越强。

(5)使用筛选后的特征进行测试

综合之前所有特征的重要性与相关性的重要性评价情况,使用【重量,车辆年份】这两个特征进行回归预测,也就是从7个特征降维到2个特征。建立随机森林进行回归预测,其设置与之前的相同,同样使用100棵树。具体结果如下

可以看到,使用两个特征进行预测的准确度为85.2077,与使用所有特征进行预测的准确度相差不大,这表明随机森林特征选择方法有效的选择出了最重要的特征,实现了从大量特征到少数重要特征的特征降维筛选,极大的降低了特征的冗余性。

4.本文Matlab代码
本文链接地址:https://www.jiuchutong.com/zhishi/296057.html 转载请保留说明!

上一篇:vue-treeselect 的基本使用(vue treegrid)

下一篇:import在vue中使用(import vue from vue报错)

  • 腾讯视频免流量在哪里设置(腾讯视频免流量怎么关闭自动续费)

    腾讯视频免流量在哪里设置(腾讯视频免流量怎么关闭自动续费)

  • 华为手机自带的软件能不能卸载(华为手机自带的遥控器软件叫什么)

    华为手机自带的软件能不能卸载(华为手机自带的遥控器软件叫什么)

  • 安卓手机电池健康怎么看(安卓手机电池健康度)

    安卓手机电池健康怎么看(安卓手机电池健康度)

  • iphonexr自带膜吗(苹果xr新机有没有贴钢化膜)

    iphonexr自带膜吗(苹果xr新机有没有贴钢化膜)

  • 苹果辅助功能快捷键怎么关闭(苹果辅助功能快捷键变灰色了)

    苹果辅助功能快捷键怎么关闭(苹果辅助功能快捷键变灰色了)

  • 屏幕失灵是内屏还是外屏坏了(屏幕失灵是内屏损坏吗)

    屏幕失灵是内屏还是外屏坏了(屏幕失灵是内屏损坏吗)

  • 美图秀秀拍视频能拍多久(美图秀秀拍视频没保存怎么找回)

    美图秀秀拍视频能拍多久(美图秀秀拍视频没保存怎么找回)

  • ipad的wlan和cellular区别(ipad2020 wlan与cellular)

    ipad的wlan和cellular区别(ipad2020 wlan与cellular)

  • 小米手环黑屏没反应(小米手环黑屏没声音)

    小米手环黑屏没反应(小米手环黑屏没声音)

  • vivo手机相册图标没了(vivo手机相册图标不见了怎么恢复正常)

    vivo手机相册图标没了(vivo手机相册图标不见了怎么恢复正常)

  • soul如何知道对方在线(soul如何知道对方是男是女)

    soul如何知道对方在线(soul如何知道对方是男是女)

  • 信息闪退是怎么回事儿(信息闪退打不开)

    信息闪退是怎么回事儿(信息闪退打不开)

  • 微博绑定手机号上限(微博绑定手机号注销了怎么登录)

    微博绑定手机号上限(微博绑定手机号注销了怎么登录)

  • 网络突然不能用了怎么回事(苹果手机移动网络突然不能用)

    网络突然不能用了怎么回事(苹果手机移动网络突然不能用)

  • 如何查找自己的电话(如何查找自己的邮箱号)

    如何查找自己的电话(如何查找自己的邮箱号)

  • 用鼠标复制粘贴怎么弄(笔记本怎么不用鼠标复制粘贴)

    用鼠标复制粘贴怎么弄(笔记本怎么不用鼠标复制粘贴)

  • ipv6常见地址是什么(ipv6地址包括)

    ipv6常见地址是什么(ipv6地址包括)

  • 计算机中运算器的主要功能(计算机中运算器的主要功能是完成算术和逻辑运算判断题)

    计算机中运算器的主要功能(计算机中运算器的主要功能是完成算术和逻辑运算判断题)

  • 京东怎么删评论(怎样删除京东评论)

    京东怎么删评论(怎样删除京东评论)

  • ipad屏幕常亮怎么回事(ipad一直亮屏对屏幕有损坏吗)

    ipad屏幕常亮怎么回事(ipad一直亮屏对屏幕有损坏吗)

  • 手机恢复出厂设置后数据还能恢复吗(手机恢复出厂设置是不是彻底干净)

    手机恢复出厂设置后数据还能恢复吗(手机恢复出厂设置是不是彻底干净)

  • 四级密码要求(四级的密码要求)

    四级密码要求(四级的密码要求)

  • y93怎么设置指纹(vivoy93s指纹锁怎么设置)

    y93怎么设置指纹(vivoy93s指纹锁怎么设置)

  • dos查看盘符(dos查看所有盘)

    dos查看盘符(dos查看所有盘)

  • 在Win10系统中,防火墙如何设置白名单?(在Win10系统中卸载最近更新的补丁并重启电脑)

    在Win10系统中,防火墙如何设置白名单?(在Win10系统中卸载最近更新的补丁并重启电脑)

  • 详解Promise使用(promise基本使用)

    详解Promise使用(promise基本使用)

  • 税务申报后就可以清盘了吗
  • 个体工商户开劳务发票税率
  • 开票地址一定要写全吗
  • 行政职工福利费包括哪些内容呢
  • 销售返利的会计科目
  • 固定资产计入了主营业务成本,该怎么办
  • 房地产企业增值税纳税义务发生时间
  • 哪些纳税人需要实名办税
  • 长期待摊费用属于无形资产吗
  • 房租怎么抵扣个税计算方法
  • 卖二手车发票如何做账?
  • 募捐建议
  • 以银行存款退还投资者股金
  • 支付税点怎么做账
  • 税务与审计调整结果不一致该如何调整?
  • 股权减资会计处理
  • 税友服务费能否抵扣
  • 分支机构能否随总机构认定为一般纳税人
  • 企业所得税中准予扣除的损失
  • 外企企业所得税怎么计算
  • 固定资产报废怎么开票
  • 外汇局网上申报
  • 商誉减值测试的方法有哪些
  • 办公室空调维修属于办公费吗
  • 私立幼儿园收费归哪个部门管
  • 技术入股分红怎么计算
  • win7对话框文本框在哪里
  • php处理ajax
  • 税控盘进项税已抵扣如何转出分录
  • 旧房转让土地增值税计算案例
  • 税务登记后每个月交什么钱
  • PHP:imagerectangle()的用法_GD库图像处理函数
  • 长期借款利息的会计科目
  • ros urdf
  • php gd gd2
  • 房产备案交税
  • thinkphp自定义标签page
  • php对象是什么类型的数据
  • 专家坐诊信息
  • 出口抵减内销产品应纳税额怎么结转
  • 软件企业高新技术产品证明材料
  • 发票违法行为的认定
  • 项目建设期算不算折旧
  • 企业应设置的账簿包括什么
  • 分期付款的消费税怎么计算
  • 预支报销单
  • 怎么把其他应收款借方余额转出
  • 非应税项目是有哪些项目
  • win2008安装sql2008教程
  • 交易性金融资产公允价值变动怎么算
  • 销售折扣的账务处理有详细的计算过程
  • 减免所得税需要交税吗
  • 预付账款年底怎么调账
  • 建筑安装行业都需要什么资格证书
  • 研发支出资本化支出期末怎么处理
  • 开1000的增值税发票要交多少税
  • 内部产生的商誉应确认为无形资产
  • 其它流动资产为负数原因
  • 核定征收需要带什么资料
  • bash是什么意思中文翻译
  • 任务管理器边框怎么设置
  • ubuntu系统升级到18
  • 虚拟光驱uiso
  • WIN10系统更新文件在哪里
  • linux设置界面
  • Android:ValueAnimator的使用举例
  • Unity3D游戏开发(第2版)pdf
  • shell 循环 for
  • 深入浅出python中文第二版pdf
  • angularjs1.5
  • jquery 点击按钮
  • javascript详细介绍
  • js初级教程
  • jquery获取点击元素
  • js跨域的几种方法
  • js弹出框怎么写
  • 四川省网上税务局申报流程
  • 苏州税务实名认证流程小程序
  • 地税完税证明是什么样子
  • 我国国家宪法日是每年的十二月几日
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设