位置: IT常识 - 正文

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

编辑:rootadmin
基于随机森林的特征选择-降维-回归预测——附代码

目录

摘要:

1.随机森林:

2.随机森林的特征选取:

3.基于Matlab自带的随机森林函数进行特征选取具体步骤

(1)加载数据

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

(3)使用随机森林进行特征选择

(4)评价各个特征之间的相关性

(5)使用筛选后的特征进行测试

4.本文Matlab代码


摘要:

推荐整理分享基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于随机森林的气温预测论文,基于随机森林的气温预测论文,基于随机森林的收入预论文,基于随机森林的欺诈检测,基于随机森林的气温预测论文,基于随机森林的电影评分预测,基于随机森林的特征选择,基于随机森林的电影评分预测,内容如对您有帮助,希望把文章链接给更多的朋友!

演示如何通过Matlab自带的随机森林函数进行特征选择,筛选出大量特征数据中对于回归预测最重要的特征,并对各特征进行重要性排序,充分反应不同特征的重要性。演示如何在种植随机树林时为数据集选择适当的拆分预测变量选择技术。随机森林特征筛选一种特征选择技术,特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。

已写好输入输出结构,方便使用者通过替换自己的数据实现不同的功能,注释详细

适合数学建模等直接应用

1.随机森林:

随机森林算法(Random Forest,RF)是一种 新型机器学习算法,是利用多棵决策树对样本进行训练并集成预测的一种分类器,它采用Boot‐ strap重抽样技术从原始样本中随机抽取数据构 造多个样本,然后对每个重抽样样本采用节点的 随机分裂技术构造多棵决策树,最后将多棵决策树组合,并通过投票得出最终预测结果。

根据下列算法而建造每棵树 :

1.用N来表示训练用例(样本)的个数,M表示特征数目。

2.输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。

3.从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。

4.对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。

5.每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用)。

2.随机森林的特征选取:

随机森林算法利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,这一特点对于大量特征参与分类时非常适用,因为众多特征之间的高相关性会产生高维问题,会显著降低提取的精度。现阶段机器学习模型的特征空间往往庞大且复杂,呈现出高维性、非线性等复杂特点,面对这样的海量高维数据,剔除冗余特征进行特征筛选,已成为当今信息与科学技术面临的重要问题之一。实际上,特征选择正是从输入特征中优选了重要性高、信息量丰富的特征来提高地物信息提取的精度,在遥感应用中有着重要的应用潜力。

在特征重要性的基础上,特征选择的步骤如下:

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

1.计算每个特征的重要性,并按降序排序

2.确定要剔除的比例,依据特征重要性剔除相应比例的特征,得到一个新的特征集

3.用新的特征集重复上述过程,直到剩下m个特征(m为提前设定的值

4.根据上述过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集

3.基于Matlab自带的随机森林函数进行特征选取具体步骤(1)加载数据

加载Matlab自带的数据集。建立一个随机森林预测模型,该模型根据汽车的气缸数、发动机排量、马力、重量、加速度、车型年份和原产国来预测汽车的燃油经济性。使用Load函数进行数据的加载。

各单词解释:

【Cylinders,Displacement,Horsepower,Weight,Acceleration,Model_Year,Origin】

【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

使用templateTree和fitrensemble这两个函数建立随机森林,并先使用全部的特征进行车辆经济性进行预测。输入为【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】,输出为【车辆经济性】,随机森林中的决策树数量设置为100。训练模型并进行预测分析,具体结果如下,使用全部特征进行预测的准确度为87.1417.

(3)使用随机森林进行特征选择

根据第二点所述,利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,编写相关程序进行随机森林特征筛选,具体结果与各个特征变量的重要性情况如下所示:

(4)评价各个特征之间的相关性

当随机森林评价完成特征的重要性后,还需要对各个特征变量之间的相关性进行评估,以更加明显的看出何种特征最能影响预测结果,使用皮尔逊系数作为各个特征变量之间的相关性评价指标,从下图可以看出,越接近黄色表示相关性越强。

(5)使用筛选后的特征进行测试

综合之前所有特征的重要性与相关性的重要性评价情况,使用【重量,车辆年份】这两个特征进行回归预测,也就是从7个特征降维到2个特征。建立随机森林进行回归预测,其设置与之前的相同,同样使用100棵树。具体结果如下

可以看到,使用两个特征进行预测的准确度为85.2077,与使用所有特征进行预测的准确度相差不大,这表明随机森林特征选择方法有效的选择出了最重要的特征,实现了从大量特征到少数重要特征的特征降维筛选,极大的降低了特征的冗余性。

4.本文Matlab代码
本文链接地址:https://www.jiuchutong.com/zhishi/296057.html 转载请保留说明!

上一篇:vue-treeselect 的基本使用(vue treegrid)

下一篇:import在vue中使用(import vue from vue报错)

  • 荣耀x20se不支持语音唤醒吗(荣耀x20se不支持语音唤醒的解决方法)

    荣耀x20se不支持语音唤醒吗(荣耀x20se不支持语音唤醒的解决方法)

  • 脉脉怎么注销(脉脉怎么注销手机号码)

    脉脉怎么注销(脉脉怎么注销手机号码)

  • iphone11怎么关闭应用程序(iphone11怎么关闭非原装电池通知)

    iphone11怎么关闭应用程序(iphone11怎么关闭非原装电池通知)

  • 华为nova7如何取消抬起亮屏(华为nova7如何取消锁屏壁纸图片)

    华为nova7如何取消抬起亮屏(华为nova7如何取消锁屏壁纸图片)

  • 笔记本电脑插u盘没有反应(笔记本电脑插U盘不显示)

    笔记本电脑插u盘没有反应(笔记本电脑插U盘不显示)

  • b站怎么删除自己的视频(b站怎么删除自己发的评论)

    b站怎么删除自己的视频(b站怎么删除自己发的评论)

  • 11截图快捷键(11截图快捷键电脑那三个键)

    11截图快捷键(11截图快捷键电脑那三个键)

  • 华为mate30双击放大怎么关闭(华为mate30如何关闭双击放大功能)

    华为mate30双击放大怎么关闭(华为mate30如何关闭双击放大功能)

  • win10试用版能一直用吗(win10试用版和正式版的区别)

    win10试用版能一直用吗(win10试用版和正式版的区别)

  • 7p支持ios13吗(苹果7p可以用ios14吗)

    7p支持ios13吗(苹果7p可以用ios14吗)

  • 二级标题要加句号吗(二级标题要加逗号吗)

    二级标题要加句号吗(二级标题要加逗号吗)

  • i5 3470配什么主板(i5 3470配什么主板性价比)

    i5 3470配什么主板(i5 3470配什么主板性价比)

  • 微信聊天记录别人能查到吗(微信聊天记录别人可以调取吗)

    微信聊天记录别人能查到吗(微信聊天记录别人可以调取吗)

  • vivo手机上面出现个HD是怎么回事(Vivo手机上面出现上下)

    vivo手机上面出现个HD是怎么回事(Vivo手机上面出现上下)

  • 开省电模式充电会慢吗(开省电模式充电快还是正常充电快)

    开省电模式充电会慢吗(开省电模式充电快还是正常充电快)

  • 华为kntal10什么型号(华为KNTAL10什么时间上市的)

    华为kntal10什么型号(华为KNTAL10什么时间上市的)

  • 华为手机闪退怎么回事(华为手机闪退怎么恢复正常)

    华为手机闪退怎么回事(华为手机闪退怎么恢复正常)

  • 抖音点不了赞心怎么办(抖音点赞赞不了怎么办)

    抖音点不了赞心怎么办(抖音点赞赞不了怎么办)

  • log设置是什么意思(log设置打开好吗)

    log设置是什么意思(log设置打开好吗)

  • 小天才电话手表y05功能(小天才电话手表怎么添加联系人)

    小天才电话手表y05功能(小天才电话手表怎么添加联系人)

  • 支付宝如何查询一年消费(支付宝如何查询社保缴费情况)

    支付宝如何查询一年消费(支付宝如何查询社保缴费情况)

  • 蓝牙传的歌曲在手机哪(蓝牙传输的歌曲在哪个文件夹)

    蓝牙传的歌曲在手机哪(蓝牙传输的歌曲在哪个文件夹)

  • 如何更改iPhone的名称(如何更改iPhone的热点名称)

    如何更改iPhone的名称(如何更改iPhone的热点名称)

  • 美图秀秀怎么发文章(美图秀秀怎么发布自己的配方)

    美图秀秀怎么发文章(美图秀秀怎么发布自己的配方)

  • 手机关机微信运动还记步数吗(手机关机微信运动计步吗)

    手机关机微信运动还记步数吗(手机关机微信运动计步吗)

  • 帝国cms怎么多条件搜索(帝国cms界面)

    帝国cms怎么多条件搜索(帝国cms界面)

  • 帝国cms如何做移动端适配(帝国cms视频教程)

    帝国cms如何做移动端适配(帝国cms视频教程)

  • 增值税发票超过3个月可以作废吗
  • 建筑业增值税税负预警
  • 固定资产计提折旧计入什么科目
  • 办公费税前扣除标准2023
  • 合伙企业当年盈亏怎么算
  • 小金额收据入账后需要汇算清缴吗
  • 母公司给子公司开票会有税务风险吗
  • 增值税一般纳税人是什么意思
  • 专用基金计入什么科目
  • 债务重组的会计处理方法
  • 增值税的核算方式
  • 小规模纳税人季报还是月报?
  • 以汽车出资
  • 资产减值准备怎么转回
  • 债务重组是什么意思?
  • 无形资产出租后还要摊销吗
  • 查税是按基本账户吗
  • 公司车辆过户给公司
  • 为什么增值税普通发票不能抵扣
  • 自用房屋的房产税怎么缴纳
  • 成本费用怎么做分录
  • 事业单位购买固定资产费自行
  • 固定资产报废账目
  • 处置固定资产损失的账务处理
  • 固定资产管理的论文
  • 管理费用劳务费包括什么
  • 库存商品换货的会计分录
  • 怎么恢复系统win10
  • 公司罚款怎么写
  • 一般纳税人如何计算企业所得税
  • win7的本地连接在哪
  • 集团内部调拨账务处理
  • 增值税发票红冲后税款怎么办
  • 继承房产印花税是按交易分额交吗
  • 人力资源规划系统包括哪些主要内容
  • 企业所得税的征税范围是什么
  • vue笔记项目
  • javafiles
  • pytorch jit
  • 命令who的含义
  • 从银行提取现金50000元备发工资
  • 转让使用过的固定资产增值税
  • 应收账款出售给银行账务处理
  • 如何理解符合立案标准的,行政机关应当及时立案
  • 延迟开票如何规避风险
  • mysql 测试
  • dedecms插件
  • 进口消费税应该记到什么科目
  • 资产处置损益的定义
  • 企业收据的相关法律规定
  • 营业执照作废声明
  • 研发费用加计扣除的条件
  • 餐饮会计内账怎么记账
  • 失控发票进项税额结转成本
  • 跨月的普通发票怎么开红字发票
  • 装修费应该按几折算
  • 开业赠送礼品会计属于什么费用
  • 装修费用税法规定有哪些
  • sql server分页查询sql语句
  • 快速插入大量数据的asp.net代码(Sqlserver)
  • ipv6文件
  • macbook appstore在哪
  • freebsd挂载ntfs
  • windows10预览版是什么
  • 苹果电脑安装了双系统怎么恢复苹果系统
  • win10假死的原因
  • cpu资源占用率计算原理
  • echarts怎么用
  • 下列有关javascript中call和apply
  • bat ping批处理
  • Node.js中的construct构造函数
  • jquery滚动条滚动到指定位置
  • 完美世界打斗
  • JavaScript中的数据类型
  • js继承的概念
  • python中运算符重载方法
  • jQuery Tags Input Plugin(添加/删除标签插件)详解
  • 善意取得的条件和效力
  • 住房货币化什么意思
  • 出口退税申报时间是每月15号吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设