位置: IT常识 - 正文

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

编辑:rootadmin
基于随机森林的特征选择-降维-回归预测——附代码

目录

摘要:

1.随机森林:

2.随机森林的特征选取:

3.基于Matlab自带的随机森林函数进行特征选取具体步骤

(1)加载数据

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

(3)使用随机森林进行特征选择

(4)评价各个特征之间的相关性

(5)使用筛选后的特征进行测试

4.本文Matlab代码


摘要:

推荐整理分享基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于随机森林的气温预测论文,基于随机森林的气温预测论文,基于随机森林的收入预论文,基于随机森林的欺诈检测,基于随机森林的气温预测论文,基于随机森林的电影评分预测,基于随机森林的特征选择,基于随机森林的电影评分预测,内容如对您有帮助,希望把文章链接给更多的朋友!

演示如何通过Matlab自带的随机森林函数进行特征选择,筛选出大量特征数据中对于回归预测最重要的特征,并对各特征进行重要性排序,充分反应不同特征的重要性。演示如何在种植随机树林时为数据集选择适当的拆分预测变量选择技术。随机森林特征筛选一种特征选择技术,特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。

已写好输入输出结构,方便使用者通过替换自己的数据实现不同的功能,注释详细

适合数学建模等直接应用

1.随机森林:

随机森林算法(Random Forest,RF)是一种 新型机器学习算法,是利用多棵决策树对样本进行训练并集成预测的一种分类器,它采用Boot‐ strap重抽样技术从原始样本中随机抽取数据构 造多个样本,然后对每个重抽样样本采用节点的 随机分裂技术构造多棵决策树,最后将多棵决策树组合,并通过投票得出最终预测结果。

根据下列算法而建造每棵树 :

1.用N来表示训练用例(样本)的个数,M表示特征数目。

2.输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。

3.从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。

4.对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。

5.每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用)。

2.随机森林的特征选取:

随机森林算法利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,这一特点对于大量特征参与分类时非常适用,因为众多特征之间的高相关性会产生高维问题,会显著降低提取的精度。现阶段机器学习模型的特征空间往往庞大且复杂,呈现出高维性、非线性等复杂特点,面对这样的海量高维数据,剔除冗余特征进行特征筛选,已成为当今信息与科学技术面临的重要问题之一。实际上,特征选择正是从输入特征中优选了重要性高、信息量丰富的特征来提高地物信息提取的精度,在遥感应用中有着重要的应用潜力。

在特征重要性的基础上,特征选择的步骤如下:

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

1.计算每个特征的重要性,并按降序排序

2.确定要剔除的比例,依据特征重要性剔除相应比例的特征,得到一个新的特征集

3.用新的特征集重复上述过程,直到剩下m个特征(m为提前设定的值

4.根据上述过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集

3.基于Matlab自带的随机森林函数进行特征选取具体步骤(1)加载数据

加载Matlab自带的数据集。建立一个随机森林预测模型,该模型根据汽车的气缸数、发动机排量、马力、重量、加速度、车型年份和原产国来预测汽车的燃油经济性。使用Load函数进行数据的加载。

各单词解释:

【Cylinders,Displacement,Horsepower,Weight,Acceleration,Model_Year,Origin】

【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

使用templateTree和fitrensemble这两个函数建立随机森林,并先使用全部的特征进行车辆经济性进行预测。输入为【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】,输出为【车辆经济性】,随机森林中的决策树数量设置为100。训练模型并进行预测分析,具体结果如下,使用全部特征进行预测的准确度为87.1417.

(3)使用随机森林进行特征选择

根据第二点所述,利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,编写相关程序进行随机森林特征筛选,具体结果与各个特征变量的重要性情况如下所示:

(4)评价各个特征之间的相关性

当随机森林评价完成特征的重要性后,还需要对各个特征变量之间的相关性进行评估,以更加明显的看出何种特征最能影响预测结果,使用皮尔逊系数作为各个特征变量之间的相关性评价指标,从下图可以看出,越接近黄色表示相关性越强。

(5)使用筛选后的特征进行测试

综合之前所有特征的重要性与相关性的重要性评价情况,使用【重量,车辆年份】这两个特征进行回归预测,也就是从7个特征降维到2个特征。建立随机森林进行回归预测,其设置与之前的相同,同样使用100棵树。具体结果如下

可以看到,使用两个特征进行预测的准确度为85.2077,与使用所有特征进行预测的准确度相差不大,这表明随机森林特征选择方法有效的选择出了最重要的特征,实现了从大量特征到少数重要特征的特征降维筛选,极大的降低了特征的冗余性。

4.本文Matlab代码
本文链接地址:https://www.jiuchutong.com/zhishi/296057.html 转载请保留说明!

上一篇:vue-treeselect 的基本使用(vue treegrid)

下一篇:import在vue中使用(import vue from vue报错)

  • 戴尔笔记本的引导方式和分区表是什么(戴尔笔记本引导设置)

    戴尔笔记本的引导方式和分区表是什么(戴尔笔记本引导设置)

  • 米家石英表怎么调时间(米家石英表怎么强制解绑换手机)

    米家石英表怎么调时间(米家石英表怎么强制解绑换手机)

  • vivox70pro+怎么关闭自动更新(vivox70pro+怎么关电视)

    vivox70pro+怎么关闭自动更新(vivox70pro+怎么关电视)

  • 苹果8怎么清理缓存和垃圾清理(苹果8怎么清理手机空间)

    苹果8怎么清理缓存和垃圾清理(苹果8怎么清理手机空间)

  • 户外蓝牙音箱和蓝牙耳机能同时使用吗(户外用好音质蓝牙音箱)

    户外蓝牙音箱和蓝牙耳机能同时使用吗(户外用好音质蓝牙音箱)

  • word右上标怎么打(word右角标上角标)

    word右上标怎么打(word右角标上角标)

  • 水星路由器恢复出厂设置后怎么办(水星路由器恢复出厂设置后怎么设置密码)

    水星路由器恢复出厂设置后怎么办(水星路由器恢复出厂设置后怎么设置密码)

  • 删去的照片在手机哪里能找回(已删除的相片在手机哪个文件夹里)

    删去的照片在手机哪里能找回(已删除的相片在手机哪个文件夹里)

  • ev录屏声音太小怎么办(ev录屏音量小)

    ev录屏声音太小怎么办(ev录屏音量小)

  • 苹果手机可以插u盘吗(苹果手机可以插电信卡吗)

    苹果手机可以插u盘吗(苹果手机可以插电信卡吗)

  • 抖音不够1000粉丝怎么开橱窗(抖音不够1000粉丝可以挂小黄车)

    抖音不够1000粉丝怎么开橱窗(抖音不够1000粉丝可以挂小黄车)

  • 手机卡槽按不进去原因(手机卡槽弄不开)

    手机卡槽按不进去原因(手机卡槽弄不开)

  • ipad没贴膜直接用笔会刮花吗(ipad不贴膜会划坏吗)

    ipad没贴膜直接用笔会刮花吗(ipad不贴膜会划坏吗)

  • 手机可以拍照但存不了(手机可以拍照但不能录视频)

    手机可以拍照但存不了(手机可以拍照但不能录视频)

  • 淘宝朋友代付退货钱退在哪里(淘宝朋友代付退款到哪里去)

    淘宝朋友代付退货钱退在哪里(淘宝朋友代付退款到哪里去)

  • 为什么ipad微信朋友圈不能发视频(为什么ipad微信朋友圈发不了视频)

    为什么ipad微信朋友圈不能发视频(为什么ipad微信朋友圈发不了视频)

  • 路由器上光信号闪红灯是什么意思(路由器上光信号不亮是怎么回事)

    路由器上光信号闪红灯是什么意思(路由器上光信号不亮是怎么回事)

  • 哔哩哔哩支持什么格式(哔哩哔哩支持什么投影仪)

    哔哩哔哩支持什么格式(哔哩哔哩支持什么投影仪)

  • 微信视频会议可以多少人参加(微信视频会议可以不开摄像头吗)

    微信视频会议可以多少人参加(微信视频会议可以不开摄像头吗)

  • 小米18w充电头支持pd协议吗(小米18w充电头支持qc协议吗?)

    小米18w充电头支持pd协议吗(小米18w充电头支持qc协议吗?)

  • 金立s10c怎么关闭锁屏壁纸(金立手机关闭)

    金立s10c怎么关闭锁屏壁纸(金立手机关闭)

  • 小米8怎么增强网络信号(小米8怎么增强信号)

    小米8怎么增强网络信号(小米8怎么增强信号)

  • 苹果系统48个g怎么清理(苹果手机系统50个g)

    苹果系统48个g怎么清理(苹果手机系统50个g)

  • 哪个视频播放器好?(哪个视频播放器最好)

    哪个视频播放器好?(哪个视频播放器最好)

  • 关联qq没有消息提醒(关联qq有消息但登录没看到)

    关联qq没有消息提醒(关联qq有消息但登录没看到)

  • airpods防水吗(airpods防水吗耳机掉水里了)

    airpods防水吗(airpods防水吗耳机掉水里了)

  • cad图怎么导入PS中(CAD图怎么导入ps图片不清晰)

    cad图怎么导入PS中(CAD图怎么导入ps图片不清晰)

  • Uncaught TypeError TypeError: Cannot set properties of null (setting ‘onclick‘)的解决办法

    Uncaught TypeError TypeError: Cannot set properties of null (setting ‘onclick‘)的解决办法

  • Servlet工作原理(servlet工作原理和生命周期)

    Servlet工作原理(servlet工作原理和生命周期)

  • 保险公司支付的赔款计入什么科目
  • 我可以通过什么知道明天的天气情况
  • 印花税计提时应入什么科目
  • 城镇垃圾处理费的计税依据
  • 销项税额计算公式依据
  • 技术服务收入属于劳务报酬所得吗
  • 征地补偿费谁来支付
  • 统一企业员工
  • 开票加收税点会减少吗
  • 哪些发票能做公章
  • 什么合同不需要做结算
  • 房地产开发企业预缴增值税
  • 通信费税前列支的标准和报销票据的要求
  • 记账凭证上的摘要每行都要写吗
  • 营改增后销售不动产的收入
  • 广告费怎么入账
  • 企业所得税跨期费用的相关规定
  • 物业公司需要向哪个部门缴费
  • 返利回收期怎么计算
  • 非独立核算的分公司是法人主体吗
  • 跨年度取得增值税发票能否抵扣?
  • 一张报关单可以分批退税吗
  • 逃税漏税不用坐牢吗
  • 0申报逾期罚款
  • 工资计提不发放工资个税
  • 中药饮片加成率超的原因
  • 1697507802
  • 增值税减免税明细表
  • 现金清查制度的内容包括
  • 新会计准则下的会计科目
  • 长期股权投资核算的成本法与权益法的主要差别有哪些
  • 苹果双系统不小心删了苹果系统
  • 周转材料月末有余额吗
  • 上市公司的股份可以转卖吗
  • 多收不用退的货物怎么办
  • 递延所得税当期要交吗
  • js map foreach遍历
  • 二手房交易土增税文件
  • 行政事业性收费目录
  • 今天端午节是几月几号啊
  • 外商投资企业 外资企业
  • 存货跌价准备的转销会计分录
  • 自制半成品属于原材料还是库存商品
  • pnmdp
  • 数据安全数据目录
  • 专票电话号码不对有影响吗
  • 红字发票抵扣联要装订到凭证里吗
  • 一件代发退货如何处理
  • 个人所得税大病医疗夫妻双方怎么扣除
  • 银行询证函快递费计入什么科目
  • 待抵扣进项税额什么意思
  • 发行公司债券发生的折价
  • 信用减值损失属于公允价值变动收益吗
  • 生产成本结转分录是什么
  • 安防工程注意事项有哪些
  • 公司注销实收资本账务处理
  • 库存商品过期了还能用吗
  • 委托出口由谁办理退税
  • 信用卡逾期滞纳金怎么收取
  • 单式记账法因为其简单易学,记账效率高
  • 公司收入和开支比例
  • 公司装修费用如何计算
  • 现金付给对方没写收据怎么办
  • 开发票的时候密码超出密码区发票还能用吗?
  • 修缮服务指什么
  • 营改增之后还有营业税金及附加吗
  • win7 光盘
  • 影响电脑速度的因素
  • 如何使用朋友的山姆卡
  • win7系统计算机管理在哪里
  • 正版win10怎么用
  • opengl入门教程(精)
  • ubuntu重新安装网卡驱动
  • shell脚本检测文件是否存在
  • python怎么爬
  • 用原生js实现过什么功能
  • javascript面向对象吗
  • 那些so 叼的android studio 插件
  • 出口增加为什么汇率会增加
  • 税务局与税务所工资哪个高
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设