位置: IT常识 - 正文

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

编辑:rootadmin
基于随机森林的特征选择-降维-回归预测——附代码

目录

摘要:

1.随机森林:

2.随机森林的特征选取:

3.基于Matlab自带的随机森林函数进行特征选取具体步骤

(1)加载数据

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

(3)使用随机森林进行特征选择

(4)评价各个特征之间的相关性

(5)使用筛选后的特征进行测试

4.本文Matlab代码


摘要:

推荐整理分享基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于随机森林的气温预测论文,基于随机森林的气温预测论文,基于随机森林的收入预论文,基于随机森林的欺诈检测,基于随机森林的气温预测论文,基于随机森林的电影评分预测,基于随机森林的特征选择,基于随机森林的电影评分预测,内容如对您有帮助,希望把文章链接给更多的朋友!

演示如何通过Matlab自带的随机森林函数进行特征选择,筛选出大量特征数据中对于回归预测最重要的特征,并对各特征进行重要性排序,充分反应不同特征的重要性。演示如何在种植随机树林时为数据集选择适当的拆分预测变量选择技术。随机森林特征筛选一种特征选择技术,特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。

已写好输入输出结构,方便使用者通过替换自己的数据实现不同的功能,注释详细

适合数学建模等直接应用

1.随机森林:

随机森林算法(Random Forest,RF)是一种 新型机器学习算法,是利用多棵决策树对样本进行训练并集成预测的一种分类器,它采用Boot‐ strap重抽样技术从原始样本中随机抽取数据构 造多个样本,然后对每个重抽样样本采用节点的 随机分裂技术构造多棵决策树,最后将多棵决策树组合,并通过投票得出最终预测结果。

根据下列算法而建造每棵树 :

1.用N来表示训练用例(样本)的个数,M表示特征数目。

2.输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。

3.从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。

4.对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。

5.每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用)。

2.随机森林的特征选取:

随机森林算法利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,这一特点对于大量特征参与分类时非常适用,因为众多特征之间的高相关性会产生高维问题,会显著降低提取的精度。现阶段机器学习模型的特征空间往往庞大且复杂,呈现出高维性、非线性等复杂特点,面对这样的海量高维数据,剔除冗余特征进行特征筛选,已成为当今信息与科学技术面临的重要问题之一。实际上,特征选择正是从输入特征中优选了重要性高、信息量丰富的特征来提高地物信息提取的精度,在遥感应用中有着重要的应用潜力。

在特征重要性的基础上,特征选择的步骤如下:

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

1.计算每个特征的重要性,并按降序排序

2.确定要剔除的比例,依据特征重要性剔除相应比例的特征,得到一个新的特征集

3.用新的特征集重复上述过程,直到剩下m个特征(m为提前设定的值

4.根据上述过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集

3.基于Matlab自带的随机森林函数进行特征选取具体步骤(1)加载数据

加载Matlab自带的数据集。建立一个随机森林预测模型,该模型根据汽车的气缸数、发动机排量、马力、重量、加速度、车型年份和原产国来预测汽车的燃油经济性。使用Load函数进行数据的加载。

各单词解释:

【Cylinders,Displacement,Horsepower,Weight,Acceleration,Model_Year,Origin】

【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

使用templateTree和fitrensemble这两个函数建立随机森林,并先使用全部的特征进行车辆经济性进行预测。输入为【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】,输出为【车辆经济性】,随机森林中的决策树数量设置为100。训练模型并进行预测分析,具体结果如下,使用全部特征进行预测的准确度为87.1417.

(3)使用随机森林进行特征选择

根据第二点所述,利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,编写相关程序进行随机森林特征筛选,具体结果与各个特征变量的重要性情况如下所示:

(4)评价各个特征之间的相关性

当随机森林评价完成特征的重要性后,还需要对各个特征变量之间的相关性进行评估,以更加明显的看出何种特征最能影响预测结果,使用皮尔逊系数作为各个特征变量之间的相关性评价指标,从下图可以看出,越接近黄色表示相关性越强。

(5)使用筛选后的特征进行测试

综合之前所有特征的重要性与相关性的重要性评价情况,使用【重量,车辆年份】这两个特征进行回归预测,也就是从7个特征降维到2个特征。建立随机森林进行回归预测,其设置与之前的相同,同样使用100棵树。具体结果如下

可以看到,使用两个特征进行预测的准确度为85.2077,与使用所有特征进行预测的准确度相差不大,这表明随机森林特征选择方法有效的选择出了最重要的特征,实现了从大量特征到少数重要特征的特征降维筛选,极大的降低了特征的冗余性。

4.本文Matlab代码
本文链接地址:https://www.jiuchutong.com/zhishi/296057.html 转载请保留说明!

上一篇:vue-treeselect 的基本使用(vue treegrid)

下一篇:import在vue中使用(import vue from vue报错)

  • 华为耳机freebuds3怎么挂电话(华为耳机freebuds3功能键在哪)

    华为耳机freebuds3怎么挂电话(华为耳机freebuds3功能键在哪)

  • 在word中如何画线(在word中如何画图,并标注文字)

    在word中如何画线(在word中如何画图,并标注文字)

  • 快手注销后还能看到吗(快手注销后还能找回来吗)

    快手注销后还能看到吗(快手注销后还能找回来吗)

  • qq请勿打扰是什么意思(qq 请勿打扰)

    qq请勿打扰是什么意思(qq 请勿打扰)

  • 华为mate50pro什么时候上市(华为mate50pro什么价格)

    华为mate50pro什么时候上市(华为mate50pro什么价格)

  • 互删好友后聊天记录还可以查到吗(互删好友后聊天记录怎么查到)

    互删好友后聊天记录还可以查到吗(互删好友后聊天记录怎么查到)

  • 华为mate30悬浮窗口怎么设置(华为mate30悬浮窗口怎么关掉)

    华为mate30悬浮窗口怎么设置(华为mate30悬浮窗口怎么关掉)

  • 抖音右下角怎么有好友头像(抖音右下角怎么有好友头像怎么关掉)

    抖音右下角怎么有好友头像(抖音右下角怎么有好友头像怎么关掉)

  • 退款撤销后能再申请吗(撤销了退款还可以申请)

    退款撤销后能再申请吗(撤销了退款还可以申请)

  • 华为手机无线投屏怎么电视显示不出来(华为手机无线投屏怎么全屏)

    华为手机无线投屏怎么电视显示不出来(华为手机无线投屏怎么全屏)

  • 淘宝黑屏怎么回事啊(淘宝总黑屏)

    淘宝黑屏怎么回事啊(淘宝总黑屏)

  • rvl一al09是什么型号(rvl-al09是什么型号)

    rvl一al09是什么型号(rvl-al09是什么型号)

  • 华为手机来微信不响(华为手机来微信不显示在屏幕上怎么弄)

    华为手机来微信不响(华为手机来微信不显示在屏幕上怎么弄)

  • 苹果天气冷充不进去电(苹果天气冷充不上电)

    苹果天气冷充不进去电(苹果天气冷充不上电)

  • 计算机的特点主要有(计算机的特点主要是由什么确定的)

    计算机的特点主要有(计算机的特点主要是由什么确定的)

  • 微软1796是什么型号(1796是微软几代)

    微软1796是什么型号(1796是微软几代)

  • 手机两张卡怎么切换流量(手机两张卡怎么查看号码)

    手机两张卡怎么切换流量(手机两张卡怎么查看号码)

  • 抖音消息会显示已读吗(抖音消息会显示几点已读吗)

    抖音消息会显示已读吗(抖音消息会显示几点已读吗)

  • 手机vue字体怎么变大(vue字体怎么变颜色)

    手机vue字体怎么变大(vue字体怎么变颜色)

  • 数字音频输出同轴是什么意思(数字音频输出同轴接口)

    数字音频输出同轴是什么意思(数字音频输出同轴接口)

  • beoplay中文叫什么(beoplayer中文)

    beoplay中文叫什么(beoplayer中文)

  • 内存插在主板哪个槽(内存插在主板哪个位置)

    内存插在主板哪个槽(内存插在主板哪个位置)

  • 线下手机和线上手机有什么分别(线下手机和线上手机)

    线下手机和线上手机有什么分别(线下手机和线上手机)

  • 快手收货地址怎么改(快手收货地址怎么找)

    快手收货地址怎么改(快手收货地址怎么找)

  • 苹果xr怎么给软件加密码(苹果xr怎么给软件加密)

    苹果xr怎么给软件加密码(苹果xr怎么给软件加密)

  • 一级标题怎么设置(一级标题怎么设置字体)

    一级标题怎么设置(一级标题怎么设置字体)

  • 天猫美妆入驻条件(天猫美妆入驻条件及费用)

    天猫美妆入驻条件(天猫美妆入驻条件及费用)

  • mac如何做热点?mac创建wifi热点方法介绍(mac怎么创建热点)

    mac如何做热点?mac创建wifi热点方法介绍(mac怎么创建热点)

  • DenseNet代码复现+超详细注释(PyTorch)(densenet详解)

    DenseNet代码复现+超详细注释(PyTorch)(densenet详解)

  • 增值税税控系统技术维护费
  • 小规模纳税人企业所得税多少
  • 附加税有哪些?
  • 12366纳税服务平台官网
  • 企业增值税是什么科目
  • 外购商品发放给员工 进项税额能不能抵扣
  • 金税盘服务费怎么抵扣税
  • 企业出租房屋增值税发票怎么开
  • 农产品的收购价格
  • 月末进项税额转出科目需要结转吗
  • 中小企业员工出去创业的例子
  • 辞退员工补偿的月平均工资如何计算
  • 增值税年底如何计算
  • 现金解款单是什么业务
  • 抵债的货物按什么算增值税
  • 建筑业企业所得税2%
  • 劳务税在地税局开还是国税局
  • 小规模纳税人代理记账流程
  • 科技型中小企业怎么认定
  • 公司注销前怎么平账才不用交税
  • 小企业处置固定资产
  • 利润分配表会计分录
  • 建筑安装服务费可以抵扣进项税吗
  • 华为mate50耳机孔和充电口一样吗
  • 在线网速测试网站测速工具
  • 对数据文件操作,进行数据记录的交换都要经过
  • 出租其取得的不动产是什么意思
  • 内部退养如何缴纳个人所得税
  • 哪些可以作为原始凭证
  • 货物运输业增值税发票样本
  • php中session什么意思
  • 政府会计制度应付职工薪酬账务处理
  • 影视行业的会计好做吗
  • 增值税专用发票几个点
  • 借调人员怎么入账
  • 织梦如何添加浮动广告
  • 以前年度损益调整是什么意思
  • 外经证开错作废要带些什么
  • 个人独资企业计提的各种准备金支出不得扣除
  • 国税里货币资金怎么算
  • 清卡后还可以勾选发票吗
  • 清空表sql语句
  • 预交的城建税及附加税
  • 如何确认产品销售收入
  • 以前年度损益的科目代码
  • 预付卡销售成品油会计分录
  • 收到的承兑怎么转给别人
  • 装修公司让客户承担税费是否合理
  • 投资性房地产改造期间计提折旧吗
  • 生产企业电费怎么做账
  • 未交增值税科目怎么用
  • 村集体经济组织架构
  • 收到客户回款 应收账款减少还是增多
  • 采购折扣怎么结算
  • 企业发生装修费就计入长期待摊费用吗还是
  • 空调安装开发票
  • 生活垃圾处理费标准
  • 财务费用的科目编码是多少
  • 购进货物取得
  • 恢复网页浏览历史记录
  • windows7打游戏会卡怎么办
  • window10预览版
  • mac蓝牙怎么连接耳机
  • apache1.3.19配置文件
  • ubuntu系统怎么设置不锁屏
  • macbookair直接合上
  • linux的链接文件
  • javascript的常用数据类型
  • js时间比较大小的方法
  • [置顶]津鱼.我爱你
  • (转)Unity3D NGUI在UI上显示3D模型
  • javascript基础笔记
  • python冒泡排序流程图
  • python如何搭建环境
  • 开发区税务局咨询电话
  • 出口退税申报时间是每月15号吗
  • 非经营性房屋具体指哪些?
  • 宁波银行税务贷简介
  • 河北省电子税务局官网app
  • 电子税务网没开通怎么办
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设