位置: IT常识 - 正文

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

编辑:rootadmin
基于随机森林的特征选择-降维-回归预测——附代码

目录

摘要:

1.随机森林:

2.随机森林的特征选取:

3.基于Matlab自带的随机森林函数进行特征选取具体步骤

(1)加载数据

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

(3)使用随机森林进行特征选择

(4)评价各个特征之间的相关性

(5)使用筛选后的特征进行测试

4.本文Matlab代码


摘要:

推荐整理分享基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于随机森林的气温预测论文,基于随机森林的气温预测论文,基于随机森林的收入预论文,基于随机森林的欺诈检测,基于随机森林的气温预测论文,基于随机森林的电影评分预测,基于随机森林的特征选择,基于随机森林的电影评分预测,内容如对您有帮助,希望把文章链接给更多的朋友!

演示如何通过Matlab自带的随机森林函数进行特征选择,筛选出大量特征数据中对于回归预测最重要的特征,并对各特征进行重要性排序,充分反应不同特征的重要性。演示如何在种植随机树林时为数据集选择适当的拆分预测变量选择技术。随机森林特征筛选一种特征选择技术,特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。

已写好输入输出结构,方便使用者通过替换自己的数据实现不同的功能,注释详细

适合数学建模等直接应用

1.随机森林:

随机森林算法(Random Forest,RF)是一种 新型机器学习算法,是利用多棵决策树对样本进行训练并集成预测的一种分类器,它采用Boot‐ strap重抽样技术从原始样本中随机抽取数据构 造多个样本,然后对每个重抽样样本采用节点的 随机分裂技术构造多棵决策树,最后将多棵决策树组合,并通过投票得出最终预测结果。

根据下列算法而建造每棵树 :

1.用N来表示训练用例(样本)的个数,M表示特征数目。

2.输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。

3.从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。

4.对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。

5.每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用)。

2.随机森林的特征选取:

随机森林算法利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,这一特点对于大量特征参与分类时非常适用,因为众多特征之间的高相关性会产生高维问题,会显著降低提取的精度。现阶段机器学习模型的特征空间往往庞大且复杂,呈现出高维性、非线性等复杂特点,面对这样的海量高维数据,剔除冗余特征进行特征筛选,已成为当今信息与科学技术面临的重要问题之一。实际上,特征选择正是从输入特征中优选了重要性高、信息量丰富的特征来提高地物信息提取的精度,在遥感应用中有着重要的应用潜力。

在特征重要性的基础上,特征选择的步骤如下:

基于随机森林的特征选择-降维-回归预测——附代码(基于随机森林的气温预测)

1.计算每个特征的重要性,并按降序排序

2.确定要剔除的比例,依据特征重要性剔除相应比例的特征,得到一个新的特征集

3.用新的特征集重复上述过程,直到剩下m个特征(m为提前设定的值

4.根据上述过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集

3.基于Matlab自带的随机森林函数进行特征选取具体步骤(1)加载数据

加载Matlab自带的数据集。建立一个随机森林预测模型,该模型根据汽车的气缸数、发动机排量、马力、重量、加速度、车型年份和原产国来预测汽车的燃油经济性。使用Load函数进行数据的加载。

各单词解释:

【Cylinders,Displacement,Horsepower,Weight,Acceleration,Model_Year,Origin】

【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】

(2)首先建立随机森林并使用全部特征进行车辆经济性预测

使用templateTree和fitrensemble这两个函数建立随机森林,并先使用全部的特征进行车辆经济性进行预测。输入为【气缸数目,排量,马力,重量,加速度,车辆年份,原产地】,输出为【车辆经济性】,随机森林中的决策树数量设置为100。训练模型并进行预测分析,具体结果如下,使用全部特征进行预测的准确度为87.1417.

(3)使用随机森林进行特征选择

根据第二点所述,利用 OOB 误差计算特征变量相对重要性,并对特征变量进行排序和筛选,编写相关程序进行随机森林特征筛选,具体结果与各个特征变量的重要性情况如下所示:

(4)评价各个特征之间的相关性

当随机森林评价完成特征的重要性后,还需要对各个特征变量之间的相关性进行评估,以更加明显的看出何种特征最能影响预测结果,使用皮尔逊系数作为各个特征变量之间的相关性评价指标,从下图可以看出,越接近黄色表示相关性越强。

(5)使用筛选后的特征进行测试

综合之前所有特征的重要性与相关性的重要性评价情况,使用【重量,车辆年份】这两个特征进行回归预测,也就是从7个特征降维到2个特征。建立随机森林进行回归预测,其设置与之前的相同,同样使用100棵树。具体结果如下

可以看到,使用两个特征进行预测的准确度为85.2077,与使用所有特征进行预测的准确度相差不大,这表明随机森林特征选择方法有效的选择出了最重要的特征,实现了从大量特征到少数重要特征的特征降维筛选,极大的降低了特征的冗余性。

4.本文Matlab代码
本文链接地址:https://www.jiuchutong.com/zhishi/296057.html 转载请保留说明!

上一篇:vue-treeselect 的基本使用(vue treegrid)

下一篇:import在vue中使用(import vue from vue报错)

  • 苹果13pro怎么关闭来电闪光灯(苹果13pro怎么关机重启)

    苹果13pro怎么关闭来电闪光灯(苹果13pro怎么关机重启)

  • 云班课怎么上传文件(云班课怎么上传文件夹)

    云班课怎么上传文件(云班课怎么上传文件夹)

  • 苹果手机3dtouch称重的设置方法(苹果手机3dtouch电子秤)

    苹果手机3dtouch称重的设置方法(苹果手机3dtouch电子秤)

  • 小米8支持人脸支付吗(小米支持人脸支付吗)

    小米8支持人脸支付吗(小米支持人脸支付吗)

  • 卖家线下换新什么意思(线下换货)

    卖家线下换新什么意思(线下换货)

  • 优酷vip到期缓存怎么看(优酷vip到期缓存还能看吗)

    优酷vip到期缓存怎么看(优酷vip到期缓存还能看吗)

  • 爱思助手会损害手机吗(爱思助手会不会对手机有影响)

    爱思助手会损害手机吗(爱思助手会不会对手机有影响)

  • 电动车锂电池泡水了还能用吗(电动车锂电池泡水后还能用吗)

    电动车锂电池泡水了还能用吗(电动车锂电池泡水后还能用吗)

  • 乘车码必须开通免密支付吗(开通了乘车码不用会收费吗)

    乘车码必须开通免密支付吗(开通了乘车码不用会收费吗)

  • vivo手机怎么把微信变成黑色(vivo手机怎么把通讯录移到卡里)

    vivo手机怎么把微信变成黑色(vivo手机怎么把通讯录移到卡里)

  • 手机屏幕与机身分离还可以修复吗(手机屏幕与机身分离可以充电吗)

    手机屏幕与机身分离还可以修复吗(手机屏幕与机身分离可以充电吗)

  • 计算机的内存储器一般是指(计算机的内存储蓄比外存储蓄)

    计算机的内存储器一般是指(计算机的内存储蓄比外存储蓄)

  • 腾讯视频查看历史弹幕(腾讯视频查看历史弹幕手机版)

    腾讯视频查看历史弹幕(腾讯视频查看历史弹幕手机版)

  • ipad下载hd版什么意思(ipad下hd版要钱吗)

    ipad下载hd版什么意思(ipad下hd版要钱吗)

  • iPhone7用pd充电器会坏吗(iphone7p可以用pd充电器吗)

    iPhone7用pd充电器会坏吗(iphone7p可以用pd充电器吗)

  • iphonex是第几代苹果(iPhonex是第几代苹果手机)

    iphonex是第几代苹果(iPhonex是第几代苹果手机)

  • 超级会员后边x3是什么(超级会员和会员会不会叠加)

    超级会员后边x3是什么(超级会员和会员会不会叠加)

  • 华为手机接电话黑屏怎么回事(华为手机接电话时有电话打进来怎么设置)

    华为手机接电话黑屏怎么回事(华为手机接电话时有电话打进来怎么设置)

  • iphone7怎么拍夜景(iPhone7怎么拍夜景)

    iphone7怎么拍夜景(iPhone7怎么拍夜景)

  • 智慧咸阳公众号如何关注(咸阳智监云平台)

    智慧咸阳公众号如何关注(咸阳智监云平台)

  • oppoa9怎么关闭运行程序(oppoa11x怎么关闭运行)

    oppoa9怎么关闭运行程序(oppoa11x怎么关闭运行)

  • 华为9.0.1怎么恢复旧版本(华为怎么恢复9.0系统)

    华为9.0.1怎么恢复旧版本(华为怎么恢复9.0系统)

  • wifi重新设置密码(wifi重新设置密码后电脑没有网络)

    wifi重新设置密码(wifi重新设置密码后电脑没有网络)

  • 如何开发点餐app(点餐系统小程序开发流程)

    如何开发点餐app(点餐系统小程序开发流程)

  • 小米9如何省电(小米9省电设置方法)

    小米9如何省电(小米9省电设置方法)

  • 蒙特利尔的乌林鸮,加拿大 (© rollandgelly/Getty Images)(蒙特利尔 攻略)

    蒙特利尔的乌林鸮,加拿大 (© rollandgelly/Getty Images)(蒙特利尔 攻略)

  • 土地原值要计入房产税计税@基数吗
  • 增值税进项税额加计抵减会计处理
  • 23年车辆购置税税率
  • 捐赠劳务支出可在企业所得税前扣除吗
  • 超过认证期的发票能用吗
  • 运输公司的车辆保险费计入什么科目
  • 关联方交易金额太大有什么后果
  • 一般计税预缴增值税3%怎么办
  • 工程物资什么时候结转到开发成本里面
  • 金税开票系统怎么导出发票明细
  • 劳务公司涉及的税收
  • 理财产品产生的利息怎么入账
  • 建筑行业异地工资怎么算
  • 税款状态已缴款未入库
  • 交以前年度所得税怎么算
  • 未计提企业所得税怎么写分录
  • 资产的名义已使用年限与实际已使用年限的区别与联系
  • 进项票超过180天还可以认证吗
  • 增值税没有按时缴纳会影响开票吗
  • 已抵扣的增值税怎么做账
  • 小规模纳税人计提增值税账务处理
  • 小规模纳税人自来水税率
  • 固定健身器械使用方法
  • 亏损企业能否享受失业金
  • 调整上年少计提税金及附加
  • 企业所得税中的资产总额怎么填
  • 工会经费什么时候申报缴纳
  • windows 发布时间
  • 最终控制方合并报表账面价值
  • win10 21h1激活密钥
  • 清理c盘清理
  • php教程100
  • wordpresswiki
  • Mother cheetah and her cub in the Maasai Mara nature reserve, Kenya (© gudkovandrey/Adobe Stock)
  • 如何利用口诀记单词
  • 代扣手续费是啥意思
  • 高新技术企业的申报条件包括以下哪些
  • 阿圭罗来自哪里
  • springmvc执行流程简单
  • HTML常用的表单控件有哪些
  • split 文件分割
  • 销售部门招待费用预算
  • 什么叫呆账账户
  • php注册功能
  • python中的split函数
  • 车辆购置税能否融资租赁
  • 用人单位性质怎么填
  • 一般纳税人增值税优惠政策2023
  • 加工费发票可以抵扣吗
  • 开发票没有银行回单可以入帐吗?
  • 收到社保局的生育津贴并付给职工如何入账
  • 对外贸易出口公司
  • 其他应收款的二级科目
  • 进项发票认证多了留抵多久
  • 消防劳保
  • 购买税盘全额抵扣会计分录
  • 企业预提费用是什么科目
  • sql server查询指定内容
  • win81蓝屏重启故障
  • win10小娜语音激活
  • Win10虚拟内存怎么转移
  • linux内核模块命令
  • linux命令csdn
  • unity读取文本文件
  • nodejs客户端框架
  • js设计原则
  • shell编程的特点
  • unity c#开发
  • jquery常见问题
  • jquery控制样式
  • Python中字符串的索引
  • python命令行在哪
  • 福建省国税局
  • 环保税征收标准可以改吗
  • 广东税务局账号登录
  • 下载重庆税务官方app
  • 深圳市国家税务局网站
  • 拟录用和录用的区别在哪
  • 威海行风热线实时收听
  • 滨州市望海花园北侧规划
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设