位置: 编程技术 - 正文

Python scikit-learn 做线性回归的示例代码

编辑:rootadmin

推荐整理分享Python scikit-learn 做线性回归的示例代码,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

一、概述

机器学习算法在近几年大数据点燃的热火熏陶下已经变得被人所“熟知”,就算不懂得其中各算法理论,叫你喊上一两个著名算法的名字,你也能昂首挺胸脱口而出。当然了,算法之林虽大,但能者还是有限,能适应某些环境并取得较好效果的算法会脱颖而出,而表现平平者则被历史所淡忘。随着机器学习社区的发展和实践验证,这群脱颖而出者也逐渐被人所认可和青睐,同时获得了更多社区力量的支持、改进和推广。

以最广泛的分类算法为例,大致可以分为线性和非线性两大派别。线性算法有著名的逻辑回归、朴素贝叶斯、最大熵等,非线性算法有随机森林、决策树、神经网络、核机器等等。线性算法举的大旗是训练和预测的效率比较高,但最终效果对特征的依赖程度较高,需要数据在特征层面上是线性可分的。因此,使用线性算法需要在特征工程上下不少功夫,尽量对特征进行选择、变换或者组合等使得特征具有区分性。而非线性算法则牛逼点,可以建模复杂的分类面,从而能更好的拟合数据。

那在我们选择了特征的基础上,哪个机器学习算法能取得更好的效果呢?谁也不知道。实践是检验哪个好的不二标准。那难道要苦逼到写五六个机器学习的代码吗?No,机器学习社区的力量是强大的,码农界的共识是不重复造轮子!因此,对某些较为成熟的算法,总有某些优秀的库可以直接使用,省去了大伙调研的大部分时间。

基于目前使用python较多,而python界中远近闻名的机器学习库要数scikit-learn莫属了。这个库优点很多。简单易用,接口抽象得非常好,而且文档支持实在感人。本文中,我们可以封装其中的很多机器学习算法,然后进行一次性测试,从而便于分析取优。当然了,针对具体算法,超参调优也非常重要。

二、Scikit-learn的python实践

本篇文章利用线性回归算法预测波士顿的房价。波士顿房价数据集包含波士顿郊区住房价值的信息。

第一步:Python库导入

第二步:数据获取和理解

波士顿数据集是scikit-learn的内置数据集,可以直接拿来使用。

dict_keys([‘data', ‘target', ‘feature_names', ‘DESCR'])

(, )

Python scikit-learn 做线性回归的示例代码

[‘CRIM' ‘ZN' ‘INDUS' ‘CHAS' ‘NOX' ‘RM' ‘AGE' ‘DIS' ‘RAD' ‘TAX' ‘PTRATIO''B' ‘LSTAT']

结论:波士顿数据集个样本,个特征。

第三步:数据模型构建——线性回归

第四步:数据模型应用——预测房价

array([ ., . , . , ., .])

.

总结

1 使用.DESCR探索波士顿数据集,业务目标是预测波士顿郊区住房的房价;

2 使用scikit-learn针对整个数据集拟合线性回归模型,并计算均方误差。

思考环节

1 对数据集分割成训练数据集和测试数据集

2 训练数据集训练线性回归模型,利用线性回归模型对测试数据集进行预测

3 计算训练模型的MSE和测试数据集预测结果的MSE

4 绘制测试数据集的残差图

标签: Python scikit-learn 做线性回归的示例代码

本文链接地址:https://www.jiuchutong.com/biancheng/372141.html 转载请保留说明!

上一篇:Python定时器实例代码

下一篇:Python栈算法的实现与简单应用示例(python3 栈)

  • 计提附加税会计凭证怎么做会计分录
  • 种植茶叶企业所得税怎么征收
  • 代理费住宿费都包括什么
  • 农副产品增值税免税政策
  • 无形资产登记什么明细账
  • 怎么在电子税务局添加银行账户
  • 转租房产税计税依据
  • 机械租赁带司机税目
  • 子公司分红对合并报表的影响
  • 结转抵扣
  • 外商投资企业合并
  • 固定资产税前一次性扣除政策中的扣除十点
  • 企业的季度所得税怎么算
  • 印刷配件有哪些
  • 企业收到委托开发软件的货款如何记账?
  • 税务年报多少钱
  • 消费税价外费用的计算
  • 股权转让个人交的印花税可以入账吗
  • 企业未实际列支教育经费要纳税调整吗?
  • 小规模企业可以开电子专用发票吗
  • 增值税专用发票电子版
  • 报销抵冲银行日记帐要怎么入帐?
  • 进项税和销项税怎么理解
  • 应收出口退税属于哪个会计科目
  • 企业停产没有收入,费用可以计入长期待摊费用吗
  • 汇算清缴账务
  • 以前年度的财务报表还可以找出来吗
  • u盘的重装系统
  • 超市的成功秘诀
  • 非上市公众公司收购办法
  • uniapp获取input的值
  • windows 10月更新
  • 企业注销时无力缴纳社保
  • 预收的购货款属于收入吗
  • 营改增几个阶段
  • PHP实现中国公民身份证号码有效性验证示例代码
  • 搬迁补偿费属于什么费
  • npm install 的 --save 选项是什么?
  • html5开发的app有哪些
  • 模型论文是什么类型
  • zip 压缩命令
  • php curlfile
  • 应付利息和利息支出什么时候用
  • 权益法转成本法非同一控制下为什么不公允
  • 公益性怎么解释
  • python3 zipfile模块
  • mongodb修改命令
  • 销售物流
  • 微信支付宝等第三方支付的优缺点
  • 发票入账的管理规定
  • MySQL错误什么意思
  • 普票不能抵扣为什么有税率
  • 纳税人防伪税控设备未抄报怎么办
  • 公立幼儿园保育员招聘条件
  • 一个月没钱
  • 发工资的是会计还是出纳
  • 金蝶固定资产管理
  • 个体工商户必须建账吗
  • 明细分类账的建账
  • win7旗舰版系统还原无法启动
  • win8 怎么样
  • 如何删除windows更新文件
  • 使用dhcp的好处有哪些
  • linux promisc
  • 光盘做镜像文件
  • mmc.exe是什么
  • Win10计算机管理该文件没有与之关联的应用
  • linux升级python2.7
  • cocos2d rpg
  • 分享两句话
  • Node.js中的什么模块是用于处理文件和目录的
  • 利用职务之便谋取私利是什么罪
  • 讯飞src
  • python进行聚类
  • bootstrap要学吗
  • js函数详解
  • python中scipy用法
  • 辽宁省税务举报电话
  • 文化服务包括哪些专业
  • 融资租赁公司购入老旧租赁资产会计处理
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设