位置: IT常识 - 正文

机器学习中的数学原理——过拟合、正则化与惩罚函数

编辑:rootadmin
机器学习中的数学原理——过拟合、正则化与惩罚函数

推荐整理分享机器学习中的数学原理——过拟合、正则化与惩罚函数,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

通过这篇博客,你将清晰的明白什么是过拟合、正则化、惩罚函数。这个专栏名为白话机器学习中数学学习笔记,主要是用来分享一下我在 机器学习中的学习笔记及一些感悟,也希望对你的学习有帮助哦!感兴趣的小伙伴欢迎私信或者评论区留言!这一篇就更新一下《 白话机器学习中的数学——过拟合、正则化与惩罚函数》

文章目录一、过拟合二、正则化2.1 正则化的方法2.2 正则化的效果三、惩罚函数一、过拟合机器学习中的数学原理——过拟合、正则化与惩罚函数

之前我们提到过的模型只能拟合训练数据的状态被称为过拟合,英文是 overfitting。记得在学习回归的时候,过度增加函数 fθ(x)的次数会导致过拟合。过拟合不止在回归时出现,在分类时也经常发生,我们要时常留意它。 避免过拟合有以下方法:

增加全部训练数据的数量使用简单的模型正则化

首先,重要的是增加全部训练数据的数量。之前我也讲过,机器学习是从数据中学习的,所以数据最重要。另外,使用更简单的模型也有助于防止过拟合。

二、正则化2.1 正则化的方法

还记得我们在讲解回归的时候提到的目标函数吗? 我们要向这个目标函数增加下面这样的正则化项: 那么现在的E(θ)E(\boldsymbol{\theta})E(θ)就变为: 我们要对这个新的目标函数进行最小化,这种方法就称为正则化。 m 是参数的个数,不过一般来说不对 θ0 应用正则化。所以仔细看会发现 j 的取值是从 1 开始的。也就是说,假如预测函数的表达式为 fθ(x) = θ0 + θ1x + θ2x2,那么 m = 2 就意味着正则化的对象参数为 θ1 和 θ2,θ0 这种只有参数的项称为偏置项,一般不对它进行正则化。λ 是决定正则化项影响程度的正的常数。这个值需要我们自己来定。

2.2 正则化的效果

光看表达式可能不容易理解。我们结合图来想象一下吧:首先把目标函数分成两个部分。 C(θ) 是本来就有的目标函数项,R(θ) 是正则化项。 C(θ) 和 R(θ) 相加之后就是新的目标函数,所以我们实际地把这两个函数的图形画出来,加起来看看。不过参数太多就画不出图来了,所以这里我们只关注 θ1。而且为了更加易懂,先不考虑 λ。 我们先从C(θ) 开始画起,不用太在意形状是否精确。在讲回归的时候,我们说过这个目 标函数开口向上,还记得吗?所以,我们假设它的形状是这样的:

从图中马上就可以看出最小值在哪里,是在θ1 = 4.5 附近。 从这个目标函数在没有正则化项时的形状来看,θ1 = 4.5 附近是最小值。接下来是 R(θ),它就相当于12θ12\frac{1}{2} \theta_1^221​θ12​所以是过原点的简单二次函数。 实际的目标函数是这两个函数之和E(θ) = C(θ) + R(θ),我们来画一下它的图形。顺便考虑一下最小值在哪里。把 θ1 各点上的 C(θ) 和 R(θ) 的高相加,然后用线把它们相连就好: 从图中我们可以看出来最小值是 θ1 = 0.9,与加正则化项之前相比,θ1 更接近 0 了。本来是在 θ1 = 4.5 处最小,现在是在 θ1 = 0.9 处最小,的确更接近 0 了。这就是正则化的效果。它可以防止参数变得过大,有助于参数接近较小的值。虽然我们只考虑了 θ1,但其他 θj 参数的情况也是类似的。 参数的值变小,意味着该参数的影响也会相应地变小。比如,有这样的一个预测函数 fθ(x):fθ(x)=θ+θ1x+θ2x2f_{\boldsymbol{\theta}}(\boldsymbol{x})=\theta_0+\theta_1 x+\theta_2 x^2fθ​(x)=θ0​+θ1​x+θ2​x2 极端一点,假设 θ2 = 0,这个表达式就从二次变为一次了,这就意味着本来是曲线的预测函数变为直线了: 这正是通过减小不需要的参数的影响,将复杂模型替换为简单模型来防止过拟合的方式。

三、惩罚函数

为了防止参数的影响过大,在训练时要对参数施加一些惩罚。比如上面提到的 λ,可以控制正则化惩罚的强度。C(θ)=12∑i=1n(y(i)−fθ(x(i)))2R(θ)=λ2∑j=1mθj2\begin{aligned} & C(\boldsymbol{\theta})=\frac{1}{2} \sum_{i=1}^n\left(y^{(i)}-f_{\boldsymbol{\theta}}\left(\boldsymbol{x}^{(i)}\right)\right)^2 \\ & R(\boldsymbol{\theta})=\frac{\lambda}{2} \sum_{j=1}^m \theta_j^2 \end{aligned}​C(θ)=21​i=1∑n​(y(i)−fθ​(x(i)))2R(θ)=2λ​j=1∑m​θj2​​ 比如令 λ = 0,那就相当于不使用正则化 λ 越大,正则化的惩罚也就越严厉:

本文链接地址:https://www.jiuchutong.com/zhishi/299255.html 转载请保留说明!

上一篇:Web 攻防之业务安全:密码找回安全案例总结.(web攻防之业务安全实战指南在线阅读)

下一篇:Content Security Policy (CSP) 介绍(content security policy blob)

  • 如何通过SEO实现互联网推广霸屏?

    如何通过SEO实现互联网推广霸屏?

  • 电信4g+网速慢(电信4g网速慢怎么提高)

    电信4g+网速慢(电信4g网速慢怎么提高)

  • 抖音开通小店没有营业执照怎么办(抖音开通小店没有橱窗)

    抖音开通小店没有营业执照怎么办(抖音开通小店没有橱窗)

  • 华为荣耀20Pro怎样清理内存(华为荣耀20Pro怎么升级鸿蒙系统)

    华为荣耀20Pro怎样清理内存(华为荣耀20Pro怎么升级鸿蒙系统)

  • 华为视频怎么卸载(华为视频怎么卸载了还能看)

    华为视频怎么卸载(华为视频怎么卸载了还能看)

  • 爱奇艺预约要付费吗(爱奇艺会员预约收费吗)

    爱奇艺预约要付费吗(爱奇艺会员预约收费吗)

  • vr ar技术是什么(vr,ar技术是指什么)

    vr ar技术是什么(vr,ar技术是指什么)

  • 抖音怎么不能下载别人视频了(抖音怎么不能下载视频到相册)

    抖音怎么不能下载别人视频了(抖音怎么不能下载视频到相册)

  • 华为手机防抖功能怎么打开(华为手机防抖功能在哪里找)

    华为手机防抖功能怎么打开(华为手机防抖功能在哪里找)

  • 为什么应用下载了图标在手机显示不了(为什么应用下载失败)

    为什么应用下载了图标在手机显示不了(为什么应用下载失败)

  • 手机没有欠费为什么打不了电话(手机没有欠费为什么会暂停服务)

    手机没有欠费为什么打不了电话(手机没有欠费为什么会暂停服务)

  • iphone11有128g的吗(iphone11有128g的嘛)

    iphone11有128g的吗(iphone11有128g的嘛)

  • 苹果11耳机转换器在哪里(苹果11耳机转换头用不了)

    苹果11耳机转换器在哪里(苹果11耳机转换头用不了)

  • 快手b类违规内容(快手b类违规内容怎么办)

    快手b类违规内容(快手b类违规内容怎么办)

  • ip地址分为几类(查询网址域名ip地址)

    ip地址分为几类(查询网址域名ip地址)

  • vivox7截屏怎么操作(vivox7怎样截屏)

    vivox7截屏怎么操作(vivox7怎样截屏)

  • 华为gt手表防水吗(华为gt手表防水效果怎么样)

    华为gt手表防水吗(华为gt手表防水效果怎么样)

  • qq注销后是什么样子(qq注销后是什么状态)

    qq注销后是什么样子(qq注销后是什么状态)

  • 为什么设置了来电秀不显示视频(为什么设置了来电视频不显示?)

    为什么设置了来电秀不显示视频(为什么设置了来电视频不显示?)

  • vue速度怎么调节(vue 怎么调试)

    vue速度怎么调节(vue 怎么调试)

  • 2060带oc与不带oc区别(2060 6g oc)

    2060带oc与不带oc区别(2060 6g oc)

  • 网络的拓扑结构(网络的拓扑结构主要包括)

    网络的拓扑结构(网络的拓扑结构主要包括)

  • iwatch设置来电铃声(iwatch如何设置来电提醒)

    iwatch设置来电铃声(iwatch如何设置来电提醒)

  • webpack -v报错:Cannot find module ‘webpack-cli/package.json‘(webpack devserver contentbase)

    webpack -v报错:Cannot find module ‘webpack-cli/package.json‘(webpack devserver contentbase)

  • 留抵退税手续
  • 公司中介费收入如何纳税
  • 公司付给中间人居间费用如何纳税
  • 内账采购含税怎么转不含税
  • 签证费没有发票可以入账吗
  • 境外中资企业转让股权的涉税处理
  • 无偿赠送他人货物交增值税吗
  • 临时营业执照有效期多久
  • 快递行业的收入与成本
  • 限售股所得税的优惠政策
  • 异地预缴企业所得税
  • 关于个人所得税下列说法正确的是
  • 项目资本金是什么意思大白话
  • 广告机计入什么费用
  • 动漫软件公司的发展前景
  • 增值税发票遗失证明模板
  • microsoft edge怎么设置关闭所有网页
  • 旅游公司开具的考察费怎么入账
  • 公司设计费属于什么费用
  • 航天税控服务费
  • php常用设计模式(大总结)
  • laravel引入css
  • 前端毕业设计项目
  • 财政预算单位可以既是省级又是中央
  • 企业长期资金的筹集方式
  • River Avon in Bath, England (© Robert Harding World Imagery/Offset by Shutterstock)
  • 华为od机试无法测用例
  • web前端面试题2021及答案
  • 毕业设计基于51单片机多功能电子钟的设计
  • 无形资产评估增值可以入账吗
  • convert convert
  • 研发费用资本化计入什么科目
  • 如何隐藏应用软件华为
  • 织梦怎么套模板
  • 计提的坏账准备计入什么科目
  • abs函数python怎么用
  • 2020织梦建站教程全集
  • 已认证发票对方作废后不重开怎么办
  • 固定资产转让损失怎么算
  • 会计处理方法是什么意思
  • 增值税抵扣了,主要成本怎么算
  • 结转本年利润的摘要怎么写
  • 企业转让固定资产发生的费用可扣除吗
  • 关税征收方式
  • 收到工会经费如何处理
  • 计提个人经营所得税怎么算
  • 借长期借款贷在建工程
  • 航天金税服务费发票在哪打印
  • 实缴资本在公司能查到吗
  • 固定资产折旧度怎么计算
  • 自建厂房的进项税额抵扣
  • 会计档案步骤
  • mysql中关于图书馆实训题
  • sql安装不上去
  • 世界杯猜测
  • sqlserver临时表详解
  • windows10如何更改管理员账户
  • linux临时目录一般存在哪个文件夹
  • linux的grep命令详解
  • win10 mobile 1709
  • le启动exe是什么意思
  • window10使用ie8
  • win7笔记本触摸板怎么开启
  • win10系统出现问题怎么办
  • jquery easyui 教程
  • 怎么设置网页就用指定浏览器
  • python进阶视频
  • python难度
  • ajax按顺序执行
  • jquery教程chm
  • python编程内容
  • python动态加载py
  • js 原型方法
  • python获取linux磁盘信息
  • 国税怎么打印申报表
  • 旅游景区可免交土地使用税
  • 133平房子公摊36.88
  • 居住证在粤省事怎么查询
  • 江西公积金提取代办
  • 海关行政处罚实施条例的适用范围
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设