位置: IT常识 - 正文

机器学习中的数学原理——过拟合、正则化与惩罚函数

编辑:rootadmin
机器学习中的数学原理——过拟合、正则化与惩罚函数

推荐整理分享机器学习中的数学原理——过拟合、正则化与惩罚函数,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

通过这篇博客,你将清晰的明白什么是过拟合、正则化、惩罚函数。这个专栏名为白话机器学习中数学学习笔记,主要是用来分享一下我在 机器学习中的学习笔记及一些感悟,也希望对你的学习有帮助哦!感兴趣的小伙伴欢迎私信或者评论区留言!这一篇就更新一下《 白话机器学习中的数学——过拟合、正则化与惩罚函数》

文章目录一、过拟合二、正则化2.1 正则化的方法2.2 正则化的效果三、惩罚函数一、过拟合机器学习中的数学原理——过拟合、正则化与惩罚函数

之前我们提到过的模型只能拟合训练数据的状态被称为过拟合,英文是 overfitting。记得在学习回归的时候,过度增加函数 fθ(x)的次数会导致过拟合。过拟合不止在回归时出现,在分类时也经常发生,我们要时常留意它。 避免过拟合有以下方法:

增加全部训练数据的数量使用简单的模型正则化

首先,重要的是增加全部训练数据的数量。之前我也讲过,机器学习是从数据中学习的,所以数据最重要。另外,使用更简单的模型也有助于防止过拟合。

二、正则化2.1 正则化的方法

还记得我们在讲解回归的时候提到的目标函数吗? 我们要向这个目标函数增加下面这样的正则化项: 那么现在的E(θ)E(\boldsymbol{\theta})E(θ)就变为: 我们要对这个新的目标函数进行最小化,这种方法就称为正则化。 m 是参数的个数,不过一般来说不对 θ0 应用正则化。所以仔细看会发现 j 的取值是从 1 开始的。也就是说,假如预测函数的表达式为 fθ(x) = θ0 + θ1x + θ2x2,那么 m = 2 就意味着正则化的对象参数为 θ1 和 θ2,θ0 这种只有参数的项称为偏置项,一般不对它进行正则化。λ 是决定正则化项影响程度的正的常数。这个值需要我们自己来定。

2.2 正则化的效果

光看表达式可能不容易理解。我们结合图来想象一下吧:首先把目标函数分成两个部分。 C(θ) 是本来就有的目标函数项,R(θ) 是正则化项。 C(θ) 和 R(θ) 相加之后就是新的目标函数,所以我们实际地把这两个函数的图形画出来,加起来看看。不过参数太多就画不出图来了,所以这里我们只关注 θ1。而且为了更加易懂,先不考虑 λ。 我们先从C(θ) 开始画起,不用太在意形状是否精确。在讲回归的时候,我们说过这个目 标函数开口向上,还记得吗?所以,我们假设它的形状是这样的:

从图中马上就可以看出最小值在哪里,是在θ1 = 4.5 附近。 从这个目标函数在没有正则化项时的形状来看,θ1 = 4.5 附近是最小值。接下来是 R(θ),它就相当于12θ12\frac{1}{2} \theta_1^221​θ12​所以是过原点的简单二次函数。 实际的目标函数是这两个函数之和E(θ) = C(θ) + R(θ),我们来画一下它的图形。顺便考虑一下最小值在哪里。把 θ1 各点上的 C(θ) 和 R(θ) 的高相加,然后用线把它们相连就好: 从图中我们可以看出来最小值是 θ1 = 0.9,与加正则化项之前相比,θ1 更接近 0 了。本来是在 θ1 = 4.5 处最小,现在是在 θ1 = 0.9 处最小,的确更接近 0 了。这就是正则化的效果。它可以防止参数变得过大,有助于参数接近较小的值。虽然我们只考虑了 θ1,但其他 θj 参数的情况也是类似的。 参数的值变小,意味着该参数的影响也会相应地变小。比如,有这样的一个预测函数 fθ(x):fθ(x)=θ+θ1x+θ2x2f_{\boldsymbol{\theta}}(\boldsymbol{x})=\theta_0+\theta_1 x+\theta_2 x^2fθ​(x)=θ0​+θ1​x+θ2​x2 极端一点,假设 θ2 = 0,这个表达式就从二次变为一次了,这就意味着本来是曲线的预测函数变为直线了: 这正是通过减小不需要的参数的影响,将复杂模型替换为简单模型来防止过拟合的方式。

三、惩罚函数

为了防止参数的影响过大,在训练时要对参数施加一些惩罚。比如上面提到的 λ,可以控制正则化惩罚的强度。C(θ)=12∑i=1n(y(i)−fθ(x(i)))2R(θ)=λ2∑j=1mθj2\begin{aligned} & C(\boldsymbol{\theta})=\frac{1}{2} \sum_{i=1}^n\left(y^{(i)}-f_{\boldsymbol{\theta}}\left(\boldsymbol{x}^{(i)}\right)\right)^2 \\ & R(\boldsymbol{\theta})=\frac{\lambda}{2} \sum_{j=1}^m \theta_j^2 \end{aligned}​C(θ)=21​i=1∑n​(y(i)−fθ​(x(i)))2R(θ)=2λ​j=1∑m​θj2​​ 比如令 λ = 0,那就相当于不使用正则化 λ 越大,正则化的惩罚也就越严厉:

本文链接地址:https://www.jiuchutong.com/zhishi/299255.html 转载请保留说明!

上一篇:Web 攻防之业务安全:密码找回安全案例总结.(web攻防之业务安全实战指南在线阅读)

下一篇:Content Security Policy (CSP) 介绍(content security policy blob)

  • 华为手机紧急备份模式如何退出(华为手机紧急备份怎么回事)

    华为手机紧急备份模式如何退出(华为手机紧急备份怎么回事)

  • 苹果13promax怎么恢复出厂设置(苹果13promax怎么设置动态壁纸)

    苹果13promax怎么恢复出厂设置(苹果13promax怎么设置动态壁纸)

  • 天猫超市芝麻go怎么关闭(天猫超市芝麻go扣钱)

    天猫超市芝麻go怎么关闭(天猫超市芝麻go扣钱)

  • 苹果手机一键截屏怎么设置(苹果手机一键截图在哪里)

    苹果手机一键截屏怎么设置(苹果手机一键截图在哪里)

  • 苹果描述文件删除不掉(苹果描述文件删除了但图标删不了)

    苹果描述文件删除不掉(苹果描述文件删除了但图标删不了)

  • 快手能查出真实姓名吗(快手能查出真实姓名吗怎么查)

    快手能查出真实姓名吗(快手能查出真实姓名吗怎么查)

  • 通过私信添加什么意思(私信加微信怎么加)

    通过私信添加什么意思(私信加微信怎么加)

  • 淘宝相册图片权限怎么设置(淘宝相册图片权限设置怎么打开)

    淘宝相册图片权限怎么设置(淘宝相册图片权限设置怎么打开)

  • qq和微信可以同时打电话吗(qq和微信同一个账号能同步吗)

    qq和微信可以同时打电话吗(qq和微信同一个账号能同步吗)

  • 华为手机不带耳机孔的手机怎么办(华为手机不带耳机没有声音)

    华为手机不带耳机孔的手机怎么办(华为手机不带耳机没有声音)

  • 豆瓣发送私信过于频繁要等多久(豆瓣发私信对方能不能看到)

    豆瓣发送私信过于频繁要等多久(豆瓣发私信对方能不能看到)

  • pcrm00是啥手机(oppo pcrmoo是什么手机型号)

    pcrm00是啥手机(oppo pcrmoo是什么手机型号)

  • 蓝牙耳机一直闪红蓝光(蓝牙耳机一直闪绿灯怎么回事)

    蓝牙耳机一直闪红蓝光(蓝牙耳机一直闪绿灯怎么回事)

  • 抖音视频失效是什么原因(抖音视频失效是啥意思)

    抖音视频失效是什么原因(抖音视频失效是啥意思)

  • 苹果8怎么设置自动开关机(苹果8怎么设置动态壁纸)

    苹果8怎么设置自动开关机(苹果8怎么设置动态壁纸)

  • 怎么把扣扣私密说说公开(扣扣的私密相册如何设置)

    怎么把扣扣私密说说公开(扣扣的私密相册如何设置)

  • 如何用微信写日记(如何在微信里写日记)

    如何用微信写日记(如何在微信里写日记)

  • 抖音多少赞可以发长视频(抖音多少赞可以带货)

    抖音多少赞可以发长视频(抖音多少赞可以带货)

  • qq情侣空间怎么改相恋日期(qq情侣空间怎么隐藏)

    qq情侣空间怎么改相恋日期(qq情侣空间怎么隐藏)

  • 苹果x频繁自动关机解决办法(iphone x老是自动重启)

    苹果x频繁自动关机解决办法(iphone x老是自动重启)

  • win11怎么设置最佳性能模式? windows11开启最佳性能模式的技巧(win11怎么设置最佳能效模式)

    win11怎么设置最佳性能模式? windows11开启最佳性能模式的技巧(win11怎么设置最佳能效模式)

  • aornum.exe进程是病毒吗 aornum进程是什么文件(au_.exe是什么进程)

    aornum.exe进程是病毒吗 aornum进程是什么文件(au_.exe是什么进程)

  • 2.前端笔记-CSS-字体属性(前端css要掌握到什么程度)

    2.前端笔记-CSS-字体属性(前端css要掌握到什么程度)

  • 2022深圳杯C题自动驾驶电动物料车换电站选址及调度方案(深圳杯2020c题)

    2022深圳杯C题自动驾驶电动物料车换电站选址及调度方案(深圳杯2020c题)

  • phpcms导航链接怎么修改(html导航链接)

    phpcms导航链接怎么修改(html导航链接)

  • 中国注册税务师考试时间
  • CIA是指什么会计考试
  • 债券到期账务处理
  • 核定征收季度核定销售额
  • 公司无偿更换产品账务如何处理
  • 个体营业执照从哪里查询
  • 本期免税额怎么填写
  • 认缴注册资本的风险
  • 存货盘盈属于什么活动
  • 增值税10%怎么算
  • 计提分红款体现在利润表中哪一个
  • 代扣代缴个人所得税
  • 部分退货退款剩下的钱什么时候给卖家
  • 已经认证的进项税转出
  • 证券清算款是什么科目
  • 工资3500该不该辞职
  • 利税总额为负数如何表述出来
  • 增值税发票开票有误怎么办?
  • 个体工商户3万以下免个人经营所得税吗
  • 跨境税法
  • 施工单位的项目
  • 以现金形式发放的员工餐费补贴,可并入职工福利费
  • 规范合同签订的重要性
  • 建筑服务一般纳税人预缴税率
  • 股权转让怎么缴纳个人所得税
  • 发票认证的三种方式
  • 销售应税产品分录
  • 如何在windows11上打开蓝牙
  • win10同步账户
  • 小规模餐饮业怎样报税减免
  • php抽象类使用场景
  • linux系统的
  • 坏账准备的相关账务处理
  • 企业收到的保险理赔款会计分录
  • 报错专业了可不可以改
  • 医院装修设计费用取费标准表
  • 琥珀山庄位于我国哪个省
  • 企业所得税是地税申报还是国税申报
  • ps一个页面怎么选中画板
  • 固定资产清理的含义
  • 自然人独资可以变更为有限责任公司
  • ubuntu下安装windows
  • 现金流量表的本期数是本月数还是本年数
  • 企业出售自用房产增值税
  • 建筑工程机械设备租赁属于什么行业
  • 车船税是什么样子的?
  • 房地产企业成本结转
  • 普通发票可以改日期吗怎么改
  • 运输服务和运输费有什么区别
  • 建筑企业怎么结算成本
  • 同城票据交换差额户金额从哪得来的
  • 管理费用属于什么成本
  • 销售预算的重要性
  • mac上mysql安装
  • mysql获取当前行数
  • win7系统摄像头打不开
  • win81蓝屏重启故障
  • linux 系统监控
  • win7语言栏不见了 各种方法都试过了
  • win10系统怎么回滚
  • 加载的读音
  • 简单说明ssh远程登录流程
  • win7开机提示重启怎么办
  • linux支持哪些类型的设备
  • win10多任务视图不排序怎么设置
  • opengl clamp
  • javascript闭包优缺点
  • javascript到c
  • javascript基础笔记
  • unity ugui合批
  • nodejs发送post请求socket hand up
  • android studio downloading
  • 深入理解计算机系统
  • python lambda的用法
  • jquery获取cookie值的方法
  • 山东税务局电子税务局申报
  • 上海中考规定
  • 怎么注册山东省政府采购网
  • 差额征税差额开票怎么理解
  • 年报汇算清缴怎么做
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设