位置: IT常识 - 正文

机器学习中的数学原理——过拟合、正则化与惩罚函数

编辑:rootadmin
机器学习中的数学原理——过拟合、正则化与惩罚函数

推荐整理分享机器学习中的数学原理——过拟合、正则化与惩罚函数,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

通过这篇博客,你将清晰的明白什么是过拟合、正则化、惩罚函数。这个专栏名为白话机器学习中数学学习笔记,主要是用来分享一下我在 机器学习中的学习笔记及一些感悟,也希望对你的学习有帮助哦!感兴趣的小伙伴欢迎私信或者评论区留言!这一篇就更新一下《 白话机器学习中的数学——过拟合、正则化与惩罚函数》

文章目录一、过拟合二、正则化2.1 正则化的方法2.2 正则化的效果三、惩罚函数一、过拟合机器学习中的数学原理——过拟合、正则化与惩罚函数

之前我们提到过的模型只能拟合训练数据的状态被称为过拟合,英文是 overfitting。记得在学习回归的时候,过度增加函数 fθ(x)的次数会导致过拟合。过拟合不止在回归时出现,在分类时也经常发生,我们要时常留意它。 避免过拟合有以下方法:

增加全部训练数据的数量使用简单的模型正则化

首先,重要的是增加全部训练数据的数量。之前我也讲过,机器学习是从数据中学习的,所以数据最重要。另外,使用更简单的模型也有助于防止过拟合。

二、正则化2.1 正则化的方法

还记得我们在讲解回归的时候提到的目标函数吗? 我们要向这个目标函数增加下面这样的正则化项: 那么现在的E(θ)E(\boldsymbol{\theta})E(θ)就变为: 我们要对这个新的目标函数进行最小化,这种方法就称为正则化。 m 是参数的个数,不过一般来说不对 θ0 应用正则化。所以仔细看会发现 j 的取值是从 1 开始的。也就是说,假如预测函数的表达式为 fθ(x) = θ0 + θ1x + θ2x2,那么 m = 2 就意味着正则化的对象参数为 θ1 和 θ2,θ0 这种只有参数的项称为偏置项,一般不对它进行正则化。λ 是决定正则化项影响程度的正的常数。这个值需要我们自己来定。

2.2 正则化的效果

光看表达式可能不容易理解。我们结合图来想象一下吧:首先把目标函数分成两个部分。 C(θ) 是本来就有的目标函数项,R(θ) 是正则化项。 C(θ) 和 R(θ) 相加之后就是新的目标函数,所以我们实际地把这两个函数的图形画出来,加起来看看。不过参数太多就画不出图来了,所以这里我们只关注 θ1。而且为了更加易懂,先不考虑 λ。 我们先从C(θ) 开始画起,不用太在意形状是否精确。在讲回归的时候,我们说过这个目 标函数开口向上,还记得吗?所以,我们假设它的形状是这样的:

从图中马上就可以看出最小值在哪里,是在θ1 = 4.5 附近。 从这个目标函数在没有正则化项时的形状来看,θ1 = 4.5 附近是最小值。接下来是 R(θ),它就相当于12θ12\frac{1}{2} \theta_1^221​θ12​所以是过原点的简单二次函数。 实际的目标函数是这两个函数之和E(θ) = C(θ) + R(θ),我们来画一下它的图形。顺便考虑一下最小值在哪里。把 θ1 各点上的 C(θ) 和 R(θ) 的高相加,然后用线把它们相连就好: 从图中我们可以看出来最小值是 θ1 = 0.9,与加正则化项之前相比,θ1 更接近 0 了。本来是在 θ1 = 4.5 处最小,现在是在 θ1 = 0.9 处最小,的确更接近 0 了。这就是正则化的效果。它可以防止参数变得过大,有助于参数接近较小的值。虽然我们只考虑了 θ1,但其他 θj 参数的情况也是类似的。 参数的值变小,意味着该参数的影响也会相应地变小。比如,有这样的一个预测函数 fθ(x):fθ(x)=θ+θ1x+θ2x2f_{\boldsymbol{\theta}}(\boldsymbol{x})=\theta_0+\theta_1 x+\theta_2 x^2fθ​(x)=θ0​+θ1​x+θ2​x2 极端一点,假设 θ2 = 0,这个表达式就从二次变为一次了,这就意味着本来是曲线的预测函数变为直线了: 这正是通过减小不需要的参数的影响,将复杂模型替换为简单模型来防止过拟合的方式。

三、惩罚函数

为了防止参数的影响过大,在训练时要对参数施加一些惩罚。比如上面提到的 λ,可以控制正则化惩罚的强度。C(θ)=12∑i=1n(y(i)−fθ(x(i)))2R(θ)=λ2∑j=1mθj2\begin{aligned} & C(\boldsymbol{\theta})=\frac{1}{2} \sum_{i=1}^n\left(y^{(i)}-f_{\boldsymbol{\theta}}\left(\boldsymbol{x}^{(i)}\right)\right)^2 \\ & R(\boldsymbol{\theta})=\frac{\lambda}{2} \sum_{j=1}^m \theta_j^2 \end{aligned}​C(θ)=21​i=1∑n​(y(i)−fθ​(x(i)))2R(θ)=2λ​j=1∑m​θj2​​ 比如令 λ = 0,那就相当于不使用正则化 λ 越大,正则化的惩罚也就越严厉:

本文链接地址:https://www.jiuchutong.com/zhishi/299255.html 转载请保留说明!

上一篇:Web 攻防之业务安全:密码找回安全案例总结.(web攻防之业务安全实战指南在线阅读)

下一篇:Content Security Policy (CSP) 介绍(content security policy blob)

  • 网站是怎样开展口碑推广(网站功能如何实现)

    网站是怎样开展口碑推广(网站功能如何实现)

  • dvr4000用户密码(dvr4000)(dvr初始密码)

    dvr4000用户密码(dvr4000)(dvr初始密码)

  • 哔哩哔哩怎么一起看电影(哔哩哔哩怎么一直关闭弹幕)

    哔哩哔哩怎么一起看电影(哔哩哔哩怎么一直关闭弹幕)

  • 小米平板5pro怎么关闭桌面搜索框(小米平板5pro怎么样)

    小米平板5pro怎么关闭桌面搜索框(小米平板5pro怎么样)

  • 钉钉不小心点到连麦怎么取消(点击钉钉)

    钉钉不小心点到连麦怎么取消(点击钉钉)

  • 苹果8p怎么手动截屏(苹果8p怎么手动设置时间)

    苹果8p怎么手动截屏(苹果8p怎么手动设置时间)

  • 卡贴机能用多久(苹果卡贴机能用多久)

    卡贴机能用多久(苹果卡贴机能用多久)

  • 苹果系统能不能更新系统(苹果系统能不能降级)

    苹果系统能不能更新系统(苹果系统能不能降级)

  • 华为小艺为什么不说话(华为小艺为什么叫不出来)

    华为小艺为什么不说话(华为小艺为什么叫不出来)

  • 美图手机充电一直显示1%(美图手机充电一直1%)

    美图手机充电一直显示1%(美图手机充电一直1%)

  • 怎么辨别对方语音是否静音了(怎么辨别对方语音)

    怎么辨别对方语音是否静音了(怎么辨别对方语音)

  • 被挡访客可解锁是什么意思(被挡访客怎么解除)

    被挡访客可解锁是什么意思(被挡访客怎么解除)

  • vmos有什么用(vmos可以用来干嘛)

    vmos有什么用(vmos可以用来干嘛)

  • mqa62cha是什么版本(mqa62zp/a是什么版本)

    mqa62cha是什么版本(mqa62zp/a是什么版本)

  • 电话加入白名单有啥用(电话加入白名单怎么拉出来)

    电话加入白名单有啥用(电话加入白名单怎么拉出来)

  • 网线分千兆和百兆吗(网线百兆和千兆接法一样吗)

    网线分千兆和百兆吗(网线百兆和千兆接法一样吗)

  • 8.5英寸屏幕是多大(8.5英寸屏幕有多大)

    8.5英寸屏幕是多大(8.5英寸屏幕有多大)

  • 双十一买的可以退货退款吗(双十一买的可以换尺码吗)

    双十一买的可以退货退款吗(双十一买的可以换尺码吗)

  • 电脑上微信怎么下载(电脑上微信怎么发朋友圈)

    电脑上微信怎么下载(电脑上微信怎么发朋友圈)

  • 手机屏幕总成带框是什么意思(手机屏幕总成带框好换吗)

    手机屏幕总成带框是什么意思(手机屏幕总成带框好换吗)

  • 手机qq群怎么发公告(手机qq群怎么发群文件)

    手机qq群怎么发公告(手机qq群怎么发群文件)

  • 苹果xsmax参数配置(苹果xs参数配置)

    苹果xsmax参数配置(苹果xs参数配置)

  • 小米平板a0101是几代(小米平板a0101是平板几)

    小米平板a0101是几代(小米平板a0101是平板几)

  • win10蓝屏无法进入桌面(Win10蓝屏无法进入系统怎么办)

    win10蓝屏无法进入桌面(Win10蓝屏无法进入系统怎么办)

  • Win10升级Win11是自动安装吗 Win10升级Win11方法介绍(Win10升级win11是激活状态吗?)

    Win10升级Win11是自动安装吗 Win10升级Win11方法介绍(Win10升级win11是激活状态吗?)

  • systemctl命令  管理系统服务(system view命令)

    systemctl命令 管理系统服务(system view命令)

  • 汇算清缴补缴税款如何做账
  • 注册资本 投资比例
  • 代理费住宿费都包括什么
  • 金蝶利润表没有数据怎么办
  • 坏账准备递延所得税资产怎么算
  • 公益性捐赠税前扣除资格有效期
  • 公司给员工股票计税
  • 其他应付款跨年如何应对
  • 个税手续费退还时间
  • 商贸企业可以使用月末一次加权平均
  • 商业保险可以报税吗
  • 清洁费免税吗
  • 一般纳税人房租没有发票怎么办
  • 酒店固定资产明细表范本
  • 无形资产的定义和特征
  • 逾期申报会对纳税人产生哪些不良影响?
  • 总公司和分公司的合作协议
  • win11系统更新卡在25%
  • 企业的债权资产
  • 无法收回的应收票据怎么处理
  • win10通知栏怎么设置
  • 清除不必要的内存
  • 生产经营所得投资者减除费用季度申报填吗
  • Mysql的GROUP_CONCAT()函数使用方法
  • 年末一般纳税人税率表
  • le启动exe是什么意思
  • 长春花怎么养才能爆花
  • 金银首饰零售业必须为一般纳税人吗
  • wordpress文章编辑
  • 固定资产清理属于什么类科目
  • 阿尔比恩洞的级别
  • 工程未审计资金能支付到多少
  • 商业连锁企业有哪些
  • 费用报销单怎么划线
  • gpt3 api
  • 车间一般耗材计入
  • 芝麻信用app
  • 哪些计入其他收益与营业外收入
  • 购买农产品取得增值税普通发票可以抵扣吗
  • 预收账款的账务处理摘要
  • 将织梦dedecms转换到wordpress
  • 专项应付款的账务处理
  • phpcms使用教程
  • 调转会计证需要什么资料
  • PostgreSQL 角色与用户管理介绍
  • 其他应收款借方表示增加吗
  • 进项税适用税率
  • 收付转三种凭证怎么装订
  • 白条入账会受到监管吗
  • win8n
  • Solaris 10 Openssh安装和配置
  • 重装系统需要主机吗
  • win10手机版下载官方中文版
  • 电脑xp系统改装win7系统可以吗
  • windows xp密码忘记怎样解锁
  • 中文版windows7的安装方式
  • regsrv.exe - regsrv是什么进程 有什么用
  • centos安装完为什么没有桌面
  • 进程mmc.exe
  • 梦见古字
  • Win10 Mobile Redstone预览版14295出现问题 屏幕闪烁/应用自动关闭等
  • cocos2dx屏幕适配解决方案
  • 微信小程序实现微信支付
  • jQuery实现Tab选项卡切换效果简单演示
  • cmd中文名称
  • linux内核结构详解
  • node.js搭建服务器
  • vue实现标签页效果
  • unity 2danimation
  • js正则表达式验证姓名
  • javascript静态
  • android性能测试
  • python flask
  • 浙江省网上税务局app下载
  • 河南省地税网上营业厅
  • 省委巡视组收到的案件线索怎么分配
  • 电子税务局怎么添加开票员
  • 高新区税务局发工资时间
  • 国税优盘安装教程
  • 税务约谈的法律依据
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设