位置: IT常识 - 正文

机器学习中的数学原理——对数似然函数

编辑:rootadmin
机器学习中的数学原理——对数似然函数

推荐整理分享机器学习中的数学原理——对数似然函数,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

这个专栏主要是用来分享一下我在 机器学习中的 学习笔记及一些感悟,也希望对你的学习有帮助哦!感兴趣的小伙伴欢迎 私信或者评论区留言!这一篇就更新一下《 白话机器学习中的数学——对数似然函数》!

目录

一、什么是对数似然函数

二、算法分析

三、总结 


一、什么是对数似然函数

对数似然是Minitab 为了确定估计系数(β) 的最优值而最大化的表达式。 由于对数似然是样本数量的函数,因此它们的值不能单独作为拟合值的指数使用,但可以用来比较不同系数的拟合值。 由于您要最大化对数似然,因此值越大越好。

二、算法分析

之前我们已经接触过似然函数的概念,我们认为似然函数 L(θ) 中,使其值最大的参数θ能够最近似地说明训练数据。和随机梯度下降法一样,我们接下来要做的就是对似然函数进行微分,求出参数 θ。不过直接对似然函数进行微分有点困难,在此之前要把函数变形。联合概率中的概率都是 1 以下的数,所以像联合概率这种概率乘法的值会越来越小。如果值太小,编程时会出现精度问题。并且与加法相比,乘法的计算量要大得多。

想要解决这些问题,只要取似然函数的对数就好了。像这样在等式两边加上 log 即可:

 log 是单调递增函数。log 函数的图形如下所示:

图形一直向右上方延伸。单调递增函数是在 x1 < x2 时,f(x1) < f(x2) 的函数 f(x)。log(x)的图形一直向右上方延伸,而且在 x1 < x2时,log(x1) < log(x2)也成立。

我们现在考察的似然函数也是在 L(θ1) < L(θ2) 时,有logL(θ1) < logL(θ2) 成立。也就是说,使 L(θ) 最大化等价于使logL(θ) 最大化。我们把对数似然函数变形看看:

 每一行的变形分别利用了下面这些特性,好好理解一下:

第 2 行是 log(ab) = log a + log b第 3 行是 log ab = b log a第 4 行是 P(y(i) = 0|x(i) ) = 1 − P(y(i) = 1|x(i) )

前两个是对数函数的特性,下面对第 4 行进行解释:现在我们考虑的只有 y = 1 和 y = 0 两种情况,所以应有 P(y(i) = 0|x(i) ) + P(y(i) = 1|x(i) ) = 1

下面要做的就是就是进行偏分求未知量。前面讲了很多,总结一下就是逻辑回归将这个对数似然函数用作 目标函数。

 接下来,对各个参数 θj 求微分就行了:

 和回归的时候是一样的,我们把似然函数也换成这样的复合函数, 然后依次求微分。

机器学习中的数学原理——对数似然函数

这个是 u 对 v 微分,log(v) 的微分是 1/v。对 log(1 − v) 微分时,要像这样通过复合函数来求。还 要注意,这样做最后的表达式前面会有个负号。

 所以,微分结果是这样的:

 接下来是 v 对 θj 的微分:

这个看上去有点麻烦,不过其实我们已经知道了 sigmoid 函数的 微分是这样的,所以用这个应该就可以计算了。

现在 fθ(x)本身就是 sigmoid 函数,所以这个微分表达式可以直接使用。设 z = θTx,然后再一次使用复合函数的微分会比较好。

 

v 对 z 微分的部分也就是 sigmoid函数的微分。

 z 对 θj 的微分就简单了。

 接下来把结果相乘就好了:

 我们就代入各个结果,然后通过展开、约分,使表达式 变得更简洁。

接下来要做的就是从这个表达式导出参数更新表达式。不过现在是以最大化为目标,所以必须按照与最小化时相反的方向移动参数哦。也就是说,最小化时要按照与微分结果的符号相反的 方向移动,而最大化时要与微分结果的符号同向移动。

 为了与回归时的符号保持一致,也可以将表达式调整为下面这样。注意,η 之前的符号和∑中的符号反转了。这就是我们最终求得的结果表达式:

三、总结 

通过上面的推导,我们学习了最大似然函数,这与我们之前接触的最小二乘法不同,最小二乘法以误差作为评判标准,误差越小越好,而最大似然函数以概率作为评判标准,概率越大越好。在计算概率时,我们求了一次对数log计算,避免了连乘概率越来越小,受计算机计算进度影响也越来越大的问题。求得表达式之后的求微分也和我们之前讲的相似,只要采用连续偏导就可以了。计算过程挺复杂,不过最后的结果还挺简单的:

本文链接地址:https://www.jiuchutong.com/zhishi/293126.html 转载请保留说明!

上一篇:window.location.href的用法(window.location.href返回值)

下一篇:日落时的悬日现象,美国芝加哥 (© Razvan Sera/Amazing Aerial Agency)(日落时有什么变化)

  • 网站推广的有效宣传方式(网站推广的方法有哪几种)

    网站推广的有效宣传方式(网站推广的方法有哪几种)

  • 海尔小优怎么连接网络(海尔小优怎么连接海信电视)

    海尔小优怎么连接网络(海尔小优怎么连接海信电视)

  • 苹果xr有nfc功能吗(苹果xr有nfc功能怎么用)

    苹果xr有nfc功能吗(苹果xr有nfc功能怎么用)

  • oppor11怎样关闭后后运行程序(oppor11怎样关闭拍照声音)

    oppor11怎样关闭后后运行程序(oppor11怎样关闭拍照声音)

  • 苹果手机侧面鼓了起来(苹果手机侧面鼓起来了还能用吗)

    苹果手机侧面鼓了起来(苹果手机侧面鼓起来了还能用吗)

  • 无线鼠标充电时开关应该开着还是关着(无线鼠标充电时显示蓝色正常吗)

    无线鼠标充电时开关应该开着还是关着(无线鼠标充电时显示蓝色正常吗)

  • 苹果电脑有摄像头吗(苹果电脑有摄像头为什么检测不到摄像头)

    苹果电脑有摄像头吗(苹果电脑有摄像头为什么检测不到摄像头)

  • zip跟rar有区别吗(zip和rar一样吗)

    zip跟rar有区别吗(zip和rar一样吗)

  • 有全家福还用集五福吗(全家福是不是每个人都有)

    有全家福还用集五福吗(全家福是不是每个人都有)

  • 荣耀hryal00ta是什么型号(荣耀hry-al00a是什么型号的手机)

    荣耀hryal00ta是什么型号(荣耀hry-al00a是什么型号的手机)

  • 苹果6代是什么手机(苹果6代是什么意思)

    苹果6代是什么手机(苹果6代是什么意思)

  • 华为怎么改时间(华为怎么改时间为24小时)

    华为怎么改时间(华为怎么改时间为24小时)

  • ipad1954是什么型号(ipada1954是2018款么)

    ipad1954是什么型号(ipada1954是2018款么)

  • 哪些手机有3d touch功能(哪些手机有nfc功能)

    哪些手机有3d touch功能(哪些手机有nfc功能)

  • 华为blaal00是什么机型(华为blaal00是什么型号手机)

    华为blaal00是什么机型(华为blaal00是什么型号手机)

  • 怎么找刷过的抖音(怎样找刷过的抖音)

    怎么找刷过的抖音(怎样找刷过的抖音)

  • word怎么竖着打数字(word怎么竖着打字)

    word怎么竖着打数字(word怎么竖着打字)

  • 苹果6s尺寸(苹果6s尺寸长宽多少厘米)

    苹果6s尺寸(苹果6s尺寸长宽多少厘米)

  • 手机注册怎么改ip(手机注册怎么改实名认证)

    手机注册怎么改ip(手机注册怎么改实名认证)

  • xr长多少厘米(xr长多少cm)

    xr长多少厘米(xr长多少cm)

  • 苹果相机声音怎么关(苹果相机声音怎么没有了)

    苹果相机声音怎么关(苹果相机声音怎么没有了)

  • 支付宝查steam交易账单(怎么在支付宝上查steam购买记录)

    支付宝查steam交易账单(怎么在支付宝上查steam购买记录)

  • 华为p30pro有什么特别功能(华为p30pro有什么新功能)

    华为p30pro有什么特别功能(华为p30pro有什么新功能)

  • 手机怎样调成无法接通(手机怎样调成无信号)

    手机怎样调成无法接通(手机怎样调成无信号)

  • 闲鱼币有什么用处(闲鱼币有什么用可以换钱吗)

    闲鱼币有什么用处(闲鱼币有什么用可以换钱吗)

  • 苹果xgps弱是怎么回事(苹果xgps信号弱怎么办可以修复吗)

    苹果xgps弱是怎么回事(苹果xgps信号弱怎么办可以修复吗)

  • 月入2万的10个小生意,创意是最赚钱的生意(月入2万的10个小生意低成本)

    月入2万的10个小生意,创意是最赚钱的生意(月入2万的10个小生意低成本)

  • Python雪花代码(python雪花算法生成id)

    Python雪花代码(python雪花算法生成id)

  • 增值税专票开错了可以作废吗
  • 实际发生的坏账准备可以税前扣除吗
  • 为什么要交税钱
  • 2020年个税申报流程视频
  • 小规模纳税人残保金
  • 其他业务成本影响营业成本吗
  • 外购软件用于销售的会计分录
  • 资本回收系数等于什么系数与利率之和
  • 商贸公司可以用加工厂的商标委托加工生产吗
  • 收到网站招聘费专票如何做账务处理?
  • 没有税收编码的发票怎么开具红字票
  • 利息费用需要取消吗
  • 银行存款日记账最后一行怎么填
  • 纳税调整后所得怎么算
  • 工会经费计入应付职工薪酬
  • 一般纳税人收小规模普票可以算成本吗
  • 非独立核算的公司怎么报税
  • 营改增土地增值税的计算
  • 民非企业补贴收入要缴纳增值税会计分录怎么写?
  • 纳税人核定征收企业所得税
  • 当期免抵税额和当期留抵税额
  • 政府会计制度事业单位会计制度
  • 境内企业技术转让 增值税
  • 企业的其他业务收入有
  • 补贴收入是否缴税
  • 增值税专用发票查询系统官方网站
  • 合并报表抵消分录实例
  • 费用发生了 没有发票该如何记账
  • php设计模式六大原则
  • 所得税时间性差异与暂时性差异
  • 企业接受现金捐赠要交税吗
  • 债权类股票有哪些
  • 悬崖边上的门
  • 卡特迈国家公园熊吃人
  • 项目辅材计入什么科目
  • 公司有个税怎么交
  • 如何自定义smartart
  • 简易html代码
  • 商贸公司如何结转销售成本
  • 融资租入固定资产
  • 印花税没交会怎么样
  • 小微企业增值税免税政策2023年
  • 母公司可以免子女税吗
  • 织梦怎么调用当前栏目下的文章
  • mongodb replica set 配置高性能多服务器详解
  • 企业所得税的会计处理怎么做
  • 申请个体工商户流程
  • 现金流量表的编制公式 计算公式
  • 个人独资企业计提的各种准备金支出不得扣除
  • 银行日记账期初余额写哪儿
  • 一般纳税人可以开3%的发票吗
  • 折旧后的剩余价值叫什么
  • 外贸公司美金账户开立要求
  • 外币账户结汇至人民币账户
  • 公户转私户的钱会退回吗
  • 利润表的未分配利润是哪个
  • 汽车折旧年限及残值率是多少
  • 新准则建筑业会计核算
  • 分公司从业人数填越少越好吗
  • mysql获取当前时间
  • 配置windows server essentials出错
  • 关于操作系统的叙述中
  • 2014年电脑装win7与win10
  • linux 系统查看
  • win7旗舰版显示器亮度调节
  • Win7系统桌面图标变小
  • powershow是什么意思
  • linux开启ssh服务失败
  • javascript总结
  • node.js基础入门
  • Android中的数据存储方式有五种,分别是
  • opengl入门教程
  • 微信小程序实现文件上传
  • js动态生成页面
  • jQuery使用$.ajax进行即时验证的方法
  • vim tagbar
  • jquery判断数据类型
  • 国家税务总局2012年20号公告
  • 浙江省国税公务员工资
  • 税务局三方协议变更
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设