位置: IT常识 - 正文

随机梯度下降算法 入门介绍(最通俗易懂)(随机梯度下降算法优缺点)

编辑:rootadmin
随机梯度下降算法 入门介绍(最通俗易懂) 文章目录1.什么是梯度2.什么是梯度下降算法3.什么是随机梯度下降算法1.什么是梯度

推荐整理分享随机梯度下降算法 入门介绍(最通俗易懂)(随机梯度下降算法优缺点),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:随机梯度下降算法优缺点,随机梯度下降算法优缺点,随机梯度下降算法,每次迭代时,使用一个样本,随机梯度下降算法,每次迭代时,使用一个样本,随机梯度下降算法英文全称,随机梯度下降算法英文全称,随机梯度下降算法公式,随机梯度下降算法公式,内容如对您有帮助,希望把文章链接给更多的朋友!

首先给出高数课程中梯度的定义:

如果对上面的定义没有理解也没有关系,用通俗的语言来说,梯度实际上就是一个向量,向量中的各个元素表示多元函数在某一个点对于其中一个自变量的偏导数。

例如,给出一个函数:f(x)=ln(x²+y²+z²),求出该函数在点(1,2,-2)处的梯度,计算过程如下:

计算在该点处函数f(x)对于变量x、y、z的偏导数。计算出的结果分别为2/9,4/9和-4/9。对偏导数进行拼接,所以该函数在该点的梯度为(2/9,4/9,-4/9)。2.什么是梯度下降算法

梯度下降算法是一种对损失函数进行优化来得到使得损失函数值最小的机器学习模型的一种算法。也就是说,梯度下降算法是一种用来在机器学习中求解最佳模型的算法。

这么说可能还不是特别好理解,我们从简单的开始,先介绍梯度下降算法的退化版“斜率下降算法”。

假设一个函数的图像如下图所示,在无法直接到达最低点的情况下,如何计算出函数的最小值?

首先需要考虑前进的方向。

假设这样一种情形。当你在一次爬山过程中突然起了大雾,此时想下山的你已经看不清下山的路应该往什么方向走,只能看清眼前很近距离内的路,你应该怎么办才能尽可能地走到山脚?

这时你可以采取这样一种措施:观察眼前的路,如果是下坡路就顺着向下走,走一段距离后再进行一次相同的判断。这样循环往复,你最有可能顺着下坡路成功下山。如果走到一个地方后没有下坡路而是平路了,那么此时你就可以认为自己已经到山脚了。

如果你能够理解上面下山的过程,那么你就明白了梯度下降算法的本质原理。损失函数相当于一座山,而损失函数的最小值相当于山脚,也就是山高度最低的地方,求出损失函数的最小值的过程就相当于从山上的某个地方开始找到下山的路。

假设我们的起点在上图中绿色点标记处,为了能向下走,我们需要判断下坡的方向。而在函数图像中,可以通过斜率判断下坡的方向,因为斜率为负数的方向函数值会减小,也就是我们要走的方向,所以本题中首先需要确定:为了找到最小值,我们需要向右走,也就是增大b值。

随机梯度下降算法 入门介绍(最通俗易懂)(随机梯度下降算法优缺点)

我们确定了前进的方向之后,那就得判断再下一次判断之前,我们要在这个方向走多远。

同样可以这么考虑:下坡路越陡,我们越有把握认为这条路可以走到山脚,因此可以一次性沿着这条路走得更远;相对应的,如果下坡路很平缓,我们就会对这条路是否是通往山脚产生一定的怀疑,因此在下一次判断之前,并不会沿着这条路走太远。

在函数上也是这样体现:如果该点下降方向的斜率绝对值大,那么我们一次就会移动得多一点;如果该点下降方向的斜率绝对值小,那么我们一次就会移动少一点。

为了方便控制下坡的速度,我们还需要引入学习率这个变量。

学习率可以这样理解:学习率大,相当于我们是大跨步下山的;学习率小,相当于我们是一步一步挪下山的。

学习率不是一个自动生成的值,需要手动进行设置。类似于下山的人需要自行决定是大步走还是小步走。

通过上面的分析,我们可以得出更新坐标b的公式:

对上面的公式进行几点解释:

普适性:无论当前点斜率是正数还是负数,上面的公式都成立。步长控制:步长由当前点的斜率和学习率共同确定。

上面的算法过程,就可以认为是梯度下降算法的退化版“斜率下降算法”。梯度下降算法的过程与“斜率下降算法”完全类似,只不过对于每一个维度(也就是函数中的每一个自变量)都进行一次上面的过程。

相当于下山的过程中,你不仅要考虑向前还是向后是下坡路,同时还要考虑向左还是向右是下坡路,因为最后你走的方向可能是左前方、右后方等而不是直接向着一个单一方向。

上述所述的情况都是针对一个样本点而言对其损失函数进行梯度下降求解,但是实际应用中并非使用损失函数,而是求解使得损失函数在各个样本点的梯度平均值函数值最小的模型参数。损失函数在各个样本点的梯度平均值函数被称为风险函数。

3.什么是随机梯度下降算法

上面我们已经说过,传统梯度下降算法(也称为批量梯度下降算法)中每一次进行判断时都需要计算损失函数在各个样本点的梯度平均值,由此可以得出:

当样本点个数很多时,梯度下降算法逐一的计算过程会耗费大量时间。

同时,这么多的计算结果,如果需要全部保存下来,那么占用的存储空间也是很大的。

因此,对批量梯度下降算法进行改进就得到了随机梯度下降算法。

随机梯度下降算法和批量梯度下降算法的区别在于:随机梯度算法每次只使用少数几个样本点(每次不重复)的梯度的平均值就更新一次模型;而批量梯度下降算法需要使用所有样本点的梯度的平均值更新模型。

因此,随机梯度下降算法的效率明显提高,目前已经得到了广泛应用。

本文链接地址:https://www.jiuchutong.com/zhishi/299281.html 转载请保留说明!

上一篇:Win11退回Win10没反应怎么办?Win11退回Win10没反应的解决方法(win11 退回)

下一篇:人工智能学习——模糊控制(学人工智能哪家机构比较好)

  • 电脑ip地址设置(电脑ip地址)(电脑ip地址设置为多少)

    电脑ip地址设置(电脑ip地址)(电脑ip地址设置为多少)

  • lumia 1520(lumia822)

    lumia 1520(lumia822)

  • 微博封面怎么换(微博封面怎么换顺序)

    微博封面怎么换(微博封面怎么换顺序)

  • 腾讯视频杜比视听在哪打开(腾讯视频杜比视界)

    腾讯视频杜比视听在哪打开(腾讯视频杜比视界)

  • iphone13无线充电怎么设置(iphone13无线充电动画)

    iphone13无线充电怎么设置(iphone13无线充电动画)

  • nex突然不能用指纹功能了(nexa指纹用不了怎么办)

    nex突然不能用指纹功能了(nexa指纹用不了怎么办)

  • 抖音听歌识曲(抖音听歌识曲功能在哪)

    抖音听歌识曲(抖音听歌识曲功能在哪)

  • 高清语音通话收费吗(高清语音通话收费吗电信)

    高清语音通话收费吗(高清语音通话收费吗电信)

  • 快手下载到本地的视频在哪里(快手下载到本地的图标怎么去掉)

    快手下载到本地的视频在哪里(快手下载到本地的图标怎么去掉)

  • 服务器关闭是什么意思(服务器关停)

    服务器关闭是什么意思(服务器关停)

  • 计算机的组成部分是什么(计算机的组成部分有哪些图片)

    计算机的组成部分是什么(计算机的组成部分有哪些图片)

  • wps账号可以几个人用(wps一个账号可以登录几台设备)

    wps账号可以几个人用(wps一个账号可以登录几台设备)

  • xsmax怎么用指纹解锁(苹果xs max怎么用指纹)

    xsmax怎么用指纹解锁(苹果xs max怎么用指纹)

  • 红米note8pro怎么设置呼吸灯颜色(红米note8pro怎么插双卡)

    红米note8pro怎么设置呼吸灯颜色(红米note8pro怎么插双卡)

  • 苹果备忘录背景颜色(苹果备忘录背景纹理怎么设置)

    苹果备忘录背景颜色(苹果备忘录背景纹理怎么设置)

  • 拼多多怎么复制口令(拼多多怎么复制商品链接)

    拼多多怎么复制口令(拼多多怎么复制商品链接)

  • 华为p30是不是5g(华为p30是不是5g网络)

    华为p30是不是5g(华为p30是不是5g网络)

  • vivoy7s处理器是什么(vivoy7s处理器是啥)

    vivoy7s处理器是什么(vivoy7s处理器是啥)

  • 华为mate20和p30区别(华为mate20和p30哪个性价比高)

    华为mate20和p30区别(华为mate20和p30哪个性价比高)

  • 进程是什么(线程是什么意思)

    进程是什么(线程是什么意思)

  • 大格洛克纳山山峰前的土拨鼠,奥地利 (© SeppFriedhuber/Getty Images)(克洛格森林大克洛格)

    大格洛克纳山山峰前的土拨鼠,奥地利 (© SeppFriedhuber/Getty Images)(克洛格森林大克洛格)

  • YOLOv8(n/s/m/l/x)&YOLOv7(yolov7-tiny/yolov7/yolov7x)&YOLOv5(n/s/m/l/x)不同模型参数/性能对比(含训练及推理速度)

    YOLOv8(n/s/m/l/x)&YOLOv7(yolov7-tiny/yolov7/yolov7x)&YOLOv5(n/s/m/l/x)不同模型参数/性能对比(含训练及推理速度)

  • Code For Better 谷歌开发者之声——初识Web与谷歌,拉起兴趣之心。

    Code For Better 谷歌开发者之声——初识Web与谷歌,拉起兴趣之心。

  • 理解vuex实现的原理(vuex用法和原理)

    理解vuex实现的原理(vuex用法和原理)

  • 进项税额转出补交税款
  • 什么企业的纳税最多
  • 如何办理车辆购置置换补贴手续
  • 进项税额转出期限是多少
  • 政府返还的个税怎么算
  • 现金折扣销售退回的会计分录
  • 公司员工出差发工资吗
  • 顺流交易为什么不管是否出售
  • 免税的苗木发票抵扣税费怎么算
  • 售后回租有风险吗
  • 有税收完税证明还需要发票吗
  • 筹建期如何界定
  • 出现一窗式比对失败,该纳税人没有防伪税控比对信息!
  • 增值税如何进行抵扣
  • 7月1日发票新规定
  • 从农民手里收的钱叫什么
  • 损益类科目的借方表示
  • 企业新建厂房
  • 百旺税控怎么赋码
  • tp link无线路由器设置
  • macbook无限输入z
  • win10删除了此电脑
  • 商品流通企业会计科目表
  • 固定资产清理的借贷方向表示什么
  • php能开发微信小程序吗
  • service的启动方式及生命周期
  • 耕地开垦费应计入哪个会计科目
  • html盒子边框圆角
  • 如何判断公众号是否可靠
  • 利息收入如何会计分录
  • php遍历目录
  • stat命令的作用
  • gunzip命令压缩
  • 程序员35岁 知乎
  • phpcms二次开发教程
  • mongodb局域网访问
  • python insert方法
  • 进口税 增值税
  • 福利费要分部门吗
  • 劳务分包属于人工成本吗
  • 未交增值税借方余额怎么调整
  • 捐赠货物的增值税可以税前扣除吗
  • 固定资产处置的会计科目
  • 进项税额转出的所有会计分录
  • 应付职工薪酬账户期初余额为4000元
  • 运费账务怎么处理
  • 采购库存商品的分录
  • 小规模纳税人从三万到十万
  • 商品折扣计入哪个科目
  • 季度的工会经费怎么算
  • 工程施工中购入固定资产
  • 购买药材的发票如何抵扣?
  • 职工体检费如何报销
  • 简单介绍春节的风俗
  • 在MySQL中同时查找两张表中的数据的示例
  • sqlserver备份数据库命令
  • 建立mysql
  • sql server 数据
  • 如何用u盘装系统win10
  • linux的ntp服务
  • centos安装选择哪个
  • w7系统怎么扫描
  • rtlrack.exe - rtlrack是什么进程 有什么用
  • windows10周年纪念版
  • win8怎么进入桌面系统
  • jquery 写文件
  • ubuntu libtorch
  • 仿百度首页html代码静态
  • js 正则replace
  • unity网络通信框架
  • 安卓打包安装程序apk
  • python中函数的功能及作用
  • 贵州省地方税务局房地产税收征收管理办法
  • 税务总局着装管理办法
  • 税务局大厅咨询台
  • 管道运输企业的核心指标是
  • 试验费属于什么税收编码
  • 平板电脑购物
  • 北京国税局电话客服热线
  • 怎么删除天眼查的犯罪记录
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设