位置: IT常识 - 正文

神经网络的学习率如何选择?(神经网络浅讲)

编辑:rootadmin
神经网络的学习率如何选择? 文章目录学习率的概念学习率的选择方法参考资料学习率的概念

推荐整理分享神经网络的学习率如何选择?(神经网络浅讲),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:人工智能神经网络算法,神经网络知识,神经网络讲解与实例,神经网络 入门,神经网络浅讲,神经网络 入门,神经网络 入门,人工神经网络,内容如对您有帮助,希望把文章链接给更多的朋友!

这里的学习率指的是深度学习神经网络训练过程中选取的一个超参数。 学习率作为参数更新时的一个乘数项,可以影响网络训练的速度,或者说是每次迈步的大小。 可以这样理解,如果学习率过大,那么步子就会很大,容易越过了正确答案,从一个错误到另一个错误;如果学习率过小,那么步子就很小,训练很慢,而且不容易跳出局部最优解。如下图所示。 可以看出小学习率会进入局部最优解中,但是它也跳不出去。大的学习率无法进入局部最优,甚至随着训练越来越坏。

学习率的选择方法

学习率的选择更多的依靠经验。那么除了经验之外呢?

https://arxiv.org/abs/1506.01186 上面的论文提出了一种方法来寻找初始学习率。

神经网络的学习率如何选择?(神经网络浅讲)

首先我们设置一个非常小的初始学习率,比如1e-5(还可以更小),然后在每个batch之后都更新网络,同时增加学习率,统计每个batch计算出的loss。最后我们可以描绘出学习的变化曲线和loss的变化曲线,从中就能够发现最好的学习率。

从上面的图片可以看到,随着学习率由小不断变大的过程,网络的loss也会从一个相对大的位置变到一个较小的位置,同时又会增大,这也就对应于我们说的学习率太小,loss下降太慢,学习率太大,loss有可能反而增大的情况。从上面的图中我们就能够找到一个相对合理的初始学习率,0.1。

之所以上面的方法可以work,因为小的学习率对参数更新的影响相对于大的学习率来讲是非常小的,比如第一次迭代的时候学习率是1e-5,参数进行了更新,然后进入第二次迭代,学习率变成了5e-5,参数又进行了更新,那么这一次参数的更新可以看作是在最原始的参数上进行的,而之后的学习率更大,参数的更新幅度相对于前面来讲会更大,所以都可以看作是在原始的参数上进行更新的。正是因为这个原因,学习率设置要从小变到大,而如果学习率设置反过来,从大变到小,那么loss曲线就完全没有意义了。

另外还有两种方法见参考资料一。

参考资料

https://baijiahao.baidu.com/s?id=1662117095018026462&wfr=spider&for=pc https://blog.csdn.net/m0_37789876/article/details/85248565 https://blog.csdn.net/u010087338/article/details/122949354 https://zhuanlan.zhihu.com/p/31424275

本文链接地址:https://www.jiuchutong.com/zhishi/300821.html 转载请保留说明!

上一篇:WebSocket(websocket怎么读)

下一篇:机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

  • 代扣个人借款分录
  • 土地出让金印花税计税依据
  • 合伙企业主要缴纳的税种?
  • 进口货物增值税的组成计税价格是
  • 企业所得税如何做分录
  • 发票货物名称前带星号规定
  • 包装物押金计入成本吗
  • etc扣费与发票不符
  • 由第三方代付款开票给对方合规吗
  • 冲减营业税金及附加的分录
  • 增值税主表填报说明
  • 房屋置换以房换房政策2019
  • 纳税人减免税备案登记表是在税务局领吗
  • 计提贷款损失准备金遵循以下原则
  • 公司购电缆用于生产如何记账?
  • 土地转让增值税计税依据
  • 广告费准予扣除怎么算
  • 企业财务月确定不当造成税务问题
  • 债务免除的税务处理
  • 公司净资产怎么算的
  • 买方投资公司
  • 环评费用计入哪个会计科目
  • 税务专用发票
  • 办理企业土地证要多少钱
  • 与收益相关的政府补助的确认
  • 如何修改电脑默认打印机
  • win10要更新系统
  • 在建工程工程款优先受偿权
  • 生产企业原材料的订购与运输建模
  • 工资薪金专项扣除项各多少
  • php常用的技术栈
  • 法人变更涉及到什么
  • ue4安装插件
  • 进程控制块PCB不包括( )
  • 收到供应商现金回扣
  • 普通发票主营业务收入销项负数发票怎么做账
  • 同一控制下的控股合并与非同一控制下的控股合并
  • 应收股利的主要特点
  • 提足折旧仍使用的逾龄房产是否交房产税
  • 百家论坛是正规期刊吗
  • css怎么让文字垂直居中显示
  • 用python绘制
  • 退休人员发绩效
  • 房产自用改为出租如何申报房产税
  • 清算汇缴报表填写范本
  • 不能税前扣除的业务招待费怎么处理
  • short int、long、float、double使用问题说明
  • sql脚本语言怎么写
  • 并发环境下,共享资源的正确使用方式是
  • 增值税附加税的比例
  • 记账凭证核算形式
  • 老板自己的钱给公司
  • 低值易耗品的管理流程
  • 税收完税证明怎么做账
  • 结转税金需要附件吗
  • 普通发票冲红重开要多久
  • 暂估销售收入账目
  • 如何查询对方是否起诉离婚
  • 未达起征点怎么报税
  • 预收账款账务处理流程图
  • 股东之间转让股权有优先购买权吗
  • 企业为什么要设置仓库
  • centos 6.6安装教程
  • linux系统中用户可以分为三种
  • win10连无线网络受限
  • win7无法删除d盘
  • 刷新页面jquery
  • python加密模块
  • nodejs 回调
  • unity shader lod
  • jquery技巧
  • python3.9怎么用
  • python项目打包发布
  • 仓储用地和物流用地划分
  • 印花税为什么不计入资产成本
  • 美国有汽车吗
  • 地方税务局几点下班
  • 轮胎消费税的征收环节
  • 运输类增值税
  • 个人所得税计算扣除五险一金吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设