位置: IT常识 - 正文

神经网络的学习率如何选择?(神经网络浅讲)

编辑:rootadmin
神经网络的学习率如何选择? 文章目录学习率的概念学习率的选择方法参考资料学习率的概念

推荐整理分享神经网络的学习率如何选择?(神经网络浅讲),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:人工智能神经网络算法,神经网络知识,神经网络讲解与实例,神经网络 入门,神经网络浅讲,神经网络 入门,神经网络 入门,人工神经网络,内容如对您有帮助,希望把文章链接给更多的朋友!

这里的学习率指的是深度学习神经网络训练过程中选取的一个超参数。 学习率作为参数更新时的一个乘数项,可以影响网络训练的速度,或者说是每次迈步的大小。 可以这样理解,如果学习率过大,那么步子就会很大,容易越过了正确答案,从一个错误到另一个错误;如果学习率过小,那么步子就很小,训练很慢,而且不容易跳出局部最优解。如下图所示。 可以看出小学习率会进入局部最优解中,但是它也跳不出去。大的学习率无法进入局部最优,甚至随着训练越来越坏。

学习率的选择方法

学习率的选择更多的依靠经验。那么除了经验之外呢?

https://arxiv.org/abs/1506.01186 上面的论文提出了一种方法来寻找初始学习率。

神经网络的学习率如何选择?(神经网络浅讲)

首先我们设置一个非常小的初始学习率,比如1e-5(还可以更小),然后在每个batch之后都更新网络,同时增加学习率,统计每个batch计算出的loss。最后我们可以描绘出学习的变化曲线和loss的变化曲线,从中就能够发现最好的学习率。

从上面的图片可以看到,随着学习率由小不断变大的过程,网络的loss也会从一个相对大的位置变到一个较小的位置,同时又会增大,这也就对应于我们说的学习率太小,loss下降太慢,学习率太大,loss有可能反而增大的情况。从上面的图中我们就能够找到一个相对合理的初始学习率,0.1。

之所以上面的方法可以work,因为小的学习率对参数更新的影响相对于大的学习率来讲是非常小的,比如第一次迭代的时候学习率是1e-5,参数进行了更新,然后进入第二次迭代,学习率变成了5e-5,参数又进行了更新,那么这一次参数的更新可以看作是在最原始的参数上进行的,而之后的学习率更大,参数的更新幅度相对于前面来讲会更大,所以都可以看作是在原始的参数上进行更新的。正是因为这个原因,学习率设置要从小变到大,而如果学习率设置反过来,从大变到小,那么loss曲线就完全没有意义了。

另外还有两种方法见参考资料一。

参考资料

https://baijiahao.baidu.com/s?id=1662117095018026462&wfr=spider&for=pc https://blog.csdn.net/m0_37789876/article/details/85248565 https://blog.csdn.net/u010087338/article/details/122949354 https://zhuanlan.zhihu.com/p/31424275

本文链接地址:https://www.jiuchutong.com/zhishi/300821.html 转载请保留说明!

上一篇:WebSocket(websocket怎么读)

下一篇:机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

  • 税控盘减免税款月末如何结转
  • 税负是什么意思举例子说明
  • 银行进账单票据号码在哪里
  • 个人所得税扣缴申报表
  • 电梯广告租赁属于哪类
  • 会计凭证前面放什么
  • 小规模纳税人开普票要交税吗
  • 境外机构可以开通b股账户
  • 管理费用科目代码
  • 债务转为股份的协议
  • 购进货物取得
  • 个体工商户年末计提的工资,次年怎么算
  • 没有三方协议怎么缴纳社保
  • 制作费算什么费用
  • 财付通交易手续费多少
  • 没有经营的空壳公司可以贷款吗
  • 股权转让企业所得税如何申报
  • 往年计提有误 跨年处理
  • 固定资产什么时候增加
  • 计提附加税的会计分录怎么写
  • 会计调账必须写说明吗
  • 视同销售收入计入会计利润中吗
  • 利用退休人员避孕措施
  • 基地建设费归哪个会计科目
  • 怎么使用Windows安装器安装Windows10
  • 汇兑损益怎么记账
  • 资产负债表中的固定资产是原值还是净值
  • 经济作物国家有什么补助吗
  • 软件服务费怎么算
  • 一般纳税人资质证明文件去哪打印
  • imac夜间模式
  • laslajas大教堂
  • php用mysql连接数据库并查询
  • php最安全的登录功能
  • javascript控制语句
  • flex布局用法
  • apdl命令流手册下载
  • 股东出资方式包括
  • 对公账户怎么打印
  • 归还股东投资款
  • 以前年度多计提折旧
  • python并发和并行
  • PHP MongoDB GridFS 存储文件的方法详解
  • 支付劳务费会计科目怎么写
  • 跨年取得的发票金额大于暂估金额
  • 清包工一般计税如何开票
  • 个人经营所得税率
  • 鲜花虫草开发票属于什么类别?
  • mysql proxy问题的解决方法
  • 公司注销后实收资本要交税吗
  • 存货跌价准备是什么意思
  • 商场活动经费预算
  • 质量问题的扣款计入什么科目
  • 房地产公司退房款怎么做账
  • 什么是批发零售市场
  • 业务招待算什么费用
  • 如何理解现金折扣
  • 期末留抵税额会计分录
  • sqlserver表死锁
  • CentOS中httpd源代码安装与测试步骤分享
  • os x10.11el capitan beta5更新了什么?os x10.11el capitan beta5下载地址
  • linux AS3 oracle9i 安装指南
  • kill强制结束进程的参数
  • Windowsxp桌面没有图标怎么办
  • windows10的操作中心
  • linux中安装命令
  • javascript学习指南
  • ExtJS中设置下拉列表框不可编辑的方法
  • disk指令
  • 前端自动化开发软件
  • unity做app
  • python语言面向过程吗
  • services的翻译
  • 如何搭建python项目架构
  • 沈阳税务局兑奖中心在哪
  • 广东省电子学校
  • 如何查询税控盘口令和密码
  • 企业税收筹划中的涉税风险及其防范
  • 政府对国税局的支持
  • 疫情期间增值税税率
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设