位置: IT常识 - 正文

神经网络的学习率如何选择?(神经网络浅讲)

编辑:rootadmin
神经网络的学习率如何选择? 文章目录学习率的概念学习率的选择方法参考资料学习率的概念

推荐整理分享神经网络的学习率如何选择?(神经网络浅讲),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:人工智能神经网络算法,神经网络知识,神经网络讲解与实例,神经网络 入门,神经网络浅讲,神经网络 入门,神经网络 入门,人工神经网络,内容如对您有帮助,希望把文章链接给更多的朋友!

这里的学习率指的是深度学习神经网络训练过程中选取的一个超参数。 学习率作为参数更新时的一个乘数项,可以影响网络训练的速度,或者说是每次迈步的大小。 可以这样理解,如果学习率过大,那么步子就会很大,容易越过了正确答案,从一个错误到另一个错误;如果学习率过小,那么步子就很小,训练很慢,而且不容易跳出局部最优解。如下图所示。 可以看出小学习率会进入局部最优解中,但是它也跳不出去。大的学习率无法进入局部最优,甚至随着训练越来越坏。

学习率的选择方法

学习率的选择更多的依靠经验。那么除了经验之外呢?

https://arxiv.org/abs/1506.01186 上面的论文提出了一种方法来寻找初始学习率。

神经网络的学习率如何选择?(神经网络浅讲)

首先我们设置一个非常小的初始学习率,比如1e-5(还可以更小),然后在每个batch之后都更新网络,同时增加学习率,统计每个batch计算出的loss。最后我们可以描绘出学习的变化曲线和loss的变化曲线,从中就能够发现最好的学习率。

从上面的图片可以看到,随着学习率由小不断变大的过程,网络的loss也会从一个相对大的位置变到一个较小的位置,同时又会增大,这也就对应于我们说的学习率太小,loss下降太慢,学习率太大,loss有可能反而增大的情况。从上面的图中我们就能够找到一个相对合理的初始学习率,0.1。

之所以上面的方法可以work,因为小的学习率对参数更新的影响相对于大的学习率来讲是非常小的,比如第一次迭代的时候学习率是1e-5,参数进行了更新,然后进入第二次迭代,学习率变成了5e-5,参数又进行了更新,那么这一次参数的更新可以看作是在最原始的参数上进行的,而之后的学习率更大,参数的更新幅度相对于前面来讲会更大,所以都可以看作是在原始的参数上进行更新的。正是因为这个原因,学习率设置要从小变到大,而如果学习率设置反过来,从大变到小,那么loss曲线就完全没有意义了。

另外还有两种方法见参考资料一。

参考资料

https://baijiahao.baidu.com/s?id=1662117095018026462&wfr=spider&for=pc https://blog.csdn.net/m0_37789876/article/details/85248565 https://blog.csdn.net/u010087338/article/details/122949354 https://zhuanlan.zhihu.com/p/31424275

本文链接地址:https://www.jiuchutong.com/zhishi/300821.html 转载请保留说明!

上一篇:WebSocket(websocket怎么读)

下一篇:机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

  • 增值税金税盘开票的结论
  • 小规模纳税人要交增值税吗
  • 什么叫简易税
  • 所得税费用怎么算分录
  • 什么情况下一般纳税人可以简易征收
  • 增值税普通发票几个点
  • 开业费用属于什么费用
  • 公司购买的打印机
  • 境内公司取得境外收入
  • 耕地占用税的纳税人是谁
  • 一般纳税人如何抵扣进项税
  • 经纪代理服务怎么做分录
  • 小规模纳税人购车好处
  • 事业单位专项资金的管理要求
  • 包装报废会计处理
  • 购进货物用于免征增值税项目
  • 支付境外费用需要交哪些税
  • 培训发票可以抵进项税吗
  • 个体户交税起征点 2023年
  • 自助设备使用费会计科目
  • 1697509099
  • 此次新政策对原来就是小型微利企业的纳税人有影响吗?
  • 注册资本认缴制开始实施时间
  • 收到小额支付转账什么意思
  • windows10不会自动锁屏
  • 结转应交增值税会计科目
  • 别的公司代缴社保合法
  • 农作物种植销售
  • 环评费入账的会计分录是什么啊
  • 公司运输车辆加油会计分录
  • 物流运输公司要交税吗
  • php防止网站被攻击怎么办
  • 企业若需要给客户交税
  • regsync.exe - regsync是什么进程 有什么用
  • 亡灵节mid
  • 如何计算企业年度人均产值
  • nodejs安装教程
  • 全资子公司取得注册证可以免临床
  • php分片上传文件
  • 销售下脚料所收的费用
  • 银行贷款用途能改吗
  • 浅谈php中其他类的使用
  • thinkphp3.0
  • 没有发票的支出可以扣除企业所得税么
  • c语言中有哪些循环结构
  • 政府补助的核算内容有哪些
  • 材料采购与原材料账户核算内容有何差别
  • 百旺金赋服务费不交会怎么样?
  • 高新企业申报条件有哪些
  • 一般纳税人未申报可以开票吗
  • 永久性差异有哪些项目
  • 残保金申报基数
  • 油卡预付卡发票能入费用吗怎么入账
  • 损益类科目如何记忆
  • 机票改签手续费能报销吗
  • 大额往来款项的认定
  • 排污费主要用于哪些方面
  • 国家也通过国有企业利用自己的财政资金
  • 五证合一的办理流程是什么
  • 快速插入大量数据的asp.net代码(Sqlserver)
  • sql数据库分布式部署
  • mysql 5.7.18 winx64安装配置方法图文教程
  • 电脑win7win8win10操作系
  • centos5.8服务器
  • win10病毒与防护
  • win7更改电脑设置在哪里
  • win8.1使用教程
  • ipcservice.dll是什么?
  • win8如何激活
  • cocos creator js ts
  • 批处理命令修改ip
  • [置顶]星陨计划
  • 精仿和媲美专柜有什么区别
  • javascript教程 csdn
  • android 高德地图收费
  • android实战项目
  • python如何编程
  • 个人所得税对什么征税
  • 广东省电子税务局网上办税大厅
  • 嘉定办证中心营业时间
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设