位置: IT常识 - 正文

神经网络的学习率如何选择?(神经网络浅讲)

编辑:rootadmin
神经网络的学习率如何选择? 文章目录学习率的概念学习率的选择方法参考资料学习率的概念

推荐整理分享神经网络的学习率如何选择?(神经网络浅讲),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:人工智能神经网络算法,神经网络知识,神经网络讲解与实例,神经网络 入门,神经网络浅讲,神经网络 入门,神经网络 入门,人工神经网络,内容如对您有帮助,希望把文章链接给更多的朋友!

这里的学习率指的是深度学习神经网络训练过程中选取的一个超参数。 学习率作为参数更新时的一个乘数项,可以影响网络训练的速度,或者说是每次迈步的大小。 可以这样理解,如果学习率过大,那么步子就会很大,容易越过了正确答案,从一个错误到另一个错误;如果学习率过小,那么步子就很小,训练很慢,而且不容易跳出局部最优解。如下图所示。 可以看出小学习率会进入局部最优解中,但是它也跳不出去。大的学习率无法进入局部最优,甚至随着训练越来越坏。

学习率的选择方法

学习率的选择更多的依靠经验。那么除了经验之外呢?

https://arxiv.org/abs/1506.01186 上面的论文提出了一种方法来寻找初始学习率。

神经网络的学习率如何选择?(神经网络浅讲)

首先我们设置一个非常小的初始学习率,比如1e-5(还可以更小),然后在每个batch之后都更新网络,同时增加学习率,统计每个batch计算出的loss。最后我们可以描绘出学习的变化曲线和loss的变化曲线,从中就能够发现最好的学习率。

从上面的图片可以看到,随着学习率由小不断变大的过程,网络的loss也会从一个相对大的位置变到一个较小的位置,同时又会增大,这也就对应于我们说的学习率太小,loss下降太慢,学习率太大,loss有可能反而增大的情况。从上面的图中我们就能够找到一个相对合理的初始学习率,0.1。

之所以上面的方法可以work,因为小的学习率对参数更新的影响相对于大的学习率来讲是非常小的,比如第一次迭代的时候学习率是1e-5,参数进行了更新,然后进入第二次迭代,学习率变成了5e-5,参数又进行了更新,那么这一次参数的更新可以看作是在最原始的参数上进行的,而之后的学习率更大,参数的更新幅度相对于前面来讲会更大,所以都可以看作是在原始的参数上进行更新的。正是因为这个原因,学习率设置要从小变到大,而如果学习率设置反过来,从大变到小,那么loss曲线就完全没有意义了。

另外还有两种方法见参考资料一。

参考资料

https://baijiahao.baidu.com/s?id=1662117095018026462&wfr=spider&for=pc https://blog.csdn.net/m0_37789876/article/details/85248565 https://blog.csdn.net/u010087338/article/details/122949354 https://zhuanlan.zhihu.com/p/31424275

本文链接地址:https://www.jiuchutong.com/zhishi/300821.html 转载请保留说明!

上一篇:WebSocket(websocket怎么读)

下一篇:机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

  • 项目异地预缴附加税会计分录是?
  • 增值税存量和增量留抵退税
  • 个体户也要做实收资本吗
  • 红字发票开错了已上传如何作废
  • 企业向个人借款是否合法
  • 金蝶迷你版会计科目代码格式
  • 一般纳税人技术服务免税发票怎么开
  • 外管证过期了一个月罚款多少
  • 房地产开发企业资质等级有几个
  • 销售费用包括哪些二级科目
  • 进项税转出申报表能填负数吗
  • 资产减少应注意的问题有哪些?
  • 2021年工作绩效未达标扣工资
  • 当月发票开错了已经红冲怎么做分录?
  • 公司配股后,会迅速提高公司股票市价
  • 补开的银行手续费发票怎么做账
  • 税金及附加是根据什么填列的
  • 进项税额转出年末要结转吗
  • 逃避缴纳税款罪移送公安标准
  • 买烟酒开专票可以抵税吗
  • 企业债券投资利息怎么算
  • 软件产品加安装是混合销售吗?
  • 高新加计扣除怎么做账
  • 加班工资算补贴么
  • 长期闲置的机器叫什么
  • laravel数据迁移
  • 超市预售卡怎么记账
  • uniapp intent
  • 库存股的会计科目
  • 非营利性组织收到政府拨款转出给其他部门怎么做账
  • 应扣未扣应收未收税款是什么意思
  • php写文件函数
  • 利息资本化怎么计算
  • php mysql_real_escape_string addslashes及mysql绑定参数防SQL注入攻击
  • 蓝桥杯官网报名2020
  • PHP模拟http请求的方法详解
  • 售后租回交易的第二年利息怎么算
  • 应收代垫款
  • 金融资产的转换
  • python requests读取服务器响应
  • 生产企业出口自产应税消费品实行什么方法
  • 零税率与免税有关系吗
  • ms sql 2012
  • 纳税人应纳税额怎么算
  • 企业自查发现以什么为主
  • 材料已入库后收回怎么办
  • 工程结算与工程施工
  • 低值易耗品属于周转材料吗
  • 快递费属于办公费吗
  • 汽车折旧年限及残值率是多少
  • 租房开的发票收的税如何做账?
  • windows vista X86 RTM/OEM 中文正式版下载地址
  • windows导航栏在左边
  • solaris vi命令
  • 比较常见的成语有哪些
  • linux配置java环境变量无法保存并退出
  • 常见unix操作系统
  • 电脑windows8怎么样
  • win10大更新2020
  • windows万能wifi
  • win8系统怎么设置桌面
  • 电脑微软拼音输入法
  • win8鼠标速度怎么调
  • linux查看进程并杀死
  • layer关闭当前窗口
  • vim三种模式及其之间的切换
  • dos常用命令与批处理文件
  • 教你用纸折一只会跳的小兔子,非常好玩,小朋友都喜欢
  • vue@cli
  • gradle手动安装
  • python语言怎么用
  • 举例详解民法典第502条
  • 地税局纪检组长黄斌简历
  • 房产的原值以什么为准
  • 税务稽查局稽查财务不在场怎么办
  • 四川国税局局长是谁
  • 电子税务局讲解
  • 公司欠税款,还不上,怎么办
  • 苏州工业园区国资委
  • 云南省2021年退休金计发基数
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设