位置: IT常识 - 正文

深度学习参数初始化(二)Kaiming初始化 含代码

编辑:rootadmin
深度学习参数初始化(二)Kaiming初始化 含代码

推荐整理分享深度学习参数初始化(二)Kaiming初始化 含代码,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

目录

一、介绍

二、基础知识

三、Kaiming初始化的假设条件 

四、Kaiming初始化的简单的公式推导

1.前向传播

2.反向传播

五、Pytorch实现

深度学习参数初始化系列:

(一)Xavier初始化 含代码

(二)Kaiming初始化 含代码

一、介绍

        Kaiming初始化论文地址:https://arxiv.org/abs/1502.01852

        Xavier初始化在ReLU层表现不好,主要原因是relu层会将负数映射到0,影响整体方差。而且Xavier初始化方法适用的激活函数有限:要求关于0对称;线性。而ReLU激活函数并不满足这些条件,实验也可以验证Xavier初始化确实不适用于ReLU激活函数。所以何恺明在对此做了改进,提出Kaiming初始化,一开始主要应用于计算机视觉、卷积网络。

二、基础知识

1.假设随机变量X和随机变量Y相互独立,则有

        (1) 

 2.通过期望求方差的公式, 方差等于平方的期望减去期望的平方.

                (2)

 3.独立变量乘积公式

        (3)

4.连续性随机变量X的概率密度函数为f(x),若积分绝对收敛,则期望公式如下:

                        (4)

三、Kaiming初始化的假设条件 

        与Xavier初始化相似,Kaiming初始化同样适用Glorot条件,即我们的初始化策略应该使得各层的激活值和状态梯度的方差在传播过程中的方差保持一致;Kaiming初始化的参数仍然满足均值是0,且更新的过程中权重的均值一直是0。

        与Xavier初始化不同的,Kaiming初始化不在要求每层输出均值都是0(因为Relu这样的激活函数做不到啊);当然也不再要求f′(0)=1。

        Kaiming初始化中,前向传播和反向传播时各自使用自己的初始化策略,但是保证前向传播时每层的方差和反向传播时梯度的方差都是1。

四、Kaiming初始化的简单的公式推导

        我们使用卷积来进行推导,并且激活函数使用ReLU。

1.前向传播

        对于一层卷积,有:

                        (5)

         其中是激活函数前的输出,是权重的个数,是权重,是输入。

        根据(3)式,可将(4)式推导为:

        (6)

         根据假设,但是是上一层通过ReLU得到的,所以,则:

                (7)

 通过(2)式可得,则(7)式推导为:

深度学习参数初始化(二)Kaiming初始化 含代码

                        (8)

根据期望公式(4), 通过第层的输出来求此期望, 我们有, 其中表示ReLU函数.

                         (9)

其中表示概率密度函数,因为的时候,所以可以去掉小于0的区间, 并且大于0的时候,可推出:

                   (10)

因为是假设在0周围对称分布且均值为0, 所以也是在0附近分布是对称的, 并且均值为0(此处假设偏置为0),则

       (11) 

所以的期望是:

              (12)

 根据公式(2),因为的期望等于0,于是有:

则式(12)推导为:

                        (13)

将(13)式带入(8)式:

                        (14)

从第一层一直往前进行前向传播, 可以得到某层的方差为 :

这里的就是输入的样本, 我们会将其归一化处理, 所以, 现在让每层输出方差等于1, 即:

于是正向传播时,Kaiming初始化的实现就是下面的均匀分布:

高斯分布:

2.反向传播

因为反向传播的时候

                (15)

 其中表示损失函数对其求导. 为参数

根据(3)式:

 其中表示反向传播时输出通道数,最后得出

于是反向传播时,Kaiming初始化的实现就是下面的均匀分布:

高斯分布:

五、Pytorch实现import torchclass DemoNet(torch.nn.Module): def __init__(self): super(DemoNet, self).__init__() self.conv1 = torch.nn.Conv2d(1, 1, 3) print('random init:', self.conv1.weight) ''' kaiming 初始化方法中服从均匀分布 U~(-bound, bound), bound = sqrt(6/(1+a^2)*fan_in) a 为激活函数的负半轴的斜率,relu 是 0 mode- 可选为 fan_in 或 fan_out, fan_in 使正向传播时,方差一致; fan_out 使反向传播时,方差一致 nonlinearity- 可选 relu 和 leaky_relu ,默认值为 。 leaky_relu ''' torch.nn.init.kaiming_uniform_(self.conv1.weight, a=0, mode='fan_out') print('xavier_uniform_:', self.conv1.weight) ''' kaiming 初始化方法中服从正态分布,此为 0 均值的正态分布,N~ (0,std),其中 std = sqrt(2/(1+a^2)*fan_in) a 为激活函数的负半轴的斜率,relu 是 0 mode- 可选为 fan_in 或 fan_out, fan_in 使正向传播时,方差一致;fan_out 使反向传播时,方差一致 nonlinearity- 可选 relu 和 leaky_relu ,默认值为 。 leaky_relu ''' torch.nn.init.kaiming_normal_(self.conv1.weight, a=0, mode='fan_out') print('kaiming_normal_:', self.conv1.weight)if __name__ == '__main__': demoNet = DemoNet()
本文链接地址:https://www.jiuchutong.com/zhishi/300432.html 转载请保留说明!

上一篇:微信小程序获取用户openid(微信小程序获取手机号失败)

下一篇:学习CSS3,使用双旋转实现福到了的迎春喜庆特效(css3知识总结)

  • oppofindx2pro有几种颜色(oppofindx2pro有多强)

    oppofindx2pro有几种颜色(oppofindx2pro有多强)

  • 苹果手机怎么编辑图片马赛克(苹果手机怎么编辑主屏幕图标)

    苹果手机怎么编辑图片马赛克(苹果手机怎么编辑主屏幕图标)

  • windows移动中心没有无线开关(windows移动中心没有无线网)

    windows移动中心没有无线开关(windows移动中心没有无线网)

  • 苹果8p属于什么档次(8p是苹果手机吗)

    苹果8p属于什么档次(8p是苹果手机吗)

  • 长抖音怎么发到朋友圈(怎么往抖音发长视频)

    长抖音怎么发到朋友圈(怎么往抖音发长视频)

  • 苹果usa版是什么意思(苹果美版us)

    苹果usa版是什么意思(苹果美版us)

  • 爱奇艺属于腾讯应用吗(爱奇艺属于腾讯王卡免流吗)

    爱奇艺属于腾讯应用吗(爱奇艺属于腾讯王卡免流吗)

  • qq共同好友怎么关闭(qq共同好友怎么找出来具体的人)

    qq共同好友怎么关闭(qq共同好友怎么找出来具体的人)

  • 文字怎么换行(cad文字怎么换行)

    文字怎么换行(cad文字怎么换行)

  • 小米路由器用户名在哪(小米路由器用户体验计划)

    小米路由器用户名在哪(小米路由器用户体验计划)

  • VIVO连不上iphone11的热点(vivo连不上iphone11的热点)

    VIVO连不上iphone11的热点(vivo连不上iphone11的热点)

  • 计算机前端是什么(计算机前端是什么方向)

    计算机前端是什么(计算机前端是什么方向)

  • 网易云音乐会员到期后下载的歌还能听吗(网易云音乐会员免费领)

    网易云音乐会员到期后下载的歌还能听吗(网易云音乐会员免费领)

  • 抬起唤醒有啥作用(抬起唤醒是什么)

    抬起唤醒有啥作用(抬起唤醒是什么)

  • ipad为什么充电电量不变(ipad为什么充电那么慢)

    ipad为什么充电电量不变(ipad为什么充电那么慢)

  • 双gps手机有哪几款(双gps手机有哪几款真的导航好吗?)

    双gps手机有哪几款(双gps手机有哪几款真的导航好吗?)

  • 乐视x620怎么解锁(乐视x620怎么解bl锁)

    乐视x620怎么解锁(乐视x620怎么解bl锁)

  • oppoca证书在哪里开启(oppo手机ca证书是什么)

    oppoca证书在哪里开启(oppo手机ca证书是什么)

  • 小米9反向充电在哪(小米9反向充电怎么设置)

    小米9反向充电在哪(小米9反向充电怎么设置)

  • 华为手机nfc功能在哪(华为手机nfc功能在哪里设置)

    华为手机nfc功能在哪(华为手机nfc功能在哪里设置)

  • iphonex有指纹支付吗(苹果x有指纹解锁的手机)

    iphonex有指纹支付吗(苹果x有指纹解锁的手机)

  • 爱奇艺vf是vip还要钱吗(爱奇艺vip是什么意思)

    爱奇艺vf是vip还要钱吗(爱奇艺vip是什么意思)

  • 淘宝直播专业分怎么上(淘宝直播类目有哪些)

    淘宝直播专业分怎么上(淘宝直播类目有哪些)

  • 手机怎么自动清灰(手机怎么自动清理灰尘)

    手机怎么自动清灰(手机怎么自动清理灰尘)

  • 微博怎么不让一个人看(微博怎么不让一个粉丝看到我)

    微博怎么不让一个人看(微博怎么不让一个粉丝看到我)

  • 小米volte在哪里设置(小米volte功能)

    小米volte在哪里设置(小米volte功能)

  • 关于HTML中常用选择器(html用语)

    关于HTML中常用选择器(html用语)

  • Dedecms织梦系统Tag标签如何设置伪静态?(织梦cms官网)

    Dedecms织梦系统Tag标签如何设置伪静态?(织梦cms官网)

  • 企业增值税怎么做账务处理
  • 残疾人保障金的工资按实发还是应发
  • 公司减免社保到几月份
  • 公司成立之初做哪些
  • 小规模纳税人不开票需要纳税吗
  • 岗位津贴和岗位补贴
  • 垫付生育津贴的钱怎么算
  • 附加税退税申请表的填
  • 冲销暂估入库如何做会计核算?
  • 冲抵货款的返利怎么做账
  • 员工领取产假工资怎么算
  • 损益调整是什么科目
  • 公司发年终奖怎么发朋友圈
  • 预缴增值税一般计税依据
  • 承租人转租需要退押金吗
  • 医疗器械技术服务合同
  • 季初从业人数和季末从业人数怎么填
  • 投标费用属于什么会计科目
  • 自建厂房转固定资产如何办理手续
  • win11如何启用远程访问
  • 联想y400怎么装win10
  • wd discovery怎么安装
  • 苹果电脑mac设备在哪里
  • 资产评估报告包括
  • 个体工商户核定征收标准2023
  • 职工教育经费怎么做凭证
  • 编译报错place 30-681
  • php-msf
  • PHP:apache_getenv()的用法_Apache函数
  • 离职赔偿金计入什么费用
  • 赊销分期付款
  • 让我用用你的计算机
  • c++评测
  • 增值税专用发票几个点
  • 承包安装工程活怎么接
  • 商标属于无形资产怎么入账
  • 房屋租赁可以开具住宿费发票吗
  • 加油票发票抬头开错了
  • 未来的现金流折现
  • 固定资产售后回租融资租赁利息可以抵扣进项税额么
  • vue连接webapi
  • 车票增值税抵扣怎么操作
  • 差旅费报销范文
  • 个人劳务费免税额度 年度
  • 独立核算和非独立核算怎么查
  • 什么是明细分类帐
  • 公司涉及研发房怎么办
  • 预付账款和其他应付款的区别
  • 以前年度负债调整
  • 转账显示未认证
  • 微信转账截图可以作为会计凭证吗
  • 提取法定盈余公积金会计分录
  • 民间非营利组织包括哪些单位
  • 返还垫付征地款
  • 为什么预付账款可以通过应付账款核算
  • 固定资产装修费用如果符合固定资产
  • 如何结转生产成本至库存商品
  • 生产企业代理出口退税
  • Win10 Mobile Build 10549正式推送:须回滚到WP8.1升级
  • xp window
  • windows service 2003
  • win2008 r2 hosts文件修改方法
  • fedora i3wm
  • linux中链接
  • linux系统检测
  • 电脑dbs是什么
  • windows7显示桌面的操作方法
  • java操作windows的文件管理器
  • /etc/rc.d/rc与/etc/rc.d/init.d的关系介绍
  • lumia950升级win11
  • Win10年度更新将统一Insider与Xbox One预览体验
  • win10桌面test mode
  • 深入理解关于教育两个大计
  • 安卓修改udid
  • 脚本 python
  • 青岛新农合网上缴费时间
  • 陕西省电力app
  • 内蒙古国家税务总局电子税务局官网
  • 2021医保交费截止
  • 资源税的计税依据是含税还是不含税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设