位置: IT常识 - 正文

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

编辑:rootadmin
BP神经网络的梯度公式推导(三层结构)

推荐整理分享BP神经网络的梯度公式推导(三层结构)(bp-神经网络),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bp神经网络的梯度是多少,bp神经网络梯度下降,bp神经网络的梯度,bp神经网络的梯度下降法,bp神经网络梯度下降,bp神经网络的梯度是多少,bp神经网络的梯度是什么,bp神经网络的梯度,内容如对您有帮助,希望把文章链接给更多的朋友!

本站原创文章,转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com

目录

一. 推导目标

1.1 梯度公式目标 

1.2 本文梯度公式目标

二. 网络表达式梳理

2.1 梳理三层BP神经网络的网络表达式

三. 三层BP神经网络梯度推导过程

3.1 简化推导目标

3.2 输出层权重的梯度推导

3.3 输出层阈值的梯度推导

3.4隐层权重的梯度推导

 3.5 隐层阈值的梯度推导

四. 推导结果总结

4.1 三层BP神经网络梯度公式


BP神经网络的训练算法基本都涉及到梯度公式,

本文提供三层BP神经网络的梯度公式和推导过程

一. 推导目标

BP神经网络的梯度推导是个复杂活,

在推导之前 ,本节先把推导目标清晰化

1.1 梯度公式目标 

训练算法很多,但各种训练算法一般都需要用到各个待求参数(w,b)在损失函数中的梯度, 因此求出w,b在损失函数中的梯度就成为了BP神经网络必不可少的一环,

求梯度公式,即求以下误差函数E对各个w,b的偏导:

代表网络对第m个样本第k个输出的预测值,w,b就隐含在中

1.2 本文梯度公式目标

虽然梯度只是简单地求E对w,b的偏导,但E中包含网络的表达式f(x),就变得非常庞大, 求偏导就成了极度艰巨晦涩的苦力活,对多层结构通式的梯度推导稍为抽象, 本文不妨以最常用的三层结构作为具体例子入手,求出三层结构的梯度公式  即:输入层-隐层-输出层 (隐层传递函数为tansig,输出层传递函数为purelin)

虽然只是三层的BP神经网络,

但梯度公式的推导,仍然不仅是一个体力活,还是一个细致活,

且让我们细细一步一步慢慢来

二. 网络表达式梳理

在损失函数E中包括了网络表达式,在求梯度之前,

先将表达式的梳理清晰,有助于后面的推导

2.1 梳理三层BP神经网络的网络表达式

网络表达式的参考形式 隐层传递函数为tansig,输出层传递函数为purelin的三层BP神经网络, 有形如下式的数学表达式  

网络表达式的通用矩阵形式  写成通用的矩阵形式为

这里的为矩阵,和为向量, 上标(o)和(h)分别代表输出层(out)和隐层(hide),

例如,2输入,4隐节点,2输出的BP神经网络可以图解如下:

 

三. 三层BP神经网络梯度推导过程

本节我们具体推导误差函数对每一个待求参数w,b的梯度

3.1 简化推导目标

由于E的表达式较为复杂,  不妨先将问题转化为"求单样本梯度"来简化推导表达式  对于任何一个需要求偏导的待求参数w,都有:

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

即损失函数的梯度,等于单个样本的损失函数的梯度之和(E对b的梯度也如此), 因此,我们先推导单个样本的梯度,最后再对单样本梯度求和即可。 现在问题简化为求

3.2 输出层权重的梯度推导

输出层权重梯度推导 输出层的权重为"输出个数*隐节点个数"的矩阵, 现推导任意一个权重wji (即连接第i个隐层与第j个输出的权重)的单样本梯度 如下: 事实上,只有第j个输出是关于 的函数,也即对于其它输出  因此,  上式即等于

继续求导是第j个输出的误差,简记为                      是第j个隐节点的激活值,简记为(A即Active)

上式即可写为             

上述是单样本的梯度, 整体样本的梯度则应记为 

 M,K为样本个数、输出个数                                         是第m个样本第j个输出的误差      是第m个样本第i个隐节点的激活值    

3.3 输出层阈值的梯度推导

输出层阈值梯度推导 对于阈值(第j个输出节点的阈值)的推导与权重梯度的推导是类似的, 只是上述标蓝部分应改为

简记为

上述是单样本的梯度, 整体样本的梯度则应记为   M,K为样本个数、输出个数                ​是第m个样本第j个输出的误差      

3.4隐层权重的梯度推导

隐层的权重为"隐节点个数*输入个数"的矩阵, 现推导任意一个权重(即连接第i个输入与第j个隐节点的权重)的单样本梯度 如下:

只有第j个tansig是关于 的函数,所以上式可以写成

 

继续求导    

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,KM,K为样本个数、输出个数                                              ​是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值           ​是第m个样本第i个输入                                                  

 3.5 隐层阈值的梯度推导

隐层阈值梯度推导 对于阈值b_\textbf{j}^{(h)}  ​(第j个隐节点的阈值)的推导与隐层权重梯度的推导是类似的, 只是蓝色部分应改为

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,K为样本个数、输出个数                                              是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值         

四. 推导结果总结4.1 三层BP神经网络梯度公式

输出层梯度公式 输出层权重梯度:                         输出层阈值梯度:                                             

隐层梯度公式 隐层权重梯度:  隐层阈值梯度:       

✍️符号说明  M,K为样本个数、输出个数                                               是第m个样本第k个输出的误差        ​是第m个样本第i个隐节点的激活值           是第m个样本第i个输入                                                  

 相关文章

​《BP神经网络梯度推导》

​​​​​​《BP神经网络提取的数学表达式》

《一个BP的完整建模流程》

本文链接地址:https://www.jiuchutong.com/zhishi/299419.html 转载请保留说明!

上一篇:【Java编程指南】方法(java编程入门基础教程)

下一篇:朴素贝叶斯(Naive Bayes)详解(朴素贝叶斯算法)

  • 华为手机如何省电设置方法(华为手机如何省电设置方法视频)

    华为手机如何省电设置方法(华为手机如何省电设置方法视频)

  • 苹果手机的锁屏密码忘记了怎么办(苹果手机的锁屏壁纸在哪里设置)

    苹果手机的锁屏密码忘记了怎么办(苹果手机的锁屏壁纸在哪里设置)

  • 找不到无线网名称(找不到wiff名称)

    找不到无线网名称(找不到wiff名称)

  •   谷歌在哪里下载(谷歌在哪里登陆账号)

      谷歌在哪里下载(谷歌在哪里登陆账号)

  • 苹果11侧边按钮怎么关机(苹果11侧边按钮失灵怎么办)

    苹果11侧边按钮怎么关机(苹果11侧边按钮失灵怎么办)

  • qq访问主页有记录吗(qq看主页会显示访问空间吗)

    qq访问主页有记录吗(qq看主页会显示访问空间吗)

  • 腾讯会议平板怎么共享屏幕(腾讯会议平板怎么共享声音)

    腾讯会议平板怎么共享屏幕(腾讯会议平板怎么共享声音)

  • i7 6700k配什么主板(i7 6700k配什么主板可以用m.2)

    i7 6700k配什么主板(i7 6700k配什么主板可以用m.2)

  • g04指令是什么意思(g04x4指令)

    g04指令是什么意思(g04x4指令)

  • a2301是几代耳机(a2301的airpods是哪个版本)

    a2301是几代耳机(a2301的airpods是哪个版本)

  • 手机上有耳机图标没声音咋回事(手机上有耳机图标)

    手机上有耳机图标没声音咋回事(手机上有耳机图标)

  • ip65是什么意思(配电箱ip65是什么意思)

    ip65是什么意思(配电箱ip65是什么意思)

  • vivoy3什么处理器(vivoy3手机的处理器型号是多少)

    vivoy3什么处理器(vivoy3手机的处理器型号是多少)

  • 预售怎么放入购物车(预售怎么卖)

    预售怎么放入购物车(预售怎么卖)

  • 手机省电模式怎么关闭(手机省电模式怎么关闭oppo)

    手机省电模式怎么关闭(手机省电模式怎么关闭oppo)

  • 金立多任务界面在哪(金立多任务键怎么设置)

    金立多任务界面在哪(金立多任务键怎么设置)

  • word2010主页样本模板在哪(word的主页的样本模板在哪里)

    word2010主页样本模板在哪(word的主页的样本模板在哪里)

  • f1.7和f2.0光圈哪个大(f17和f20光圈哪个好)

    f1.7和f2.0光圈哪个大(f17和f20光圈哪个好)

  • 抖音里的表情包怎么找(抖音里的表情包怎么保存到微信里)

    抖音里的表情包怎么找(抖音里的表情包怎么保存到微信里)

  • 5v2a是多少瓦(9v2a是多少瓦)

    5v2a是多少瓦(9v2a是多少瓦)

  • 抖音怎么删除私密作品(抖音怎么删除私信分享列表)

    抖音怎么删除私密作品(抖音怎么删除私信分享列表)

  • 美团商家版怎么设置折扣(美团商家版怎么拉黑人客人)

    美团商家版怎么设置折扣(美团商家版怎么拉黑人客人)

  • 怎么扩列好友(怎么样扩列微信好友)

    怎么扩列好友(怎么样扩列微信好友)

  • oppo和vivo是一家公司吗(oppo和vivo是一家公司生产的吗)

    oppo和vivo是一家公司吗(oppo和vivo是一家公司生产的吗)

  • word突出显示怎么设置(word突出显示怎么保存)

    word突出显示怎么设置(word突出显示怎么保存)

  • 小米9看视频不能全屏(小米看视频不能横过来全屏)

    小米9看视频不能全屏(小米看视频不能横过来全屏)

  • 汇算清缴所得税退回做账
  • 盈余公积转增资本会影响所有者权益吗
  • 所得税费用是什么科目
  • 大盛房地产中介公司
  • 全成本核算优缺点
  • 利润表年度报表
  • 新成立的公司企业所得税怎么申报
  • 营业外支出影响损益吗
  • 生产成本月末结转到本年利润里吗
  • 小企业准则固定资产折旧每月折旧多折了
  • 税收专用缴款书
  • 工程项目结算方式有哪几种
  • 应收债权属于非抵押吗
  • 非财政补助支出
  • 股东打入公户的钱怎么做账
  • 个人独资企业是法人吗
  • 私人转公账可以吗
  • 改变使用用途 规划处罚
  • 销售开发后的产品
  • 企业重组有什么好处
  • 机构股东入股资金流向
  • 普通合伙企业分配利润
  • 税务核定利润的标准
  • 公司购买进口产成品关税会计分录怎么做?
  • 营运能力指标正常范围
  • 总成本费用包含
  • win7浏览器显示证书错误怎么解决
  • thinkphp怎么部署
  • 异地预缴税款后当地还交吗
  • 路由器隐藏ssid后果严重
  • 采购涉及哪些部门
  • 购入研发设备
  • 总公司固定资产包括哪些
  • 在我国,企业可以用税前利润弥补几年内的损失
  • php测试mysql 数据库连接
  • vue设置图片
  • 简单的随机乱码怎么解决
  • 发票过账和不过账是什么意思
  • thinkphp框架入门
  • unrar解压命令
  • php与其他语言的比较
  • 个体户税率征收
  • 招待费进项转出填表二哪里
  • 为什么社保卡里有钱
  • db2数据库备份文件为bkd格式
  • 残疾人个人所得税减免政策2023
  • 税盘开票机号怎么看
  • 营改增方案
  • 跨年发票能不能用
  • 电子承兑 背书
  • 估价入账的账务处理
  • 买车险要先付钱再上牌吗
  • 盘亏盘盈的会计处理
  • 坏账准备的核算公式
  • 苗木税票怎么抵扣
  • 结转成本按照销售收入来结转,税要怎么算
  • 什么是预收账款的正常余额
  • 地方教育附加申报
  • 小微企业税控盘维护费每年都要交吗
  • 工厂加工费的账务怎么做
  • mysql优化步骤
  • win8操作
  • linux编译安装怎么卸载
  • xp系统几位操作系统
  • linux播放mp3命令
  • win7登录账号
  • cocos2d-x window实现鼠标移动 键盘事件
  • opengl es programming guide
  • extjs grid设置某列背景颜色和字体颜色的方法
  • Html5+jQuery+CSS制作相册小记录
  • python redis hmset
  • Nodejs+Socket.io实现通讯实例代码
  • unity导入工程根本运行不了
  • unity怎么导入3d模型
  • js文件设置编码
  • 全国企业信用信息系统网官网
  • 出售废铁的会计分录
  • 重庆市地方税务局公告2016年第2号
  • 财产转让所得适用税率
  • 建筑企业个人所得税管理办法
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设