位置: IT常识 - 正文

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

编辑:rootadmin
BP神经网络的梯度公式推导(三层结构)

推荐整理分享BP神经网络的梯度公式推导(三层结构)(bp-神经网络),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bp神经网络的梯度是多少,bp神经网络梯度下降,bp神经网络的梯度,bp神经网络的梯度下降法,bp神经网络梯度下降,bp神经网络的梯度是多少,bp神经网络的梯度是什么,bp神经网络的梯度,内容如对您有帮助,希望把文章链接给更多的朋友!

本站原创文章,转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com

目录

一. 推导目标

1.1 梯度公式目标 

1.2 本文梯度公式目标

二. 网络表达式梳理

2.1 梳理三层BP神经网络的网络表达式

三. 三层BP神经网络梯度推导过程

3.1 简化推导目标

3.2 输出层权重的梯度推导

3.3 输出层阈值的梯度推导

3.4隐层权重的梯度推导

 3.5 隐层阈值的梯度推导

四. 推导结果总结

4.1 三层BP神经网络梯度公式


BP神经网络的训练算法基本都涉及到梯度公式,

本文提供三层BP神经网络的梯度公式和推导过程

一. 推导目标

BP神经网络的梯度推导是个复杂活,

在推导之前 ,本节先把推导目标清晰化

1.1 梯度公式目标 

训练算法很多,但各种训练算法一般都需要用到各个待求参数(w,b)在损失函数中的梯度, 因此求出w,b在损失函数中的梯度就成为了BP神经网络必不可少的一环,

求梯度公式,即求以下误差函数E对各个w,b的偏导:

代表网络对第m个样本第k个输出的预测值,w,b就隐含在中

1.2 本文梯度公式目标

虽然梯度只是简单地求E对w,b的偏导,但E中包含网络的表达式f(x),就变得非常庞大, 求偏导就成了极度艰巨晦涩的苦力活,对多层结构通式的梯度推导稍为抽象, 本文不妨以最常用的三层结构作为具体例子入手,求出三层结构的梯度公式  即:输入层-隐层-输出层 (隐层传递函数为tansig,输出层传递函数为purelin)

虽然只是三层的BP神经网络,

但梯度公式的推导,仍然不仅是一个体力活,还是一个细致活,

且让我们细细一步一步慢慢来

二. 网络表达式梳理

在损失函数E中包括了网络表达式,在求梯度之前,

先将表达式的梳理清晰,有助于后面的推导

2.1 梳理三层BP神经网络的网络表达式

网络表达式的参考形式 隐层传递函数为tansig,输出层传递函数为purelin的三层BP神经网络, 有形如下式的数学表达式  

网络表达式的通用矩阵形式  写成通用的矩阵形式为

这里的为矩阵,和为向量, 上标(o)和(h)分别代表输出层(out)和隐层(hide),

例如,2输入,4隐节点,2输出的BP神经网络可以图解如下:

 

三. 三层BP神经网络梯度推导过程

本节我们具体推导误差函数对每一个待求参数w,b的梯度

3.1 简化推导目标

由于E的表达式较为复杂,  不妨先将问题转化为"求单样本梯度"来简化推导表达式  对于任何一个需要求偏导的待求参数w,都有:

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

即损失函数的梯度,等于单个样本的损失函数的梯度之和(E对b的梯度也如此), 因此,我们先推导单个样本的梯度,最后再对单样本梯度求和即可。 现在问题简化为求

3.2 输出层权重的梯度推导

输出层权重梯度推导 输出层的权重为"输出个数*隐节点个数"的矩阵, 现推导任意一个权重wji (即连接第i个隐层与第j个输出的权重)的单样本梯度 如下: 事实上,只有第j个输出是关于 的函数,也即对于其它输出  因此,  上式即等于

继续求导是第j个输出的误差,简记为                      是第j个隐节点的激活值,简记为(A即Active)

上式即可写为             

上述是单样本的梯度, 整体样本的梯度则应记为 

 M,K为样本个数、输出个数                                         是第m个样本第j个输出的误差      是第m个样本第i个隐节点的激活值    

3.3 输出层阈值的梯度推导

输出层阈值梯度推导 对于阈值(第j个输出节点的阈值)的推导与权重梯度的推导是类似的, 只是上述标蓝部分应改为

简记为

上述是单样本的梯度, 整体样本的梯度则应记为   M,K为样本个数、输出个数                ​是第m个样本第j个输出的误差      

3.4隐层权重的梯度推导

隐层的权重为"隐节点个数*输入个数"的矩阵, 现推导任意一个权重(即连接第i个输入与第j个隐节点的权重)的单样本梯度 如下:

只有第j个tansig是关于 的函数,所以上式可以写成

 

继续求导    

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,KM,K为样本个数、输出个数                                              ​是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值           ​是第m个样本第i个输入                                                  

 3.5 隐层阈值的梯度推导

隐层阈值梯度推导 对于阈值b_\textbf{j}^{(h)}  ​(第j个隐节点的阈值)的推导与隐层权重梯度的推导是类似的, 只是蓝色部分应改为

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,K为样本个数、输出个数                                              是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值         

四. 推导结果总结4.1 三层BP神经网络梯度公式

输出层梯度公式 输出层权重梯度:                         输出层阈值梯度:                                             

隐层梯度公式 隐层权重梯度:  隐层阈值梯度:       

✍️符号说明  M,K为样本个数、输出个数                                               是第m个样本第k个输出的误差        ​是第m个样本第i个隐节点的激活值           是第m个样本第i个输入                                                  

 相关文章

​《BP神经网络梯度推导》

​​​​​​《BP神经网络提取的数学表达式》

《一个BP的完整建模流程》

本文链接地址:https://www.jiuchutong.com/zhishi/299419.html 转载请保留说明!

上一篇:【Java编程指南】方法(java编程入门基础教程)

下一篇:朴素贝叶斯(Naive Bayes)详解(朴素贝叶斯算法)

  • 个人所得税的税目分多少种
  • 个税扣除项生效日期
  • 旅行社给游客买保险的步骤是什么
  • 报关单和进口增值税专用缴款书联系
  • 有限合伙企业合伙人责任
  • 生产企业固定资产折旧
  • 收就业局稳岗补贴做账
  • 汽车固定资产清理账务处理
  • 教育费附加抵免政策
  • 教育经费税前扣除标准
  • 提前还款罚息是多少
  • 向消费者支付佣金怎么算
  • 运输发票抵扣税率是有多少?
  • 纳税人识别号和税号是一个意思吗
  • 人工服务费发票
  • 本期免税收入是什么
  • 十分钟看懂财务报表
  • 接受国外企业捐款的条件
  • 找私人买东西不发货算诈骗吗
  • 职工福利费汇算清缴怎么填写
  • 销售人员报销差旅费怎么报税
  • 收到发票怎么入库
  • php输出当月日历
  • php+redis
  • 收到采购发票未开票
  • php中字符串函数
  • 工程结算转主营业务收入
  • 代理报关费会计怎么做账
  • PHP:oci_client_version()的用法_Oracle函数
  • 结算审计流程图
  • 房屋租金应缴纳多少
  • 防伪税控风险纳税人
  • 海关交税标准表
  • 固定资产不计提折旧有什么影响
  • 定期定额个体户超定额怎样申报
  • 元素鼠标失灵了怎么办
  • 企业的银行账户按用途分不包括的是
  • 认识数据库思维导图
  • 用友u8删除凭证的步骤
  • 帝国cms安装教程
  • 备抵法会计处理
  • 银行对账单冲正的单据在财务软件哪里找
  • 清包工开发票需要注意事项
  • sql纵表转横表
  • 资产损失税前扣除
  • 应付账款的四大基本要素
  • 外购的商品赠送客人是否销售吗
  • 税控设备抵减税款分录
  • 未取得发票该怎么说明
  • 应交增值税的结转怎么算
  • 非税收入一般缴款书查询
  • 财务费用包括什么项目
  • 契税为什么计入成本费用
  • 实收资本怎么确认入账
  • t3用友年底结束怎么建下一年
  • 一次性购买多张火车票
  • mysqli查询
  • mysql优化技巧实战
  • WINDOWS7系统安装包
  • win8系统如何开机直接进入桌面
  • 1sass.exe是什么程序
  • windows xp 开机
  • linux系统崩溃了怎么办
  • launch pxe
  • 关于windows的开始菜单,叙述错误的是
  • win10系统无法打开设置
  • shell source不起作用
  • excel最小化后再次选择不弹出来
  • Nodejs Express4.x开发框架随手笔记
  • 安卓性能测试主要测试的是
  • core文件的作用
  • javascript的change
  • nodejs libuv
  • node.js怎么用
  • 一篇文章的
  • javascript如何学
  • 说几条javascript的基本规范
  • js控制浏览器返回按钮
  • 国税局宁夏税务
  • 增值税纳税申报表怎么填
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设