位置: IT常识 - 正文

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

编辑:rootadmin
BP神经网络的梯度公式推导(三层结构)

推荐整理分享BP神经网络的梯度公式推导(三层结构)(bp-神经网络),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bp神经网络的梯度是多少,bp神经网络梯度下降,bp神经网络的梯度,bp神经网络的梯度下降法,bp神经网络梯度下降,bp神经网络的梯度是多少,bp神经网络的梯度是什么,bp神经网络的梯度,内容如对您有帮助,希望把文章链接给更多的朋友!

本站原创文章,转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com

目录

一. 推导目标

1.1 梯度公式目标 

1.2 本文梯度公式目标

二. 网络表达式梳理

2.1 梳理三层BP神经网络的网络表达式

三. 三层BP神经网络梯度推导过程

3.1 简化推导目标

3.2 输出层权重的梯度推导

3.3 输出层阈值的梯度推导

3.4隐层权重的梯度推导

 3.5 隐层阈值的梯度推导

四. 推导结果总结

4.1 三层BP神经网络梯度公式


BP神经网络的训练算法基本都涉及到梯度公式,

本文提供三层BP神经网络的梯度公式和推导过程

一. 推导目标

BP神经网络的梯度推导是个复杂活,

在推导之前 ,本节先把推导目标清晰化

1.1 梯度公式目标 

训练算法很多,但各种训练算法一般都需要用到各个待求参数(w,b)在损失函数中的梯度, 因此求出w,b在损失函数中的梯度就成为了BP神经网络必不可少的一环,

求梯度公式,即求以下误差函数E对各个w,b的偏导:

代表网络对第m个样本第k个输出的预测值,w,b就隐含在中

1.2 本文梯度公式目标

虽然梯度只是简单地求E对w,b的偏导,但E中包含网络的表达式f(x),就变得非常庞大, 求偏导就成了极度艰巨晦涩的苦力活,对多层结构通式的梯度推导稍为抽象, 本文不妨以最常用的三层结构作为具体例子入手,求出三层结构的梯度公式  即:输入层-隐层-输出层 (隐层传递函数为tansig,输出层传递函数为purelin)

虽然只是三层的BP神经网络,

但梯度公式的推导,仍然不仅是一个体力活,还是一个细致活,

且让我们细细一步一步慢慢来

二. 网络表达式梳理

在损失函数E中包括了网络表达式,在求梯度之前,

先将表达式的梳理清晰,有助于后面的推导

2.1 梳理三层BP神经网络的网络表达式

网络表达式的参考形式 隐层传递函数为tansig,输出层传递函数为purelin的三层BP神经网络, 有形如下式的数学表达式  

网络表达式的通用矩阵形式  写成通用的矩阵形式为

这里的为矩阵,和为向量, 上标(o)和(h)分别代表输出层(out)和隐层(hide),

例如,2输入,4隐节点,2输出的BP神经网络可以图解如下:

 

三. 三层BP神经网络梯度推导过程

本节我们具体推导误差函数对每一个待求参数w,b的梯度

3.1 简化推导目标

由于E的表达式较为复杂,  不妨先将问题转化为"求单样本梯度"来简化推导表达式  对于任何一个需要求偏导的待求参数w,都有:

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

即损失函数的梯度,等于单个样本的损失函数的梯度之和(E对b的梯度也如此), 因此,我们先推导单个样本的梯度,最后再对单样本梯度求和即可。 现在问题简化为求

3.2 输出层权重的梯度推导

输出层权重梯度推导 输出层的权重为"输出个数*隐节点个数"的矩阵, 现推导任意一个权重wji (即连接第i个隐层与第j个输出的权重)的单样本梯度 如下: 事实上,只有第j个输出是关于 的函数,也即对于其它输出  因此,  上式即等于

继续求导是第j个输出的误差,简记为                      是第j个隐节点的激活值,简记为(A即Active)

上式即可写为             

上述是单样本的梯度, 整体样本的梯度则应记为 

 M,K为样本个数、输出个数                                         是第m个样本第j个输出的误差      是第m个样本第i个隐节点的激活值    

3.3 输出层阈值的梯度推导

输出层阈值梯度推导 对于阈值(第j个输出节点的阈值)的推导与权重梯度的推导是类似的, 只是上述标蓝部分应改为

简记为

上述是单样本的梯度, 整体样本的梯度则应记为   M,K为样本个数、输出个数                ​是第m个样本第j个输出的误差      

3.4隐层权重的梯度推导

隐层的权重为"隐节点个数*输入个数"的矩阵, 现推导任意一个权重(即连接第i个输入与第j个隐节点的权重)的单样本梯度 如下:

只有第j个tansig是关于 的函数,所以上式可以写成

 

继续求导    

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,KM,K为样本个数、输出个数                                              ​是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值           ​是第m个样本第i个输入                                                  

 3.5 隐层阈值的梯度推导

隐层阈值梯度推导 对于阈值b_\textbf{j}^{(h)}  ​(第j个隐节点的阈值)的推导与隐层权重梯度的推导是类似的, 只是蓝色部分应改为

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,K为样本个数、输出个数                                              是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值         

四. 推导结果总结4.1 三层BP神经网络梯度公式

输出层梯度公式 输出层权重梯度:                         输出层阈值梯度:                                             

隐层梯度公式 隐层权重梯度:  隐层阈值梯度:       

✍️符号说明  M,K为样本个数、输出个数                                               是第m个样本第k个输出的误差        ​是第m个样本第i个隐节点的激活值           是第m个样本第i个输入                                                  

 相关文章

​《BP神经网络梯度推导》

​​​​​​《BP神经网络提取的数学表达式》

《一个BP的完整建模流程》

本文链接地址:https://www.jiuchutong.com/zhishi/299419.html 转载请保留说明!

上一篇:【Java编程指南】方法(java编程入门基础教程)

下一篇:朴素贝叶斯(Naive Bayes)详解(朴素贝叶斯算法)

  • 苹果11复制不了文字吗(苹果11pro max复制粘贴不了)

    苹果11复制不了文字吗(苹果11pro max复制粘贴不了)

  • 微信信息拒收是什么意思(微信信息拒收是什么意思啊)

    微信信息拒收是什么意思(微信信息拒收是什么意思啊)

  • 电脑运存8g和16g差别大吗(电脑运存8g和16g打开网页)

    电脑运存8g和16g差别大吗(电脑运存8g和16g打开网页)

  • 红米10x是5g手机吗(红米10x是真5g手机??)

    红米10x是5g手机吗(红米10x是真5g手机??)

  • 什么叫抖音垂直度(什么叫抖音垂直视频)

    什么叫抖音垂直度(什么叫抖音垂直视频)

  • ipadpro11寸和12.9寸区别(ipadpro11寸和12.9寸屏幕比例)

    ipadpro11寸和12.9寸区别(ipadpro11寸和12.9寸屏幕比例)

  • 蓝牙耳机不能两个同时使用(蓝牙耳机不能两个一起响)

    蓝牙耳机不能两个同时使用(蓝牙耳机不能两个一起响)

  • 华为mate30 6+128和8+128区别(mate30 6 128和8 128区别)

    华为mate30 6+128和8+128区别(mate30 6 128和8 128区别)

  • 华为手机看快手屏幕显示不全(华为手机看快手怎么上下滑)

    华为手机看快手屏幕显示不全(华为手机看快手怎么上下滑)

  • 快手粉丝团能加几个(快手粉丝团能加几个主播粉丝团?)

    快手粉丝团能加几个(快手粉丝团能加几个主播粉丝团?)

  • 淘宝直播达到2级会有浮现吗(淘宝直播达到上限什么意思)

    淘宝直播达到2级会有浮现吗(淘宝直播达到上限什么意思)

  • 怎么控制qq群里的骰子(怎么控制qq群人数)

    怎么控制qq群里的骰子(怎么控制qq群人数)

  • 通过qq可以查到对方位置吗(通过qq可以查到微信号吗)

    通过qq可以查到对方位置吗(通过qq可以查到微信号吗)

  • 怎么能让nice退货(nice如何退款)

    怎么能让nice退货(nice如何退款)

  • 快手怎么设置商家电话(快手怎么设置商业推广任务)

    快手怎么设置商家电话(快手怎么设置商业推广任务)

  • 淘宝优惠卷删了想找回(淘宝优惠卷删了还能用吗)

    淘宝优惠卷删了想找回(淘宝优惠卷删了还能用吗)

  • 微信里长方形里有个x(微信里长方形里有个x什么意思)

    微信里长方形里有个x(微信里长方形里有个x什么意思)

  • 华为手机锁屏广告怎么关闭(华为手机锁屏广告在哪里关闭)

    华为手机锁屏广告怎么关闭(华为手机锁屏广告在哪里关闭)

  • 怎么用ps制作1寸照片(如何用ps制作1 寸的照片)

    怎么用ps制作1寸照片(如何用ps制作1 寸的照片)

  • 路由器100兆和1000兆的区别(路由器100兆和1000兆的区别 贴吧)

    路由器100兆和1000兆的区别(路由器100兆和1000兆的区别 贴吧)

  • 百度视频如何旋转方向(百度视频如何旋转画面)

    百度视频如何旋转方向(百度视频如何旋转画面)

  • 苹果X如何显示电池百分比(苹果x如何显示电量数字)

    苹果X如何显示电池百分比(苹果x如何显示电量数字)

  • 0xc0000142怎么修复详情(0xc0000142怎么修复)

    0xc0000142怎么修复详情(0xc0000142怎么修复)

  • 由浅入深介绍 Python Websocket 编程(由浅入深英语怎么说)

    由浅入深介绍 Python Websocket 编程(由浅入深英语怎么说)

  • 金税盘软件打不开
  • 个体户如何报税步骤
  • 港建费征收管理办法
  • 土增税预缴是按不含税收入算
  • 工商银行特色贷款
  • 基本户被冻结怎么缴投标保证金
  • 增加税收的方法有哪些
  • 如何建设工厂
  • 应付职工薪酬会产生暂时性差异吗
  • 自然人独资企业交哪些税
  • 仓储费和仓储服务费的区别
  • 定期存款准备金是什么
  • 红字发票冲销的销项税怎么处理
  • 事业支出期末如何结转?
  • 购置税交了发票能作废吗
  • 补开去年未开票收入
  • 个税税费返还
  • 发给一个人的说说
  • 上海房产税如何退税
  • 报税没有申报现金流量表
  • 建筑劳务增值税
  • 在外地的分公司可以独立核算开发票吗
  • 缴纳的社保费可以退吗怎么退
  • 发票升额需要什么条件
  • 在建工程转固定资产需提供的资料
  • 企业在外地的房产怎么办
  • 进项票认证超了怎么处理
  • 审图费发票需要备注吗
  • 营业外支出应填什么科目
  • 企业所得税汇算清缴网上申报流程
  • 压缩包损坏修复软件
  • 电脑取消共享文件夹
  • 收到税局退回增值税
  • php的数组函数
  • PHP:pg_last_notice()的用法_PostgreSQL函数
  • php判断字符串长度的方法
  • 无损数据分区
  • laravel怎么用
  • php数组排列组合
  • chat form
  • 什么样的费用算研发费用
  • 出口抵减内销产品应纳税额怎么结转
  • 工资应纳税额怎么算
  • 出差托运行李公司报销吗
  • 免税农产品怎么抵扣进项税
  • 分公司非独立核算怎么做账
  • 应交增值税是应收账款吗
  • 物品登记制度
  • 定期定额个体经营所得税申报错了怎么办
  • 不动产在建工程领用原材料进项税额可以抵扣吗
  • 给员工打了备用金后归还怎么做账
  • 企业设置的坏账科目
  • 固定资产应计入什么账户
  • 预交企业所得税计算
  • case在sql中
  • mysql与c++相连
  • mysql字段什么意思
  • Ubuntu 14.04/14.10如何安装记账软件HomeBank?
  • windowsxp
  • 本地磁盘文件系统
  • 密码多次错误被锁定怎么办
  • window10英文版安装步骤
  • kavsvc.exe - kavsvc是什么进程 有什么作用
  • 代理服务器只能代理客户端http的请求
  • win7蓝屏怎么办
  • jquery animation
  • Java反射机制和动态代理机制
  • pypy 使用
  • LocalBroadcastManager原理和机制
  • shell 1>&2 2>&1 &>filename重定向的含义和区别
  • node.js的express
  • jquery轮播图自动播放
  • js实现滑动效果
  • js鼠标点击图片就消失
  • JavaScript冒泡排序都不会写
  • JAVAscript字符串类型单引号和双引号意一样吗
  • 闽政通城乡居民养老保险认证
  • 企业年报通怎么注销
  • 山东国税局官网登录
  • 重庆职高学校推荐
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设