位置: IT常识 - 正文

3DResNet 学习记录(3d representation)

编辑:rootadmin
3DResNet 学习记录

推荐整理分享3DResNet 学习记录(3d representation),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:3d representation,3d resnet网络结构,3d resnet pytorch,resnet训练,3d resnet pytorch,3d representation,3d resnet网络结构,3d resnet pytorch,内容如对您有帮助,希望把文章链接给更多的朋友!

近期同时在进行的两个深度学习项目都需要用到3DResNet模型,本着不做调包侠的心态,还是要好好把模型的原理看一看的。

1、ResNet结构理解

首先先理解一下二维的ResNet吧。

ResNet又名残差结构,残差连接等。何恺明大佬提出这个概念是为了解决深层网络的梯度消失和梯度爆炸的问题,以及收敛深层网络的“退化”问题,从而可以使得网络层数变得更深。(常见层数有18-34-50-101-152层)相较于之前的层数大多在10~20层的网络来说,无疑是在层数上有了非常大的突破。

残差结构的原理,主要是把输入输出的映射从F(x)转换到了H(x)=F(x)+x上,这样做的目的,个人理解是:在网络层数足够深的情况下,在接近网络输出端的层结构中,其上一层的输出x很可能已经无限逼近于最优解,这个时候对于此层的参数调整,就可以给网络一种选择:即把F(x)置0,或者赋予很小的权重,让此层的结构发挥的作用是将上一层的输出完好地送至下一层,保留最佳输出的结果,也就是所谓的“恒等映射”。(identity mapping)

而,传统的卷积层结构来说,要调整至这样一种“不怎么改变输入的”参数结构,显然是不如直接将F(x)置为0来的容易的。本质上这是一种模型复杂度的降低(来自李沐老师的观点),即给网络以一个比较“手动”的引导,去让网络的参数能够逼近于你想要的结构。个人认为,这是残差连接能够加深网络层数的一个比较可以解释得通的理由。

另外,这样一种“学习恒等映射”的方法,它的F(x)也未必一定要完全是0,在输入足够趋近最优解的情况下,可以理解为一种“小幅的,进一步促进输出逼近最优的作用”,像是在训练的尾声阶段把lr调的非常小,那种意思。

2、3DCNN的理解

ResNet3D = ResNet+3DConv 所以有必要先理解一下3DConv的基础知识

3DResNet 学习记录(3d representation)

3DConv与2DConv的区别,首先就体现在了卷积核的参数上。

2DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H]

3DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H,T] T在这里一般是指,需要连续考虑多少帧的参数。

以下图为例:

3DConv的shape讨论:对于3DConv来说,他的输入、特征图都从2DConv的单张featuremap变成了一个在时序上堆叠起来的“series feature map”,而每一个“通道”可以理解为图中的一整“块”,如C2中就可以说是有“两个通道”,因为C2是由H1经过了两个不同的卷积核而输出的。而这一个“通道”中,包含的是一个“series”的feature map,比如第一层3DCNN层中,卷积核的WHT参数分别为[7,7,3],表示卷积核的尺寸为7*7,且每一次需要考虑三个帧的信息。H1中一个特征为7帧,那么经过7*7*3的WHT参数的卷积核之后,就会输出一个54*54*5的特征map,所以这样就可以理解,C2中的54*34*23*2的尺寸的来由。

同样地,对于第二层7*6*3的卷积层,三个不同的卷积核分别卷积S3层的feature series map,得到13*6的shape,注意这里,输出的通道数和卷积核的个数是不相等的,这点与2DCNN不同。就是经过在两个通道卷积后,不是像2DCNN那样把他们的结果叠加起来,而是分别映射到两个通道中,这点是导致两者不同的原因。相当于把两个通道“分开来算”

最后一层C6的卷积层,尺度应该是7*4*78*128,也就是2DCNN中inchannel为78,outchannel为128,这样去卷积。最后输出128个1*1的featuremap之后,再用全连接层连起来输出即可~

总体来看,3DConv相对2DConv来说,最大的区别就在于所有的输入,特征,都变成了时序性的,也就是提升了一个维度。经过这样的时序上的卷积,可以有效地提取输入以及特征图中的时序信息,帮助网络更好的理解视频之类的输入。不过,文章中提到的架构,可以看到第一个Hardwired层是去手动地提取了光流,梯度等特征,并不算是一个“端到端”的结构。

而ResNet3D,只是用残差结构将一个个的3DConv模块连接起来,通过实验科学组成一个效果比较好的网络,感觉应该没有太多需要讲的地方,如果后续有新的理解,前来填坑~

Reference:

(6条消息) ResNet详解——通俗易懂版_sunny_yeah_的博客-CSDN博客_resnet

(6条消息) 残差resnet网络原理详解_mao_feng的博客-CSDN博客_resnet

本文链接地址:https://www.jiuchutong.com/zhishi/298724.html 转载请保留说明!

上一篇:Linux 下使用 C++ 实现的 Web 文件服务器(linux运行c++程序)

下一篇:基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现)

  • 华为智慧屏怎么投屏(华为智慧屏怎么安装第三方软件)

    华为智慧屏怎么投屏(华为智慧屏怎么安装第三方软件)

  • 服务器一段时间自动断开(服务器一段时间后会远程连不上)

    服务器一段时间自动断开(服务器一段时间后会远程连不上)

  • sai内存使用量不足怎么解决(sai 内存容量不足)

    sai内存使用量不足怎么解决(sai 内存容量不足)

  • 金百达kp330和kp320区别(金百达kp330和kp320)

    金百达kp330和kp320区别(金百达kp330和kp320)

  • g5420处理器相当于i几(g5420处理器办公怎么样)

    g5420处理器相当于i几(g5420处理器办公怎么样)

  • oa付款是什么意思(oa 付款)

    oa付款是什么意思(oa 付款)

  • 快手经常搜索一个人他知道吗(快手经常搜索一个人)

    快手经常搜索一个人他知道吗(快手经常搜索一个人)

  • 如何查看有没有分页符(如何查看有没有运费险)

    如何查看有没有分页符(如何查看有没有运费险)

  • 模拟摄像头和同轴摄像头的区别(模拟摄像头和同轴摄像头可以通用吗)

    模拟摄像头和同轴摄像头的区别(模拟摄像头和同轴摄像头可以通用吗)

  • 原装充电线和非原装区别(原装充电线和非原装充电头一起用)

    原装充电线和非原装区别(原装充电线和非原装充电头一起用)

  • 苹果手机下载被禁止怎么办(苹果手机下载被限制怎么解除)

    苹果手机下载被禁止怎么办(苹果手机下载被限制怎么解除)

  • 候补提交成功啥意思(候补提交成功可以上车吗)

    候补提交成功啥意思(候补提交成功可以上车吗)

  • 闲聊可以提现为什么到不了账(闲聊提现24小时可以进账吗)

    闲聊可以提现为什么到不了账(闲聊提现24小时可以进账吗)

  • s8050和ss8050区别(s8050与ss8050区别)

    s8050和ss8050区别(s8050与ss8050区别)

  • 安卓wps怎么替换文字(手机版wps替换怎么操作步骤)

    安卓wps怎么替换文字(手机版wps替换怎么操作步骤)

  • 手机一直充电会怎么样(手机一直充电会爆吗)

    手机一直充电会怎么样(手机一直充电会爆吗)

  • iphone11pro怎么进行紧急呼叫(iPhone11pro怎么进入恢复模式)

    iphone11pro怎么进行紧急呼叫(iPhone11pro怎么进入恢复模式)

  • 怎么解绑淘宝店铺会员(如何解绑淘宝店铺绑定的支付宝账号)

    怎么解绑淘宝店铺会员(如何解绑淘宝店铺绑定的支付宝账号)

  • 微信静音播放怎么取消(微信静音播放怎么恢复声音)

    微信静音播放怎么取消(微信静音播放怎么恢复声音)

  • 芒果tv怎么退出登入(芒果tv怎么退出其他设备)

    芒果tv怎么退出登入(芒果tv怎么退出其他设备)

  • 双模5g是什么意思(双模5g和5g双模有什么区别)

    双模5g是什么意思(双模5g和5g双模有什么区别)

  • 如何把图片反色(如何把图片反色手机)

    如何把图片反色(如何把图片反色手机)

  • kindle屏幕有黑点怎么办(kindle屏幕黑斑)

    kindle屏幕有黑点怎么办(kindle屏幕黑斑)

  • uniapp使用navigateBack方法返回上级页面并刷新(Uniapp使用$base方法)

    uniapp使用navigateBack方法返回上级页面并刷新(Uniapp使用$base方法)

  • 合伙律师事务所的合伙人必须是
  • 物业公司一般纳税人增值税税率
  • 财务报表申报错误怎么办
  • 电子税务局怎么添加财务负责人
  • 住宿费电子发票样式
  • 个体工商户需要报税吗
  • 对公账户卡号是私人账号
  • 企业人员信息已存在无需新增
  • 无形资产摊销和累计摊销一样吗
  • 津贴个人所得税怎么算出来的
  • 进出口公司如何避税
  • 车辆报废补贴多久到账
  • 非营利性代收代付费用会计处理怎么做?
  • 母公司收到的分红计入利润吗
  • 从农民手中购进农产品进项税
  • 增值税税负率税率怎么算
  • 水利基金按含税还是不含税申报
  • 乐器的税率
  • 的商品编码
  • 通用机打发票属于什么发票
  • 购入原材料没有发票只有入库单
  • 一般纳税人兼营不同税率的货物或应税劳务
  • 保护电脑安全的主要方式
  • 进程aissca.exe
  • win10任务栏颜色怎么调
  • 固定资产抵债账务怎么处理
  • mysql.php
  • 工程项目成本费用的分类有哪些?
  • 进项税额转出的所有会计分录
  • php t_string
  • 什么是累计预扣预缴应纳税所得额
  • opencv的函数
  • 税收罚款支出计入其他应付款吗对吗
  • mysql基本命令大全
  • 如何关闭mysqld
  • 房地产企业政府返还款
  • 社保和公积金个人和单位缴纳比例
  • 当期应纳增值税税额的计算流程
  • 递延收益是什么负债
  • 工程安装人工费怎么开票
  • 福利费的进项税额会计分录
  • 开会旅游的费用是多少
  • 工程增值税抵扣比例
  • 酒店营业额下降的原因
  • 原材料按实际成本核算与按计划成本核算相比
  • 应付职工薪酬账户贷方登记的是
  • 小规模企业所得税优惠政策最新2023
  • 汇总帐凭证处理
  • sql server多行添加
  • 在sql server数据库中
  • mysql命令行导出表结构
  • sql数据库检查命令
  • linux网络编程视频教程
  • 图片缩略图是什么意思
  • zzs.exe是病毒吗
  • win7远程桌面连接命令
  • win7免费升win8
  • winedt中文界面
  • window7iis配置步骤
  • win7系统无法共享win10系统打印机
  • win8.1系统怎么升级到win10
  • cocos creator特效制作
  • 3d引擎开发
  • 列举javascript中的所有数据类型
  • Python实现mysql数据库更新表数据接口的功能
  • cocos设置中文
  • jQuery插件能输出到控制台
  • Android getTopActivity的方法
  • android使用教程
  • node vm模块
  • shell脚本 !
  • js插件大全
  • unity3d开发之对象池
  • 手机sd卡满了怎么办
  • javascript怎么学好
  • 使用灭火器人要站在上风口还是下风口
  • 公司权责清单范围
  • 赞颂税务工作者绝句
  • 棚户区改造的回迁房能办房产证吗
  • 新车交购置税的流程图
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设