位置: IT常识 - 正文

3DResNet 学习记录(3d representation)

编辑:rootadmin
3DResNet 学习记录

推荐整理分享3DResNet 学习记录(3d representation),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:3d representation,3d resnet网络结构,3d resnet pytorch,resnet训练,3d resnet pytorch,3d representation,3d resnet网络结构,3d resnet pytorch,内容如对您有帮助,希望把文章链接给更多的朋友!

近期同时在进行的两个深度学习项目都需要用到3DResNet模型,本着不做调包侠的心态,还是要好好把模型的原理看一看的。

1、ResNet结构理解

首先先理解一下二维的ResNet吧。

ResNet又名残差结构,残差连接等。何恺明大佬提出这个概念是为了解决深层网络的梯度消失和梯度爆炸的问题,以及收敛深层网络的“退化”问题,从而可以使得网络层数变得更深。(常见层数有18-34-50-101-152层)相较于之前的层数大多在10~20层的网络来说,无疑是在层数上有了非常大的突破。

残差结构的原理,主要是把输入输出的映射从F(x)转换到了H(x)=F(x)+x上,这样做的目的,个人理解是:在网络层数足够深的情况下,在接近网络输出端的层结构中,其上一层的输出x很可能已经无限逼近于最优解,这个时候对于此层的参数调整,就可以给网络一种选择:即把F(x)置0,或者赋予很小的权重,让此层的结构发挥的作用是将上一层的输出完好地送至下一层,保留最佳输出的结果,也就是所谓的“恒等映射”。(identity mapping)

而,传统的卷积层结构来说,要调整至这样一种“不怎么改变输入的”参数结构,显然是不如直接将F(x)置为0来的容易的。本质上这是一种模型复杂度的降低(来自李沐老师的观点),即给网络以一个比较“手动”的引导,去让网络的参数能够逼近于你想要的结构。个人认为,这是残差连接能够加深网络层数的一个比较可以解释得通的理由。

另外,这样一种“学习恒等映射”的方法,它的F(x)也未必一定要完全是0,在输入足够趋近最优解的情况下,可以理解为一种“小幅的,进一步促进输出逼近最优的作用”,像是在训练的尾声阶段把lr调的非常小,那种意思。

2、3DCNN的理解

ResNet3D = ResNet+3DConv 所以有必要先理解一下3DConv的基础知识

3DResNet 学习记录(3d representation)

3DConv与2DConv的区别,首先就体现在了卷积核的参数上。

2DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H]

3DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H,T] T在这里一般是指,需要连续考虑多少帧的参数。

以下图为例:

3DConv的shape讨论:对于3DConv来说,他的输入、特征图都从2DConv的单张featuremap变成了一个在时序上堆叠起来的“series feature map”,而每一个“通道”可以理解为图中的一整“块”,如C2中就可以说是有“两个通道”,因为C2是由H1经过了两个不同的卷积核而输出的。而这一个“通道”中,包含的是一个“series”的feature map,比如第一层3DCNN层中,卷积核的WHT参数分别为[7,7,3],表示卷积核的尺寸为7*7,且每一次需要考虑三个帧的信息。H1中一个特征为7帧,那么经过7*7*3的WHT参数的卷积核之后,就会输出一个54*54*5的特征map,所以这样就可以理解,C2中的54*34*23*2的尺寸的来由。

同样地,对于第二层7*6*3的卷积层,三个不同的卷积核分别卷积S3层的feature series map,得到13*6的shape,注意这里,输出的通道数和卷积核的个数是不相等的,这点与2DCNN不同。就是经过在两个通道卷积后,不是像2DCNN那样把他们的结果叠加起来,而是分别映射到两个通道中,这点是导致两者不同的原因。相当于把两个通道“分开来算”

最后一层C6的卷积层,尺度应该是7*4*78*128,也就是2DCNN中inchannel为78,outchannel为128,这样去卷积。最后输出128个1*1的featuremap之后,再用全连接层连起来输出即可~

总体来看,3DConv相对2DConv来说,最大的区别就在于所有的输入,特征,都变成了时序性的,也就是提升了一个维度。经过这样的时序上的卷积,可以有效地提取输入以及特征图中的时序信息,帮助网络更好的理解视频之类的输入。不过,文章中提到的架构,可以看到第一个Hardwired层是去手动地提取了光流,梯度等特征,并不算是一个“端到端”的结构。

而ResNet3D,只是用残差结构将一个个的3DConv模块连接起来,通过实验科学组成一个效果比较好的网络,感觉应该没有太多需要讲的地方,如果后续有新的理解,前来填坑~

Reference:

(6条消息) ResNet详解——通俗易懂版_sunny_yeah_的博客-CSDN博客_resnet

(6条消息) 残差resnet网络原理详解_mao_feng的博客-CSDN博客_resnet

本文链接地址:https://www.jiuchutong.com/zhishi/298724.html 转载请保留说明!

上一篇:Linux 下使用 C++ 实现的 Web 文件服务器(linux运行c++程序)

下一篇:基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现)

  • 怎样精准提升转化率?这里有三大要素你都get了吗(怎么提升转化)

    怎样精准提升转化率?这里有三大要素你都get了吗(怎么提升转化)

  • 怎么把截屏放在触控里(怎么把截屏放在悬浮窗第一页)

    怎么把截屏放在触控里(怎么把截屏放在悬浮窗第一页)

  • 荣耀20双击亮屏在哪里设置(荣耀20双击亮屏是不是取消了)

    荣耀20双击亮屏在哪里设置(荣耀20双击亮屏是不是取消了)

  • 小米手机怎么设置地震预警(小米手机怎么设置骚扰电话直接拦截)

    小米手机怎么设置地震预警(小米手机怎么设置骚扰电话直接拦截)

  • 怎样隐身访问陌生人的qq空间(怎样隐身访问陌生人的qq空间,还会显示加一吗)

    怎样隐身访问陌生人的qq空间(怎样隐身访问陌生人的qq空间,还会显示加一吗)

  • 什么的出现使制造面向个人用户的微型计算机成为可能(什么的出现以及什么的发展)

    什么的出现使制造面向个人用户的微型计算机成为可能(什么的出现以及什么的发展)

  • 抖音上翅膀的特效怎么弄的(抖音翅膀是哪个特效)

    抖音上翅膀的特效怎么弄的(抖音翅膀是哪个特效)

  • iphone8有无线充电吗(苹果8有无线充电器)

    iphone8有无线充电吗(苹果8有无线充电器)

  • 微信卡包删除了怎么恢复(微信卡包删除了港澳通行证还能用吗)

    微信卡包删除了怎么恢复(微信卡包删除了港澳通行证还能用吗)

  • 300m光纤用多大路由器(300m光纤是什么意思)

    300m光纤用多大路由器(300m光纤是什么意思)

  • mate30pro有没有4g版本(mate30Pro有没有光学防抖)

    mate30pro有没有4g版本(mate30Pro有没有光学防抖)

  • 微信注销对方还有聊天记录吗(微信注销对方还能收到信息吗)

    微信注销对方还有聊天记录吗(微信注销对方还能收到信息吗)

  • 独显都可以组双通道吗(独显都可以组双显吗)

    独显都可以组双通道吗(独显都可以组双显吗)

  • 抖音收藏的视频在哪里可以看(抖音收藏的视频收藏夹里不显示)

    抖音收藏的视频在哪里可以看(抖音收藏的视频收藏夹里不显示)

  • 手机刷机后内置的软件怎么卸载(手机刷机后内置卡怎么办)

    手机刷机后内置的软件怎么卸载(手机刷机后内置卡怎么办)

  • 如何进入运行窗口(如何进入运行窗口界面)

    如何进入运行窗口(如何进入运行窗口界面)

  • 内存卡扩容是什么意思(内存卡扩容有什么坏处)

    内存卡扩容是什么意思(内存卡扩容有什么坏处)

  • 三星s10支持无线充电吗(三星s10支持无线充电多少瓦)

    三星s10支持无线充电吗(三星s10支持无线充电多少瓦)

  • 一加7pro的缺点(一加7pro优缺点总结)

    一加7pro的缺点(一加7pro优缺点总结)

  • 佳能50d还能用吗(佳能50d刚上市多少钱啊)

    佳能50d还能用吗(佳能50d刚上市多少钱啊)

  • a7r2和a7m2区别(索尼a7r2和a7m2区别)

    a7r2和a7m2区别(索尼a7r2和a7m2区别)

  • 华为mate20pro支持5g网吗(华为mate20pro支持红外线遥控吗)

    华为mate20pro支持5g网吗(华为mate20pro支持红外线遥控吗)

  • 抖音怎么刷新视频(抖音怎么刷新视频数据)

    抖音怎么刷新视频(抖音怎么刷新视频数据)

  • win11系统怎么获取管理员权限? windows11添加管理员权限的技巧(怎样获得win11)

    win11系统怎么获取管理员权限? windows11添加管理员权限的技巧(怎样获得win11)

  • 没有收到win10推送怎么办(windows2004没有推送)

    没有收到win10推送怎么办(windows2004没有推送)

  • 暂估入库的价格一般会高一些吗
  • 本月销售商品的实际成本怎么算
  • 怎么导出银行对账单流水
  • 租赁厂房电费
  • 小规模开普票一个季度不能超过多少钱是免税的
  • 产成品出库入库单
  • 给职工发奖金有什么规定吗
  • 不征税项目可以抵扣进项税吗
  • 进口货物要交消费税吗
  • 印花税申报表如何填写
  • 物业签订的合同
  • 空调可以开专票抵扣吗
  • 办税员身份怎么办理
  • 个人能否去税务登记
  • 增值税发票时效性
  • 税控维护费发票图片
  • 生产人员社保怎么做账
  • 小规模纳税人的税率是多少
  • 注册资本多少钱算大公司
  • 红字发票怎么填申报表表二
  • win10分辨率调整
  • win7系统安装包多大
  • 纽约公共图书馆开放时间
  • laravel php
  • php单例模式连接数据库
  • 调入的无形资产记入哪里
  • 少数股东权益贷方表示什么意思
  • adas数据集
  • vue父组件子组件
  • node.js教程详细
  • vue3 $bus
  • 企业的会计科目可以任意设置随意修改
  • 桥闸通行费发票上注明的金额含税吗
  • 进项转出分录处理
  • 工会经费,残保金,会计分录
  • 报销差旅费用什么发票
  • 捐赠支出汇算清缴需要调增吗
  • 进口货物会计分录举例
  • 欠款在公司注销怎么处理
  • sql server临时表的生命周期
  • 建筑企业结转成本附件
  • 所得税申报报表
  • 应收账款的注意要点
  • 跨年租金如何处理
  • 减免残保金相关政策
  • 付款金额与收到款的关系
  • 中小企业收款
  • 招标代理服务费取费标准
  • 怎样计算税款
  • 公司的固定资产怎么处理
  • 电信通讯费发票抬头
  • sql常用语句大全 实例
  • mysql根据另一张表更新
  • system is boot up with
  • win8.1开机密码忘了
  • 微软9月补丁
  • Win10/Win8.1 PC版WhatsApp更新:新的emoji表情符号
  • windows2000serve
  • 通过注册表删除脱机打印机
  • ubuntu20.04最小化安装教程
  • 如何让windows7更快
  • win8 metro应用
  • linux 详解
  • win10无法uefi
  • win xp 内存
  • LiteSpeed添加虚拟主机+支持htaccess图文教程
  • 越狱免电脑
  • win8 屏幕键盘
  • perl计算时间差
  • shell中的括号
  • js异步编程的四种方法
  • 重新加载activity
  • 国家税务总局班子简历
  • 发票上的税务号
  • 怎么查询企业的联系方式
  • 第三方审计报告需要多久
  • 销售货物免征增值税时收取的增值税税款需计入当期损益
  • 临时占用耕地是否需要缴纳城镇土地使用税
  • 金税三期可以申报个税吗
  • 交强险和车船税网上购买
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设