位置: IT常识 - 正文

3DResNet 学习记录(3d representation)

编辑:rootadmin
3DResNet 学习记录

推荐整理分享3DResNet 学习记录(3d representation),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:3d representation,3d resnet网络结构,3d resnet pytorch,resnet训练,3d resnet pytorch,3d representation,3d resnet网络结构,3d resnet pytorch,内容如对您有帮助,希望把文章链接给更多的朋友!

近期同时在进行的两个深度学习项目都需要用到3DResNet模型,本着不做调包侠的心态,还是要好好把模型的原理看一看的。

1、ResNet结构理解

首先先理解一下二维的ResNet吧。

ResNet又名残差结构,残差连接等。何恺明大佬提出这个概念是为了解决深层网络的梯度消失和梯度爆炸的问题,以及收敛深层网络的“退化”问题,从而可以使得网络层数变得更深。(常见层数有18-34-50-101-152层)相较于之前的层数大多在10~20层的网络来说,无疑是在层数上有了非常大的突破。

残差结构的原理,主要是把输入输出的映射从F(x)转换到了H(x)=F(x)+x上,这样做的目的,个人理解是:在网络层数足够深的情况下,在接近网络输出端的层结构中,其上一层的输出x很可能已经无限逼近于最优解,这个时候对于此层的参数调整,就可以给网络一种选择:即把F(x)置0,或者赋予很小的权重,让此层的结构发挥的作用是将上一层的输出完好地送至下一层,保留最佳输出的结果,也就是所谓的“恒等映射”。(identity mapping)

而,传统的卷积层结构来说,要调整至这样一种“不怎么改变输入的”参数结构,显然是不如直接将F(x)置为0来的容易的。本质上这是一种模型复杂度的降低(来自李沐老师的观点),即给网络以一个比较“手动”的引导,去让网络的参数能够逼近于你想要的结构。个人认为,这是残差连接能够加深网络层数的一个比较可以解释得通的理由。

另外,这样一种“学习恒等映射”的方法,它的F(x)也未必一定要完全是0,在输入足够趋近最优解的情况下,可以理解为一种“小幅的,进一步促进输出逼近最优的作用”,像是在训练的尾声阶段把lr调的非常小,那种意思。

2、3DCNN的理解

ResNet3D = ResNet+3DConv 所以有必要先理解一下3DConv的基础知识

3DResNet 学习记录(3d representation)

3DConv与2DConv的区别,首先就体现在了卷积核的参数上。

2DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H]

3DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H,T] T在这里一般是指,需要连续考虑多少帧的参数。

以下图为例:

3DConv的shape讨论:对于3DConv来说,他的输入、特征图都从2DConv的单张featuremap变成了一个在时序上堆叠起来的“series feature map”,而每一个“通道”可以理解为图中的一整“块”,如C2中就可以说是有“两个通道”,因为C2是由H1经过了两个不同的卷积核而输出的。而这一个“通道”中,包含的是一个“series”的feature map,比如第一层3DCNN层中,卷积核的WHT参数分别为[7,7,3],表示卷积核的尺寸为7*7,且每一次需要考虑三个帧的信息。H1中一个特征为7帧,那么经过7*7*3的WHT参数的卷积核之后,就会输出一个54*54*5的特征map,所以这样就可以理解,C2中的54*34*23*2的尺寸的来由。

同样地,对于第二层7*6*3的卷积层,三个不同的卷积核分别卷积S3层的feature series map,得到13*6的shape,注意这里,输出的通道数和卷积核的个数是不相等的,这点与2DCNN不同。就是经过在两个通道卷积后,不是像2DCNN那样把他们的结果叠加起来,而是分别映射到两个通道中,这点是导致两者不同的原因。相当于把两个通道“分开来算”

最后一层C6的卷积层,尺度应该是7*4*78*128,也就是2DCNN中inchannel为78,outchannel为128,这样去卷积。最后输出128个1*1的featuremap之后,再用全连接层连起来输出即可~

总体来看,3DConv相对2DConv来说,最大的区别就在于所有的输入,特征,都变成了时序性的,也就是提升了一个维度。经过这样的时序上的卷积,可以有效地提取输入以及特征图中的时序信息,帮助网络更好的理解视频之类的输入。不过,文章中提到的架构,可以看到第一个Hardwired层是去手动地提取了光流,梯度等特征,并不算是一个“端到端”的结构。

而ResNet3D,只是用残差结构将一个个的3DConv模块连接起来,通过实验科学组成一个效果比较好的网络,感觉应该没有太多需要讲的地方,如果后续有新的理解,前来填坑~

Reference:

(6条消息) ResNet详解——通俗易懂版_sunny_yeah_的博客-CSDN博客_resnet

(6条消息) 残差resnet网络原理详解_mao_feng的博客-CSDN博客_resnet

本文链接地址:https://www.jiuchutong.com/zhishi/298724.html 转载请保留说明!

上一篇:Linux 下使用 C++ 实现的 Web 文件服务器(linux运行c++程序)

下一篇:基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现)

  • iqoo neo5可以开空调吗(iqooneo5能开小窗吗)

    iqoo neo5可以开空调吗(iqooneo5能开小窗吗)

  • 美团优选新人免费领东西在哪儿(美团优选新人免费领杯子咋没找到)

    美团优选新人免费领东西在哪儿(美团优选新人免费领杯子咋没找到)

  • iqoo9多重(iQOO9多重)

    iqoo9多重(iQOO9多重)

  • 手机qq音乐怎么添加本地音乐(手机qq音乐怎么关闭自动播放)

    手机qq音乐怎么添加本地音乐(手机qq音乐怎么关闭自动播放)

  • 淘宝商家电话在哪找(淘宝的商家电话)

    淘宝商家电话在哪找(淘宝的商家电话)

  • 公开版是不是国行版本(公开版啥意思?跟国行有啥区别)

    公开版是不是国行版本(公开版啥意思?跟国行有啥区别)

  • 金立手机忘记密码怎么办(金立手机忘记密码了怎么解锁)

    金立手机忘记密码怎么办(金立手机忘记密码了怎么解锁)

  • 电脑屏坏了能修吗(电脑屏坏了修一下多少钱)

    电脑屏坏了能修吗(电脑屏坏了修一下多少钱)

  • vivox27有些什么特殊功能(vivox27有什么好玩的功能)

    vivox27有些什么特殊功能(vivox27有什么好玩的功能)

  • g1610是哪一年的(g1610是哪一年的上市的)

    g1610是哪一年的(g1610是哪一年的上市的)

  • 华为手机情景智能快递怎么不显示了(华为手机情景智能怎么关闭)

    华为手机情景智能快递怎么不显示了(华为手机情景智能怎么关闭)

  • opporeno3是不是5G(opporen3 5g)

    opporeno3是不是5G(opporen3 5g)

  • 亚马逊店铺怎么注册(亚马逊店铺怎么关闭月租)

    亚马逊店铺怎么注册(亚马逊店铺怎么关闭月租)

  • 微信群只有群主才能@所有人吗(微信群只有群主才能拉人吗)

    微信群只有群主才能@所有人吗(微信群只有群主才能拉人吗)

  • 钉钉把对方加入黑名单,对方知道吗(钉钉把对方加入黑名单怎么复原)

    钉钉把对方加入黑名单,对方知道吗(钉钉把对方加入黑名单怎么复原)

  • 华为nova5i长多少厘米(华为nova5i有多长)

    华为nova5i长多少厘米(华为nova5i有多长)

  • 爱奇艺会员连续包月可以随时取消吗(爱奇艺会员连续包月只开一个月)

    爱奇艺会员连续包月可以随时取消吗(爱奇艺会员连续包月只开一个月)

  • 华为屏幕录制怎么弄(华为屏幕录制怎么才能有声音)

    华为屏幕录制怎么弄(华为屏幕录制怎么才能有声音)

  • 淘宝怎么查自己几星级(淘宝怎么查自己花了多少钱)

    淘宝怎么查自己几星级(淘宝怎么查自己花了多少钱)

  • 笔记本电脑过安检会损坏吗(笔记本电脑太卡了怎么解决)

    笔记本电脑过安检会损坏吗(笔记本电脑太卡了怎么解决)

  • 照片如何调分辨率(照片如何调分辨率到300dpi的小程序)

    照片如何调分辨率(照片如何调分辨率到300dpi的小程序)

  • wps段落格式在哪儿(wps里的段落设置在哪里)

    wps段落格式在哪儿(wps里的段落设置在哪里)

  • 萤石移动侦测哪里关闭(萤石移动侦测误报很高)

    萤石移动侦测哪里关闭(萤石移动侦测误报很高)

  • 如何快充手机(手机如何快充)

    如何快充手机(手机如何快充)

  • MAC怎么设置定时关机/重启/睡眠?(mac设置定时任务)

    MAC怎么设置定时关机/重启/睡眠?(mac设置定时任务)

  • 2022 uniapp基础掌握及面试题整理(uniapp零基础小白到项目实战)

    2022 uniapp基础掌握及面试题整理(uniapp零基础小白到项目实战)

  • Ficstar Software � Web Data Extraction Tools

    Ficstar Software � Web Data Extraction Tools

  • php接口中interface的使用方法(php接口怎么调用)

    php接口中interface的使用方法(php接口怎么调用)

  • 发行股票支付给承销商的发行费用计入
  • 贴现手续费计入投资收益
  • 投资性房地产在非货币性资产交换怎么处理
  • 简易征收的收入包括哪些
  • 工资 小数点
  • 其他应收款报表数据怎么取
  • 金税盘无法连接jk开票
  • 物业费专用发票税率
  • 去年的进项发票今年还能抵扣吗
  • 损益表上的数据怎么看
  • 固定资产账面价值公式
  • 平行式明细账
  • 固定资产的确认条件是什么
  • 固定资产采用工作量法计提折旧怎么算
  • 现金收据为什么也在自制原始凭证的范畴呢?
  • 房地产预缴增值税是含税还是不含税
  • 地税的发票
  • 房屋销售佣金能退回吗
  • 减税降费在中国 应形成制度性
  • 污水处理服务费用交印花税吗
  • 个体户生产经营所得税率表2023
  • 日用品 食品
  • 公司自建办公楼
  • psdrvcheck.exe - psdrvcheck是什么进程 有什么用
  • 电商第三方平台规则的特点
  • 铁路运输企业所得税优惠
  • 银行对账单怎么写凭证
  • fs209e是什么意思
  • JavaScript includes() 方法
  • vue无线滚动
  • 挂靠设计公司费用标准 怎么记账
  • vue实现简易购物车
  • Ant Design-vue 解决input前后空格问题(推荐)
  • 其他权益工具投资公允价值变动怎么计算
  • 开发项目完工后多久开工
  • 诉讼代理费计入事业单位什么科目
  • 劳务费个税申报流程
  • 安装sql server 2008硬件要求
  • SQL Server中使用的SQL是
  • 一般纳税人应交税费二级科目有哪些
  • 事业单位退休人员判缓刑最新规定
  • 事业单位净资产变动表
  • 税务多措并举
  • 买一赠一怎么做账
  • 递延所得税如何理解
  • 今年发的去年的工资怎么扣税
  • 电商平台 流量
  • 投资性房地产与持有待售资产的区别
  • 商品预计退回会扣钱吗
  • 贷记坏账准备借记什么
  • 核定征收方式有哪些
  • 房地产会计相关内容
  • win8系统怎么查看隐藏文件
  • win8 vmware
  • centos7添加ip地址
  • 光盘做镜像文件
  • 打开优酷视频播放
  • 微软发布新系统
  • win10高对比度设置点了没反应
  • w7系统怎么扫描
  • windows7磁盘管理
  • linux bin和sbin
  • centos开启后一直黑屏
  • 删掉sam文件后无法开机
  • 飞行体验设备
  • 在linux系统中,用来存放系统所需要的
  • win7回收站图标在哪个文件夹
  • cocos2dx环境搭建
  • 塔防游戏二战
  • setcontentview报错
  • jquery中的siblings方法
  • git pull could not read from remote repository
  • JavaScript+html5 canvas绘制的小人效果
  • 用javascript
  • javascript src
  • android高级开发实战------ui、ndk与安全
  • 税务局 笔录
  • 百望税控盘电子发票怎么打
  • 怎么在年报查询个人信息
  • 宜昌市西陵区国税局局长
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设