位置: IT常识 - 正文

3DResNet 学习记录(3d representation)

发布时间:2024-01-17
3DResNet 学习记录

推荐整理分享3DResNet 学习记录(3d representation),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:3d representation,3d resnet网络结构,3d resnet pytorch,resnet训练,3d resnet pytorch,3d representation,3d resnet网络结构,3d resnet pytorch,内容如对您有帮助,希望把文章链接给更多的朋友!

近期同时在进行的两个深度学习项目都需要用到3DResNet模型,本着不做调包侠的心态,还是要好好把模型的原理看一看的。

1、ResNet结构理解

首先先理解一下二维的ResNet吧。

ResNet又名残差结构,残差连接等。何恺明大佬提出这个概念是为了解决深层网络的梯度消失和梯度爆炸的问题,以及收敛深层网络的“退化”问题,从而可以使得网络层数变得更深。(常见层数有18-34-50-101-152层)相较于之前的层数大多在10~20层的网络来说,无疑是在层数上有了非常大的突破。

残差结构的原理,主要是把输入输出的映射从F(x)转换到了H(x)=F(x)+x上,这样做的目的,个人理解是:在网络层数足够深的情况下,在接近网络输出端的层结构中,其上一层的输出x很可能已经无限逼近于最优解,这个时候对于此层的参数调整,就可以给网络一种选择:即把F(x)置0,或者赋予很小的权重,让此层的结构发挥的作用是将上一层的输出完好地送至下一层,保留最佳输出的结果,也就是所谓的“恒等映射”。(identity mapping)

而,传统的卷积层结构来说,要调整至这样一种“不怎么改变输入的”参数结构,显然是不如直接将F(x)置为0来的容易的。本质上这是一种模型复杂度的降低(来自李沐老师的观点),即给网络以一个比较“手动”的引导,去让网络的参数能够逼近于你想要的结构。个人认为,这是残差连接能够加深网络层数的一个比较可以解释得通的理由。

另外,这样一种“学习恒等映射”的方法,它的F(x)也未必一定要完全是0,在输入足够趋近最优解的情况下,可以理解为一种“小幅的,进一步促进输出逼近最优的作用”,像是在训练的尾声阶段把lr调的非常小,那种意思。

2、3DCNN的理解

ResNet3D = ResNet+3DConv 所以有必要先理解一下3DConv的基础知识

3DResNet 学习记录(3d representation)

3DConv与2DConv的区别,首先就体现在了卷积核的参数上。

2DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H]

3DConv的卷积核尺寸一般为:[in_channels,out_channels,W,H,T] T在这里一般是指,需要连续考虑多少帧的参数。

以下图为例:

3DConv的shape讨论:对于3DConv来说,他的输入、特征图都从2DConv的单张featuremap变成了一个在时序上堆叠起来的“series feature map”,而每一个“通道”可以理解为图中的一整“块”,如C2中就可以说是有“两个通道”,因为C2是由H1经过了两个不同的卷积核而输出的。而这一个“通道”中,包含的是一个“series”的feature map,比如第一层3DCNN层中,卷积核的WHT参数分别为[7,7,3],表示卷积核的尺寸为7*7,且每一次需要考虑三个帧的信息。H1中一个特征为7帧,那么经过7*7*3的WHT参数的卷积核之后,就会输出一个54*54*5的特征map,所以这样就可以理解,C2中的54*34*23*2的尺寸的来由。

同样地,对于第二层7*6*3的卷积层,三个不同的卷积核分别卷积S3层的feature series map,得到13*6的shape,注意这里,输出的通道数和卷积核的个数是不相等的,这点与2DCNN不同。就是经过在两个通道卷积后,不是像2DCNN那样把他们的结果叠加起来,而是分别映射到两个通道中,这点是导致两者不同的原因。相当于把两个通道“分开来算”

最后一层C6的卷积层,尺度应该是7*4*78*128,也就是2DCNN中inchannel为78,outchannel为128,这样去卷积。最后输出128个1*1的featuremap之后,再用全连接层连起来输出即可~

总体来看,3DConv相对2DConv来说,最大的区别就在于所有的输入,特征,都变成了时序性的,也就是提升了一个维度。经过这样的时序上的卷积,可以有效地提取输入以及特征图中的时序信息,帮助网络更好的理解视频之类的输入。不过,文章中提到的架构,可以看到第一个Hardwired层是去手动地提取了光流,梯度等特征,并不算是一个“端到端”的结构。

而ResNet3D,只是用残差结构将一个个的3DConv模块连接起来,通过实验科学组成一个效果比较好的网络,感觉应该没有太多需要讲的地方,如果后续有新的理解,前来填坑~

Reference:

(6条消息) ResNet详解——通俗易懂版_sunny_yeah_的博客-CSDN博客_resnet

(6条消息) 残差resnet网络原理详解_mao_feng的博客-CSDN博客_resnet

本文链接地址:https://www.jiuchutong.com/zhishi/298724.html 转载请保留说明!

上一篇:Linux 下使用 C++ 实现的 Web 文件服务器(linux运行c++程序)

下一篇:基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现)

  • 茶叶网页设计发布上线企业网站并提交到各大搜索引擎的站长平台绑定企业网站域名后

    茶叶网页设计发布上线企业网站并提交到各大搜索引擎的站长平台绑定企业网站域名后

  • 华为watch3电池续航时间多久(华为watch3电池续航感受)

    华为watch3电池续航时间多久(华为watch3电池续航感受)

  • 三星watch4怎么启动息屏提醒(三星手表watch3怎么设置)

    三星watch4怎么启动息屏提醒(三星手表watch3怎么设置)

  • 滴滴长途单有空返费吗(滴滴接长途单空回怎么办)

    滴滴长途单有空返费吗(滴滴接长途单空回怎么办)

  • 移动wifi在哪买(移动wifi哪里买)

    移动wifi在哪买(移动wifi哪里买)

  • 手机右下角有个小人是什么意思(手机右下角有个小人图标怎么取消)

    手机右下角有个小人是什么意思(手机右下角有个小人图标怎么取消)

  • 网络显示拒绝接入是什么意思(网络显示拒绝接入网络)

    网络显示拒绝接入是什么意思(网络显示拒绝接入网络)

  • 可擦写光盘有什么标识(可擦写光盘能擦写多少次)

    可擦写光盘有什么标识(可擦写光盘能擦写多少次)

  • 互删微信好友如何恢复(互删微信好友如何加回来)

    互删微信好友如何恢复(互删微信好友如何加回来)

  • 平板电脑能插u盘吗(华为平板电脑能插u盘吗)

    平板电脑能插u盘吗(华为平板电脑能插u盘吗)

  • 天猫旗舰店怎么投诉(天猫旗舰店怎么看是不是官方的)

    天猫旗舰店怎么投诉(天猫旗舰店怎么看是不是官方的)

  • 韩剧tv怎么换储存路线(韩剧tv怎么换储存位置)

    韩剧tv怎么换储存路线(韩剧tv怎么换储存位置)

  • 手机京东怎么撤销退款(京东怎么撤销)

    手机京东怎么撤销退款(京东怎么撤销)

  • oppoa5怎么添加桌面插件(oppoa5怎么设置桌面时间)

    oppoa5怎么添加桌面插件(oppoa5怎么设置桌面时间)

  • 快手怎么删除自己作品(快手怎么删除自己的视频)

    快手怎么删除自己作品(快手怎么删除自己的视频)

  • 小米电动牙刷怎么连不上米家app(小米电动牙刷怎么用)

    小米电动牙刷怎么连不上米家app(小米电动牙刷怎么用)

  • 矢量图怎么做(logo矢量图怎么做)

    矢量图怎么做(logo矢量图怎么做)

  • 火山封禁怎么解绑身份证(火山封号了是什么状态)

    火山封禁怎么解绑身份证(火山封号了是什么状态)

  • 苹果xsmax怎么开机啊(苹果xsmax怎么开空调教程)

    苹果xsmax怎么开机啊(苹果xsmax怎么开空调教程)

  • airpods大小尺寸(airpods大小尺寸一样吗)

    airpods大小尺寸(airpods大小尺寸一样吗)

  • iphone x进水后怎么办(iphone x进水后开不了机)

    iphone x进水后怎么办(iphone x进水后开不了机)

  • oppor15卸载了软件怎么找回(oppo系统软件卸载)

    oppor15卸载了软件怎么找回(oppo系统软件卸载)

  • 怎么看手机号码(怎么看手机号码归属地)

    怎么看手机号码(怎么看手机号码归属地)

  • Win10的静默安装检测功能(静默安装命令)

    Win10的静默安装检测功能(静默安装命令)

  • 若依ruoyi——手把手教你制作自己的管理系统【二、修改样式】(若依官网)

    若依ruoyi——手把手教你制作自己的管理系统【二、修改样式】(若依官网)

  • 带你看看 TypeScript 5.0 的新特性(带你看看房间英语怎么写)

    带你看看 TypeScript 5.0 的新特性(带你看看房间英语怎么写)

  • 如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署(如何在亚马逊平台卖货)

    如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署(如何在亚马逊平台卖货)

  • python中合并表格的两种方法(python合并多个excel)

    python中合并表格的两种方法(python合并多个excel)

  • python操作微信客户端:WechatPCAPI库实现自动化回复(python 微信)

    python操作微信客户端:WechatPCAPI库实现自动化回复(python 微信)

  • 个人偶然所得税率多少
  • 计提代扣个人工会经费怎么做账
  • 一般纳税人月销售额多少免征增值税
  • 直线法计提折旧的公式预计净残值
  • 准予抵扣的进项税范围
  • 在建工程进项税额分两年抵扣
  • 公司宣传牌模板
  • 机打发票2017年7月份以后可以用吗?
  • 利润分配以前年度损益调整
  • 可以税前扣除的收据有哪些
  • 自建房屋没有发票如何入账
  • 按适用税率征税货物及劳务销售额
  • 中小企业划分标准
  • 会计师事务所执业许可和监督管理办法
  • 污水处理增值税征收品目
  • 企业之间的无偿借贷行为,作为借款方需要缴纳哪些税
  • 进项税额加计扣除分录
  • mac如何登陆两个微信
  • win10桌面网络图标怎么调出来
  • 公司向法人借款有税务风险吗
  • 注销公司如何注销
  • 加工费入什么会计科目
  • mediacachefiles什么意思
  • 绿萝怎么修剪才能更旺盛
  • php配置文件的名字是
  • 销售费用属于损益类科目的收入还是费用
  • 不良资产核销的条件 追偿180天
  • 营业外收支的内容
  • php单例模式应用场景
  • 设计协会是干什么的
  • uni-app ——使用uploadFile上传多张图片
  • nvm切换node版本后node -v报错
  • 一个惊艳了
  • php中&&什么意思
  • 职工食堂资金管理办法
  • 成本收入核算表
  • 平行结转分步法的特点
  • 购办公桌椅入什么费用
  • 长期待摊费用最低摊销年限
  • 土地使用权被政府收回没有注销怎么样缴土地使用税
  • 本年利润的会计分录
  • 购入固定资产印花税税目是什么
  • 工程施工企业收入1750万,利润怎么算
  • 利润表和资产负债表不平的原因
  • 工程外经证预缴税款计税方法
  • 为什么说运输是实现物流合理化的关键
  • 出口货款收不回怎么办
  • 预付卡销售成品油会计分录
  • 行政事业单位核销固定资产的账务处理
  • 本月购进金额怎么算
  • 利息资本化的利弊
  • 残疾基金缴纳标准
  • 有会计从业资格证还有用吗
  • 机票 进项抵扣
  • 航天金税电子发票怎么读入
  • 什么是增资扩股协议
  • windows自带软件有哪些
  • win8更新win8.1
  • mac应用图标不见了怎么办
  • centos如何运行程序
  • solaris 11.4
  • 如何ie8升级到10
  • VirtualBox虚拟机免费
  • win7界面比win10好看
  • win7系统硬盘
  • win7系统c盘占用空间大
  • linux中的top命令
  • win8.1开不了机怎么办
  • 在linux操作系统中
  • linux文件一般放哪里
  • windows10 2021预览版
  • shell的case语法
  • python模拟软件
  • 详解金球奖之争
  • enum枚举类型
  • js设置延时执行
  • 四川国税局普通发票查询?
  • 单位为员工报销医药
  • 新加坡关税壁垒
  • 北京税务局网站官网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号