位置: IT常识 - 正文

深度学习——VGG16模型详解

编辑:rootadmin
深度学习——VGG16模型详解

推荐整理分享深度学习——VGG16模型详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

1、网络结构

VGG16模型很好的适用于分类和定位任务,其名称来自牛津大学几何组(Visual Geometry Group)的缩写。

根据卷积核的大小核卷积层数,VGG共有6种配置,分别为A、A-LRN、B、C、D、E,其中D和E两种是最为常用的VGG16和VGG19。

介绍结构图:

conv3-64 :是指第三层卷积后维度变成64,同样地,conv3-128指的是第三层卷积后维度变成128;input(224x224 RGB image) :指的是输入图片大小为224244的彩色图像,通道为3,即224224*3;maxpool :是指最大池化,在vgg16中,pooling采用的是2*2的最大池化方法(如果不懂最大池化,下面有解释);FC-4096 :指的是全连接层中有4096个节点,同样地,FC-1000为该层全连接层有1000个节点;padding:指的是对矩阵在外边填充n圈,padding=1即填充1圈,5X5大小的矩阵,填充一圈后变成7X7大小;最后补充,vgg16每层卷积的滑动步长stride=1,padding=1,卷积核大小为333;  

如上图VGG16的网络结构为,VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用max-pooling(最大化池)分开,所有隐层的激活单元都采用ReLU函数。具体信息如下:

卷积-卷积-池化-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-全连接-全连接-全连接 通道数分别为64,128,512,512,512,4096,4096,1000。卷积层通道数翻倍,直到512时不再增加。通道数的增加,使更多的信息被提取出来。全连接的4096是经验值,当然也可以是别的数,但是不要小于最后的类别。1000表示要分类的类别数。用池化层作为分界,VGG16共有6个块结构,每个块结构中的通道数相同。因为卷积层和全连接层都有权重系数,也被称为权重层,其中卷积层13层,全连接3层,池化层不涉及权重。所以共有13+3=16层。对于VGG16卷积神经网络而言,其13层卷积层和5层池化层负责进行特征的提取,最后的3层全连接层负责完成分类任务。

2、VGG16的卷积核

VGG使用多个较小卷积核(3x3)的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面相当于进行了更多的非线性映射,可以增加网络的拟合/表达能力。卷积层全部都是3*3的卷积核,用上图中conv3-xxx表示,xxx表示通道数。其步长为1,用padding=same填充。池化层的池化核为2*2

3、卷积计算

深度学习——VGG16模型详解

具体的过程:

输入图像尺寸为224x224x3,经64个通道为3的3x3的卷积核,步长为1,padding=same填充,卷积两次,再经ReLU激活,输出的尺寸大小为224x224x64经max pooling(最大化池化),滤波器为2x2,步长为2,图像尺寸减半,池化后的尺寸变为112x112x64经128个3x3的卷积核,两次卷积,ReLU激活,尺寸变为112x112x128max pooling池化,尺寸变为56x56x128经256个3x3的卷积核,三次卷积,ReLU激活,尺寸变为56x56x256max pooling池化,尺寸变为28x28x256经512个3x3的卷积核,三次卷积,ReLU激活,尺寸变为28x28x512max pooling池化,尺寸变为14x14x512经512个3x3的卷积核,三次卷积,ReLU,尺寸变为14x14x512max pooling池化,尺寸变为7x7x512然后Flatten(),将数据拉平成向量,变成一维51277=25088。再经过两层1x1x4096,一层1x1x1000的全连接层(共三层),经ReLU激活最后通过softmax输出1000个预测结果

从上面的过程可以看出VGG网络结构还是挺简洁的,都是由小卷积核、小池化核、ReLU组合而成。其简化图如下(以VGG16为例):

 4、权重参数(不考虑偏置)

1)输入层有0个参数,所需存储容量为224x224x3=150k 2)对于第一层卷积,由于输入图的通道数是3,网络必须要有通道数为3的的卷积核,这样的卷积核有64个,因此总共有(3x3x3)x64 = 1728个参数。 所需存储容量为224x224x64=3.2M 计算量为:输入图像224×224×3,输出224×224×64,卷积核大小3×3。

所以Times=224×224×3x3×3×64=8.7×107

3)池化层有0个参数,所需存储容量为 图像尺寸x图像尺寸x通道数=xxx k 4)全连接层的权重参数数目的计算方法为:前一层节点数×本层的节点数。因此,全连接层的参数分别为: 7x7x512x4096 = 1027,645,444 4096x4096 = 16,781,321 4096x1000 = 4096000 按上述步骤计算的VGG16整个网络总共所占的存储容量为24M*4bytes=96MB/image 。

所有参数为138M VGG16具有如此之大的参数数目,可以预期它具有很高的拟合能力;

但同时缺点也很明显: 即训练时间过长,调参难度大。 需要的存储容量大,不利于部署。5、VGG模型所需要的内存容量

借鉴一下大佬的图:

 6、总结

通过增加深度能有效地提升性能;VGG16是最佳的模型,从头到尾只有3x3卷积与2x2池化,简洁优美;卷积可代替全连接,可适应各种尺寸的图片。
本文链接地址:https://www.jiuchutong.com/zhishi/287343.html 转载请保留说明!

上一篇:后台管理系统权限管理详解

下一篇:大雾山国家公园中的咆哮叉,田纳西州 (© Bernie Kasper/Getty Images)(大雾山国家公园总部加特林堡)

  • 苹果11还会冻关机吗(苹果11手机怕冻吗)

    苹果11还会冻关机吗(苹果11手机怕冻吗)

  • 电脑正在更新怎么取消(电脑正在更新怎么取消让他开机)

    电脑正在更新怎么取消(电脑正在更新怎么取消让他开机)

  • 冰箱包装扔了能退货吗(冰箱包装扔了能放多久)

    冰箱包装扔了能退货吗(冰箱包装扔了能放多久)

  • 用高级程序设计语言编写的程序(用高级程序设计语言编写的程序( ) A)

    用高级程序设计语言编写的程序(用高级程序设计语言编写的程序( ) A)

  • vivo通话记录删了怎么恢复(vivo通话记录删了在手机上如何恢复)

    vivo通话记录删了怎么恢复(vivo通话记录删了在手机上如何恢复)

  • 华为mate30pro网速慢怎么办(华为mate30pro网速不好怎么办)

    华为mate30pro网速慢怎么办(华为mate30pro网速不好怎么办)

  • switch底座充电灯不亮(Switch底座充电灯亮一下)

    switch底座充电灯不亮(Switch底座充电灯亮一下)

  • 在微型计算机结构中运算器包含在什么中(在微型计算机中进行)

    在微型计算机结构中运算器包含在什么中(在微型计算机中进行)

  • 苹果11锁屏右上角有横杠(苹果11锁屏右上角会有一个横条怎么取消)

    苹果11锁屏右上角有横杠(苹果11锁屏右上角会有一个横条怎么取消)

  • 万兆以太网标准支持的传输介质是(万兆以太网标准包含了广域网的物理层协议)

    万兆以太网标准支持的传输介质是(万兆以太网标准包含了广域网的物理层协议)

  • 漫游记录删了 其他手机登录还有吗(漫游记录删了电脑看得到吗)

    漫游记录删了 其他手机登录还有吗(漫游记录删了电脑看得到吗)

  • 淘宝评价被屏蔽能恢复吗(淘宝评价被屏蔽了对账号有影响吗怎么办)

    淘宝评价被屏蔽能恢复吗(淘宝评价被屏蔽了对账号有影响吗怎么办)

  • 微信62数据会不会封(微信62数据使用教程)

    微信62数据会不会封(微信62数据使用教程)

  • 小米手机上网速度慢的解决方法(小米手机上网速度显示)

    小米手机上网速度慢的解决方法(小米手机上网速度显示)

  • 手机打开短信总是闪退(手机短信一打开就停止运行)

    手机打开短信总是闪退(手机短信一打开就停止运行)

  • ios13微信三全音改不了吗(ios14 微信 三全音)

    ios13微信三全音改不了吗(ios14 微信 三全音)

  • 华为屏幕抬起怎么关闭(华为手机怎么调抬起来手机就能亮屏)

    华为屏幕抬起怎么关闭(华为手机怎么调抬起来手机就能亮屏)

  • 华为20i怎么设置返回键(华为20i怎么设置红包提醒)

    华为20i怎么设置返回键(华为20i怎么设置红包提醒)

  • 小米新系统miui11什么时候出(小米新系统miui13小部件)

    小米新系统miui11什么时候出(小米新系统miui13小部件)

  • 电子公交卡可以刷几个人(电子公交卡可以坐地铁吗)

    电子公交卡可以刷几个人(电子公交卡可以坐地铁吗)

  • iPhone6s/6Plus怎么退换货?苹果手机换货方法教程(怎么用苹果6splus)

    iPhone6s/6Plus怎么退换货?苹果手机换货方法教程(怎么用苹果6splus)

  • 骑自行车的好处和坏处(骑自行车的好处功效与作用)

    骑自行车的好处和坏处(骑自行车的好处功效与作用)

  • 小程序怎么自定义导航栏,导航栏放图片、设置高度(小程序怎么自定义tabbar)

    小程序怎么自定义导航栏,导航栏放图片、设置高度(小程序怎么自定义tabbar)

  • 所得税汇算申报完之后可以修改吗
  • 企业所得税减免所得税额怎么算
  • 会计核算程序的含义
  • 贴现率与现值系数的关系
  • 银行贷款印花税是什么意思
  • 小规模纳税人报销会计分录
  • 全年一次性奖金单独计税怎么算
  • 退回的税款如何做账
  • 公司分红股需要交税吗
  • 小微企业免征税怎么做会计分录
  • 用友工资系统参数设置
  • 住宅小区共用部位有哪些
  • 住宿费发票可以抵扣进项税吗
  • 海关证需要年检吗
  • 贴现利息应该计入哪个科目
  • 代理销售保险
  • 在年度汇算清缴前取得去年成本发票
  • 劳务费增值税发票是劳务单位开吗
  • 个人购买办公楼出租要交税吗
  • 增值税纳税申报表电子版在哪下载
  • 哪些资产减值损失可以 转回,哪些不能?
  • 工资计提金额
  • 所得税退税会计分录为啥要借贷所得税费用
  • mac系统怎么删除用户
  • 吊销执照公司资产怎么办
  • 总公司中标分公司签约
  • 修改bios设置
  • 以下哪些企业需要填报
  • 同一控制下的控股合并中,合并方个别财务报表
  • 专项贷款损失准备金在一定程度上具有资本的性质
  • 企业信用贷款还款方式
  • window.location.href返回值
  • 税务变更登记需要带的资料有哪些
  • 机票报销需要哪些才可以
  • zero-shot, one-shot和few-shot
  • php运用
  • 商贸公司对加工的影响
  • 账本印花税怎么申报缴纳
  • 自产货物进项税抵扣
  • 平行结转的约当约当怎么计算
  • python中numpy.empty()函数的用法
  • 织梦一直显示上一页和下一页
  • 交易性金融资产入账价值怎么计算
  • 存货的期末余额是账面余额吗
  • 收付实现制的适用范围
  • 从物资公司购入原木的进项税额
  • 限制性股票应纳税额的确定
  • 销售奖金交税由谁承担
  • 工伤保险交了就可以报销吗
  • 生产企业原材料占产成品的比例
  • 企业中征码怎么查询
  • 多个客户账款明细
  • mysql die
  • 安装sqlserver2008出现无法安装以下功能
  • centosyum源
  • macos mysql
  • win2000系统
  • 主板如何清除cmos
  • mac怎么用bootcamp
  • 电脑系统管理员已阻止这个应用怎么办
  • win7开机黑屏只有鼠标安全模式也不行
  • linux生成文件
  • win 8系统怎么样
  • 安装win7提示
  • javascript 作用域
  • 基于nodejs的项目
  • NGUI学习笔记(摘)
  • unity android build support
  • unity3d怎么写代码
  • hbase shell split
  • linux的syslog配置
  • 浅谈python
  • input按钮的事件处理大全
  • fiori开发
  • js 判断
  • js写日期
  • 网上怎么交车船税
  • 深圳市国家税务局网站
  • 国税局招录条件
  • 土地增值税清算管理规程
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设