位置: IT常识 - 正文

深度学习——VGG16模型详解

编辑:rootadmin
深度学习——VGG16模型详解

推荐整理分享深度学习——VGG16模型详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

1、网络结构

VGG16模型很好的适用于分类和定位任务,其名称来自牛津大学几何组(Visual Geometry Group)的缩写。

根据卷积核的大小核卷积层数,VGG共有6种配置,分别为A、A-LRN、B、C、D、E,其中D和E两种是最为常用的VGG16和VGG19。

介绍结构图:

conv3-64 :是指第三层卷积后维度变成64,同样地,conv3-128指的是第三层卷积后维度变成128;input(224x224 RGB image) :指的是输入图片大小为224244的彩色图像,通道为3,即224224*3;maxpool :是指最大池化,在vgg16中,pooling采用的是2*2的最大池化方法(如果不懂最大池化,下面有解释);FC-4096 :指的是全连接层中有4096个节点,同样地,FC-1000为该层全连接层有1000个节点;padding:指的是对矩阵在外边填充n圈,padding=1即填充1圈,5X5大小的矩阵,填充一圈后变成7X7大小;最后补充,vgg16每层卷积的滑动步长stride=1,padding=1,卷积核大小为333;  

如上图VGG16的网络结构为,VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用max-pooling(最大化池)分开,所有隐层的激活单元都采用ReLU函数。具体信息如下:

卷积-卷积-池化-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-全连接-全连接-全连接 通道数分别为64,128,512,512,512,4096,4096,1000。卷积层通道数翻倍,直到512时不再增加。通道数的增加,使更多的信息被提取出来。全连接的4096是经验值,当然也可以是别的数,但是不要小于最后的类别。1000表示要分类的类别数。用池化层作为分界,VGG16共有6个块结构,每个块结构中的通道数相同。因为卷积层和全连接层都有权重系数,也被称为权重层,其中卷积层13层,全连接3层,池化层不涉及权重。所以共有13+3=16层。对于VGG16卷积神经网络而言,其13层卷积层和5层池化层负责进行特征的提取,最后的3层全连接层负责完成分类任务。

2、VGG16的卷积核

VGG使用多个较小卷积核(3x3)的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面相当于进行了更多的非线性映射,可以增加网络的拟合/表达能力。卷积层全部都是3*3的卷积核,用上图中conv3-xxx表示,xxx表示通道数。其步长为1,用padding=same填充。池化层的池化核为2*2

3、卷积计算

深度学习——VGG16模型详解

具体的过程:

输入图像尺寸为224x224x3,经64个通道为3的3x3的卷积核,步长为1,padding=same填充,卷积两次,再经ReLU激活,输出的尺寸大小为224x224x64经max pooling(最大化池化),滤波器为2x2,步长为2,图像尺寸减半,池化后的尺寸变为112x112x64经128个3x3的卷积核,两次卷积,ReLU激活,尺寸变为112x112x128max pooling池化,尺寸变为56x56x128经256个3x3的卷积核,三次卷积,ReLU激活,尺寸变为56x56x256max pooling池化,尺寸变为28x28x256经512个3x3的卷积核,三次卷积,ReLU激活,尺寸变为28x28x512max pooling池化,尺寸变为14x14x512经512个3x3的卷积核,三次卷积,ReLU,尺寸变为14x14x512max pooling池化,尺寸变为7x7x512然后Flatten(),将数据拉平成向量,变成一维51277=25088。再经过两层1x1x4096,一层1x1x1000的全连接层(共三层),经ReLU激活最后通过softmax输出1000个预测结果

从上面的过程可以看出VGG网络结构还是挺简洁的,都是由小卷积核、小池化核、ReLU组合而成。其简化图如下(以VGG16为例):

 4、权重参数(不考虑偏置)

1)输入层有0个参数,所需存储容量为224x224x3=150k 2)对于第一层卷积,由于输入图的通道数是3,网络必须要有通道数为3的的卷积核,这样的卷积核有64个,因此总共有(3x3x3)x64 = 1728个参数。 所需存储容量为224x224x64=3.2M 计算量为:输入图像224×224×3,输出224×224×64,卷积核大小3×3。

所以Times=224×224×3x3×3×64=8.7×107

3)池化层有0个参数,所需存储容量为 图像尺寸x图像尺寸x通道数=xxx k 4)全连接层的权重参数数目的计算方法为:前一层节点数×本层的节点数。因此,全连接层的参数分别为: 7x7x512x4096 = 1027,645,444 4096x4096 = 16,781,321 4096x1000 = 4096000 按上述步骤计算的VGG16整个网络总共所占的存储容量为24M*4bytes=96MB/image 。

所有参数为138M VGG16具有如此之大的参数数目,可以预期它具有很高的拟合能力;

但同时缺点也很明显: 即训练时间过长,调参难度大。 需要的存储容量大,不利于部署。5、VGG模型所需要的内存容量

借鉴一下大佬的图:

 6、总结

通过增加深度能有效地提升性能;VGG16是最佳的模型,从头到尾只有3x3卷积与2x2池化,简洁优美;卷积可代替全连接,可适应各种尺寸的图片。
本文链接地址:https://www.jiuchutong.com/zhishi/287343.html 转载请保留说明!

上一篇:后台管理系统权限管理详解

下一篇:大雾山国家公园中的咆哮叉,田纳西州 (© Bernie Kasper/Getty Images)(大雾山国家公园总部加特林堡)

  • 博客网络营销,企业不容忽视(网络营销博客营销)

    博客网络营销,企业不容忽视(网络营销博客营销)

  • QQ怎么匿名提问好友(qq怎么匿名提问别人)

    QQ怎么匿名提问好友(qq怎么匿名提问别人)

  • 电脑不用音响怎么放声音(电脑不用音响怎么出声音)

    电脑不用音响怎么放声音(电脑不用音响怎么出声音)

  • 独立站是什么(希音独立站是什么)

    独立站是什么(希音独立站是什么)

  • 音乐格式哪种音质最高(音乐格式哪种音效最好)

    音乐格式哪种音质最高(音乐格式哪种音效最好)

  • 流量当月有效什么意思(当月有效的流量包,下个月还有吗)

    流量当月有效什么意思(当月有效的流量包,下个月还有吗)

  • 移动公司通话记录最长可以保存多久(移动营业厅通话记录)

    移动公司通话记录最长可以保存多久(移动营业厅通话记录)

  • vivo蓝牙无法配对(vivo手机蓝牙无法连接设备)

    vivo蓝牙无法配对(vivo手机蓝牙无法连接设备)

  • 微信重新载入数据可以恢复聊天记录吗(微信重新载入数据会怎么样)

    微信重新载入数据可以恢复聊天记录吗(微信重新载入数据会怎么样)

  • 手机烧卡是怎么回事啊(手机烧卡怎么办)

    手机烧卡是怎么回事啊(手机烧卡怎么办)

  • 3500毫安与4000毫安电池差别大吗(3500毫安与4000毫安使用时间)

    3500毫安与4000毫安电池差别大吗(3500毫安与4000毫安使用时间)

  • 华为手表gt2可以接电话吗(华为手表gt2可以下载微信吗)

    华为手表gt2可以接电话吗(华为手表gt2可以下载微信吗)

  • 两个蓝牙耳机可以分开用吗(两个蓝牙耳机可以带上飞机吗)

    两个蓝牙耳机可以分开用吗(两个蓝牙耳机可以带上飞机吗)

  • 单反能换快门吗(微单相机快门可以换吗)

    单反能换快门吗(微单相机快门可以换吗)

  • f10tws怎么双耳机配对(f10twspro怎么双耳机配对)

    f10tws怎么双耳机配对(f10twspro怎么双耳机配对)

  • 手机淘宝币在哪里看(淘宝币怎么获取)

    手机淘宝币在哪里看(淘宝币怎么获取)

  • 苹果手机lla是什么版本(iphone型号lla是哪个国家)

    苹果手机lla是什么版本(iphone型号lla是哪个国家)

  • 一加七手机配什么耳机(一加七手机配什么充电器)

    一加七手机配什么耳机(一加七手机配什么充电器)

  • 华为手机亮度怎么调整(华为手机亮度怎么固定不变)

    华为手机亮度怎么调整(华为手机亮度怎么固定不变)

  • 微信打什么字有特效(微信打什么字有兔子)

    微信打什么字有特效(微信打什么字有兔子)

  • 苹果A2108是什么版(苹果a2108是什么型号mac)

    苹果A2108是什么版(苹果a2108是什么型号mac)

  • 趣步为什么置换不了糖果(趣步商城为什么不能兑换)

    趣步为什么置换不了糖果(趣步商城为什么不能兑换)

  • 怎么搜索微信小程序的游戏(怎么搜索微信小程序)

    怎么搜索微信小程序的游戏(怎么搜索微信小程序)

  • 链家app如何取消关注(链家app如何取消订阅)

    链家app如何取消关注(链家app如何取消订阅)

  • 怎么把内存移到sd卡(怎么把内存移到sd卡红米)

    怎么把内存移到sd卡(怎么把内存移到sd卡红米)

  • 山西省税务申报网站
  • 注销银行帐户需要什么
  • 房子税票是什么意思
  • 增值税附加税的会计处理
  • 利润表利息费用和利息收入
  • 清算期间作为纳税年度
  • 商标转让所需要的材料
  • 购买货物运送运费怎么算
  • 建设工程服务招标管理办法
  • 个人所得税个税申报流程
  • 增值税税负率税率怎么算
  • 卷式发票有税率吗
  • 一般纳税人为其他公司制作标书怎么缴税?
  • 合作保证金规定
  • 开发商开发土地需要交国家什么钱
  • 物业水费电费
  • 租赁设备发票备注栏怎么填写
  • 行政事业性收费包括哪些项目
  • 进料加工分配率是什么意思
  • macos的复制粘贴快捷键
  • .net 安装
  • 未担保余值的账户怎么查
  • thinkphp 路由
  • reader_sl.exe - reader_sl进程有什么用.
  • 政府搬迁补偿款不够建房怎么办
  • 企业投资入股的几种方式
  • 麦克米伦anki
  • php获取访问用户的ip
  • php yield 异步
  • ipad air3发布会价格
  • 小企业会计准则2023电子版
  • vue3如何实现使用SortableJs插件进行表格内的数据项拖拽排序
  • laravel视频教程
  • php管理员和用户登录
  • 浅析是什么意思
  • 收到预付货款下月交货会计分录
  • vue面试题2020
  • pytorch nn.parameters
  • 税前扣除项目应遵循哪些原则
  • 代扣代缴境外增值税税率是多少
  • 其他资本公积如何转出
  • 工会经费月月都缴纳吗?
  • 先计提所得税还是先结转成本
  • 利润分配的基本原则是( )
  • 一般纳税人销售旧货可以开专票吗
  • 季度所得税申报表本年累计怎么填
  • 企业减少注册资本
  • 做账的好处
  • 房地产企业缴纳契税会计分录
  • 进项税额转出再转入
  • 无发票费用可以入账吗
  • 可以从公司公户直接支付给个人的款项有哪些
  • 普票不开明细可以不
  • mysql 5.7.5 m15 winx64安装配置方法图文教程
  • 怎么用u盘装驱动
  • 如何保存xps文件
  • 如何删除windows更新文件
  • apt-key
  • freebsd安装mysql
  • win7系统怎么给C盘扩容
  • winxp系统设置密码
  • linux如何调出鼠标
  • centos6挂载ntfs硬盘
  • css标准规范
  • shell脚本 \r
  • android客户端开发是干嘛的
  • iframe和frame
  • 扇形的菜
  • 用javascript
  • javascript面向对象编程指南
  • python socket用法
  • Android alertDialog 动态添加edittext无法弹出键盘解决方案
  • android按钮按下变色
  • 云南省地方税务局关于城镇土地使用税
  • 进出口贸易产品种类
  • 江苏钢厂排名前十
  • 如何做好基层税务分局长工作
  • oecd国家是什么意思
  • 安徽国家税务局网上办税平台12366
  • 一般纳税人财务报表月报还是季报
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设