位置: IT常识 - 正文

深度学习——VGG16模型详解

编辑:rootadmin
深度学习——VGG16模型详解

推荐整理分享深度学习——VGG16模型详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

1、网络结构

VGG16模型很好的适用于分类和定位任务,其名称来自牛津大学几何组(Visual Geometry Group)的缩写。

根据卷积核的大小核卷积层数,VGG共有6种配置,分别为A、A-LRN、B、C、D、E,其中D和E两种是最为常用的VGG16和VGG19。

介绍结构图:

conv3-64 :是指第三层卷积后维度变成64,同样地,conv3-128指的是第三层卷积后维度变成128;input(224x224 RGB image) :指的是输入图片大小为224244的彩色图像,通道为3,即224224*3;maxpool :是指最大池化,在vgg16中,pooling采用的是2*2的最大池化方法(如果不懂最大池化,下面有解释);FC-4096 :指的是全连接层中有4096个节点,同样地,FC-1000为该层全连接层有1000个节点;padding:指的是对矩阵在外边填充n圈,padding=1即填充1圈,5X5大小的矩阵,填充一圈后变成7X7大小;最后补充,vgg16每层卷积的滑动步长stride=1,padding=1,卷积核大小为333;  

如上图VGG16的网络结构为,VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用max-pooling(最大化池)分开,所有隐层的激活单元都采用ReLU函数。具体信息如下:

卷积-卷积-池化-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-全连接-全连接-全连接 通道数分别为64,128,512,512,512,4096,4096,1000。卷积层通道数翻倍,直到512时不再增加。通道数的增加,使更多的信息被提取出来。全连接的4096是经验值,当然也可以是别的数,但是不要小于最后的类别。1000表示要分类的类别数。用池化层作为分界,VGG16共有6个块结构,每个块结构中的通道数相同。因为卷积层和全连接层都有权重系数,也被称为权重层,其中卷积层13层,全连接3层,池化层不涉及权重。所以共有13+3=16层。对于VGG16卷积神经网络而言,其13层卷积层和5层池化层负责进行特征的提取,最后的3层全连接层负责完成分类任务。

2、VGG16的卷积核

VGG使用多个较小卷积核(3x3)的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面相当于进行了更多的非线性映射,可以增加网络的拟合/表达能力。卷积层全部都是3*3的卷积核,用上图中conv3-xxx表示,xxx表示通道数。其步长为1,用padding=same填充。池化层的池化核为2*2

3、卷积计算

深度学习——VGG16模型详解

具体的过程:

输入图像尺寸为224x224x3,经64个通道为3的3x3的卷积核,步长为1,padding=same填充,卷积两次,再经ReLU激活,输出的尺寸大小为224x224x64经max pooling(最大化池化),滤波器为2x2,步长为2,图像尺寸减半,池化后的尺寸变为112x112x64经128个3x3的卷积核,两次卷积,ReLU激活,尺寸变为112x112x128max pooling池化,尺寸变为56x56x128经256个3x3的卷积核,三次卷积,ReLU激活,尺寸变为56x56x256max pooling池化,尺寸变为28x28x256经512个3x3的卷积核,三次卷积,ReLU激活,尺寸变为28x28x512max pooling池化,尺寸变为14x14x512经512个3x3的卷积核,三次卷积,ReLU,尺寸变为14x14x512max pooling池化,尺寸变为7x7x512然后Flatten(),将数据拉平成向量,变成一维51277=25088。再经过两层1x1x4096,一层1x1x1000的全连接层(共三层),经ReLU激活最后通过softmax输出1000个预测结果

从上面的过程可以看出VGG网络结构还是挺简洁的,都是由小卷积核、小池化核、ReLU组合而成。其简化图如下(以VGG16为例):

 4、权重参数(不考虑偏置)

1)输入层有0个参数,所需存储容量为224x224x3=150k 2)对于第一层卷积,由于输入图的通道数是3,网络必须要有通道数为3的的卷积核,这样的卷积核有64个,因此总共有(3x3x3)x64 = 1728个参数。 所需存储容量为224x224x64=3.2M 计算量为:输入图像224×224×3,输出224×224×64,卷积核大小3×3。

所以Times=224×224×3x3×3×64=8.7×107

3)池化层有0个参数,所需存储容量为 图像尺寸x图像尺寸x通道数=xxx k 4)全连接层的权重参数数目的计算方法为:前一层节点数×本层的节点数。因此,全连接层的参数分别为: 7x7x512x4096 = 1027,645,444 4096x4096 = 16,781,321 4096x1000 = 4096000 按上述步骤计算的VGG16整个网络总共所占的存储容量为24M*4bytes=96MB/image 。

所有参数为138M VGG16具有如此之大的参数数目,可以预期它具有很高的拟合能力;

但同时缺点也很明显: 即训练时间过长,调参难度大。 需要的存储容量大,不利于部署。5、VGG模型所需要的内存容量

借鉴一下大佬的图:

 6、总结

通过增加深度能有效地提升性能;VGG16是最佳的模型,从头到尾只有3x3卷积与2x2池化,简洁优美;卷积可代替全连接,可适应各种尺寸的图片。
本文链接地址:https://www.jiuchutong.com/zhishi/287343.html 转载请保留说明!

上一篇:后台管理系统权限管理详解

下一篇:大雾山国家公园中的咆哮叉,田纳西州 (© Bernie Kasper/Getty Images)(大雾山国家公园总部加特林堡)

  • 苹果x和苹果xsmax的区别(苹果x和苹果xsmax参数对比)

    苹果x和苹果xsmax的区别(苹果x和苹果xsmax参数对比)

  • 6.7英寸的手机多大(6.7英寸的手机多大图片)

    6.7英寸的手机多大(6.7英寸的手机多大图片)

  • 微信发视频给好友最多几分钟(微信发视频给好友失败)

    微信发视频给好友最多几分钟(微信发视频给好友失败)

  • ios13.4.1更新了什么(更新ios13.4.1怎么样)

    ios13.4.1更新了什么(更新ios13.4.1怎么样)

  • sony笔记本无线网络开关在哪里(Sony笔记本无线网络搜索不到)

    sony笔记本无线网络开关在哪里(Sony笔记本无线网络搜索不到)

  • 什么是plc(什么是plc控制)

    什么是plc(什么是plc控制)

  • 抖音拍同款显示网络不给力什么原因(抖音拍同款为什么不成功)

    抖音拍同款显示网络不给力什么原因(抖音拍同款为什么不成功)

  • 手机投不了屏怎么设置(手机投不了屏怎么回事)

    手机投不了屏怎么设置(手机投不了屏怎么回事)

  • 微信电话不挂闹铃会响吗(微信电话怎么不挂)

    微信电话不挂闹铃会响吗(微信电话怎么不挂)

  • 微信好友二维码多久失效(微信好友二维码怎么制作)

    微信好友二维码多久失效(微信好友二维码怎么制作)

  • 开个人热点费手机吗(开个人热点很费电吗)

    开个人热点费手机吗(开个人热点很费电吗)

  • 分隔符和分页符的区别(分隔符和分页符的用法)

    分隔符和分页符的区别(分隔符和分页符的用法)

  • 苹果a1700怎么解锁(苹果a1700怎么解锁密码)

    苹果a1700怎么解锁(苹果a1700怎么解锁密码)

  • 单反如何准确对焦(单反相机如何准确对焦)

    单反如何准确对焦(单反相机如何准确对焦)

  • ios13省电方法(苹果13设置省电)

    ios13省电方法(苹果13设置省电)

  • 华为荣耀20s没有耳机吗(华为荣耀20s没有语音唤醒功能)

    华为荣耀20s没有耳机吗(华为荣耀20s没有语音唤醒功能)

  • ipad维修要发票吗(ipad维修发票时间和激活)

    ipad维修要发票吗(ipad维修发票时间和激活)

  • acin是什么接入电源吗(acn acl)

    acin是什么接入电源吗(acn acl)

  • 荣耀手环5和4的区别(荣耀手环5华为手环4区别)

    荣耀手环5和4的区别(荣耀手环5华为手环4区别)

  • 华为滑盖手机是哪一款(华为滑盖手机是哪一款什么时候上市)

    华为滑盖手机是哪一款(华为滑盖手机是哪一款什么时候上市)

  • bose700跟300区别(bose300与700)

    bose700跟300区别(bose300与700)

  • 佳能6d2延时摄影怎么设置(佳能6d2延时摄影教程)

    佳能6d2延时摄影怎么设置(佳能6d2延时摄影教程)

  • xr有线性马达吗(iphonexr的线性马达缩水了吗)

    xr有线性马达吗(iphonexr的线性马达缩水了吗)

  • 转转如何提高浏览量(转转怎样提高浏览量)

    转转如何提高浏览量(转转怎样提高浏览量)

  • 华为鸿蒙2.0正式版系统,对比安卓实测(华为鸿蒙os2.0发布)

    华为鸿蒙2.0正式版系统,对比安卓实测(华为鸿蒙os2.0发布)

  • bcb.exe是什么进程 bcb进程是安全的吗(bc2.exe)

    bcb.exe是什么进程 bcb进程是安全的吗(bc2.exe)

  • 总账会计的职责目标设定
  • 临时性雇佣人员是指
  • 计入职工福利费的有哪些
  • 代扣个税怎么做凭证
  • 什么是价外税价外税有哪些
  • 公积金个人缴纳多少
  • 食堂买菜未取得消费凭证
  • 企业增加注册资本需要缴纳什么税
  • 负债与递延收益的区别
  • 增值税普票遗失了怎么办
  • 一般纳税人注销公司麻烦吗
  • 技术服务发票怎么开 安全培训
  • 本单位员工投稿怎么写
  • 企业报税网上申报
  • 城市公交可以承包吗
  • 记账凭证领用材料如何填写
  • 电商企业如何确定产品结构
  • 超市预付卡发票如何入账
  • 没发票大额费用支出能税前扣除吗?
  • 汽车的增值税可以退税吗
  • 分期付款购买商品房后续没钱还怎么办
  • 退税指导
  • 设备安装公司如何经营
  • 每个季度零申报需要做什么
  • 电脑开机后一直滴滴
  • 鸿蒙系统智能设备怎么开启
  • 小米路由器启动不了
  • 电脑上不了网怎么安装网卡驱动
  • 如何取消windows启动管理器
  • explorer.exe是啥意思
  • php后端开发流程教程
  • 购买生产用品计入什么科目
  • 企业购入固定资产要交印花税吗
  • 带壳的栗子 (© Kai Keisuke/Shutterstock)
  • phpinfophp漏洞利用
  • php oracle 连接池
  • 逾期增值税扣税凭证抵扣管理办法
  • 防抖节流实现原理
  • tcpreplay命令详解
  • 羊羊 过好
  • ps怎么把多余的p掉
  • 打车费的会计分录
  • access中宏的操作
  • 预计可变现净值与账面成本的关系
  • 不抵扣勾选有什么风险
  • sqlserver2005数据库磁盘满了什么文件能删
  • c#调用excel
  • 公司向个人借款怎么做账
  • 外币业务的会计分录
  • 承租方承担的税费有哪些
  • 电子凭证用不了
  • 物业公司预收的物业费怎么做账
  • 免抵退账务处理流程
  • 经费开支要求
  • 接受捐赠的固定资产计入什么科目
  • 小规模纳税人销售货物税率是多少
  • 手机开个人发票怎么开
  • 留抵进项税抵扣预缴怎么做账
  • 企业在期间新购进的设备、器具
  • 企业利润分为四个方面
  • mysql批量添加字段
  • sqlserver优化的几种方法
  • 官方发布预防新冠戴口罩指引
  • 没有系统盘怎么修复系统
  • 访问win10
  • linux命令的含义
  • win8突然没有声音
  • 弹窗windows10安装失败
  • 滑动到点击位置的快捷键
  • 动态修改ip
  • javascriptz
  • unity每帧调用
  • javascript基本语句
  • android support包
  • Android ExpandableListView的使用技巧
  • 税控盘时钟异常去政务大厅那个窗口办理
  • 垠坤集团是属于国企吗
  • 企业所得税汇算清缴账务处理
  • 西藏五个确保是什么?
  • 烟叶税计税依据是收购烟叶实际支付的价款总额
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设