位置: IT常识 - 正文

深度学习中的FPN详解

编辑:rootadmin
深度学习中的FPN详解

推荐整理分享深度学习中的FPN详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

目录

一、FPN提出原因

二、FPN的参考思想

三、特征金字塔

 四、FPN具体思路

一、FPN提出原因

卷积网络中,深层网络容易响应语义特征,浅层网络容易响应图像特征。然而,在目标检测中往往因为卷积网络的这个特征带来了不少麻烦:

高层网络虽然能响应语义特征,但是由于Feature Map的尺寸太小,拥有的几何信息并不多,不利于目标的检测;浅层网络虽然包含比较多的几何信息,但是图像的语义特征并不多,不利于图像的分类。这个问题在小目标检测中更为突出。

因此,如果我们能够合并深层和浅层特征的话,同时满足目标检测和图像分类的需要,那我们的问题可能就迎刃而解啦~

二、FPN的参考思想

既然我们的FPN是特征金字塔,当然参考的也与金字塔有关啦。

FPN使用的是图像金字塔的思想。

传统的图像金字塔采用输入多尺度图像的方式构建多尺度的特征。简单来说,就是我们输入一张图像后,我们可以通过一些手段获得多张不同尺度的图像,我们将这些不同尺度的图像的4个顶点连接起来,就可以构造出一个类似真实金字塔的一个图像金字塔。整个过程有点像是我们看一个物品由远及近的过程(近大远小原理)。

其中,中间的图像是原始图像,尺寸越来越小的图片是经过下采样处理后的结果,而尺寸越来越大的图片是经过上采样处理后的结果。这样我们可以提取到更多的有用的信息。

三、特征金字塔

运用这种金字塔的思想可以提高算法的性能,但是他需要大量的运算和内存。

因此特征金字塔要在速度和准确率之间进行权衡,通过它获得更加鲁棒的语义信息。

图像中存在不同大小的目标,而不同的目标具有不同的特征,所以我们需要特征金字塔来利用浅层的特征将简单的目标区分开,利用深层的特征将复杂的目标区分开。即利用大的特征图区分简单目标,利用小的特征图区分复杂目标。

 四、FPN具体思路

提出的思路如下图所示:

深度学习中的FPN详解

图(a):

先对原始图像构造图像金字塔,然后在图像金字塔的每一层提出不同的特征,然后进行相应的预测。优点:精度不错;缺点:计算量大得恐怖,占用内存大。直接pass!

图(b):

通过对原始图像进行卷积和池化操作来获得不同尺寸的feature map,在图像的特征空间中构造出金字塔。

因为浅层的网络更关注于细节信息,高层的网络更关注于语义信息,更有利于准确检测出目标,因此利用最后一个卷积层上的feature map来进行预测分类。

优点:速度快、内存少。缺点:仅关注深层网络中最后一层的特征,却忽略了其它层的特征。

图(c):

同时利用低层特征和高层特征。就是首先在原始图像上面进行深度卷积,然后分别在不同的特征层上面进行预测。

优点:在不同的层上面输出对应的目标,不需要经过所有的层才输出对应的目标(即对于有些目标来说,不用进行多余的前向操作),速度更快,又提高了算法的检测性能。

缺点:获得的特征不鲁棒,都是一些弱特征(因为很多的特征都是从较浅的层获得的)。

图(d)这才是我们真正的FPN

 简单概括来说就是:自下而上,自上而下,横向连接和卷积融合。

整体过程:

(1)自下而上:先把预处理好的图片送进预训练的网络,比如像ResNet这些,这一步就是构建自下而上的网络,就是对应下图中的(1,2,3)这一组金字塔。

(2)自上而下:将层3进行一个复制变成层4,对层4进行上采样操作(就是2 * up),再用1 * 1卷积对层2进行降维处理,然后将两者对应元素相加(这里就是高低层特征的一个汇总),这样我们就得到了层5,层6以此类推,是由层5和层1进行上述操作得来的。这样就构成了自上而下网络,对应下图(4,5,6)金字塔。(其中的层2与上采样后的层4进行相加,就是横向连接的操作)

(3)卷积融合:最后我们对层4,5,6分别来一个3 * 3卷积操作得到最终的预测(对应下图的predict)。

欢迎大家在评论区批评指正~

本文链接地址:https://www.jiuchutong.com/zhishi/298943.html 转载请保留说明!

上一篇:jsoup的使用(jsoup js)

下一篇:vue-router路由懒加载(vue router-view路由详解)

  • 论坛如何推广(论坛推广怎么写)

    论坛如何推广(论坛推广怎么写)

  • 魅族 18 Pro支持的音频格式有哪些(魅族18pro支持lhdc吗)

    魅族 18 Pro支持的音频格式有哪些(魅族18pro支持lhdc吗)

  • 华为p40智能遥控器在哪(华为p40智能遥控在哪里找)

    华为p40智能遥控器在哪(华为p40智能遥控在哪里找)

  • 计算机中的bus指什么(计算机中的bus指什么意思)

    计算机中的bus指什么(计算机中的bus指什么意思)

  • 手机能定位他人位置吗(手机定位他人位置无需同意)

    手机能定位他人位置吗(手机定位他人位置无需同意)

  • 同一wifi苹果能用安卓不能(同一wifi下两台苹果手机)

    同一wifi苹果能用安卓不能(同一wifi下两台苹果手机)

  • 华为nova7pro怎样使用耳机(华为nova7pro怎样投屏到电视)

    华为nova7pro怎样使用耳机(华为nova7pro怎样投屏到电视)

  • 小米10哪天发布的(小米10何时发布)

    小米10哪天发布的(小米10何时发布)

  • nfc和蓝牙有什么区别(nfc连接和蓝牙连接优缺点)

    nfc和蓝牙有什么区别(nfc连接和蓝牙连接优缺点)

  • oppo手机网络太慢了怎么办(oppo手机网络太卡)

    oppo手机网络太慢了怎么办(oppo手机网络太卡)

  • 快手怎么把点赞的视频全部取消(快手怎么把点赞的作品公开)

    快手怎么把点赞的视频全部取消(快手怎么把点赞的作品公开)

  • 内存储器可分为哪三类(内存储器可分为什么和什么两种)

    内存储器可分为哪三类(内存储器可分为什么和什么两种)

  • 爱奇艺和奇异果的关系(爱奇艺和奇异果哪个好)

    爱奇艺和奇异果的关系(爱奇艺和奇异果哪个好)

  • ipad如何关闭自动续费(ipad如何关闭自动更新app)

    ipad如何关闭自动续费(ipad如何关闭自动更新app)

  • word怎么做成二维码(word文档怎么做er图)

    word怎么做成二维码(word文档怎么做er图)

  • 手机黑屏怎么打开usb调试(手机黑屏怎么打开开发者模式)

    手机黑屏怎么打开usb调试(手机黑屏怎么打开开发者模式)

  • 华为nova5怎么用耳机(华为nova5怎么用耳机听歌)

    华为nova5怎么用耳机(华为nova5怎么用耳机听歌)

  • 2016089是小米几(2016001是小米几的)

    2016089是小米几(2016001是小米几的)

  • vivox9p有nfc功能吗(vivox9plus手机有nfc功能在哪里)

    vivox9p有nfc功能吗(vivox9plus手机有nfc功能在哪里)

  • qq空间可见说说设置(qq空间可见说说怎么发)

    qq空间可见说说设置(qq空间可见说说怎么发)

  • oppo手机插件在哪里(oppo手机插件在什么地方)

    oppo手机插件在哪里(oppo手机插件在什么地方)

  • 微信已过期的文件怎么恢复(微信已过期的文档怎么找)

    微信已过期的文件怎么恢复(微信已过期的文档怎么找)

  • 华为手机的望远镜在哪里(华为手机的望远镜功能怎么打开)

    华为手机的望远镜在哪里(华为手机的望远镜功能怎么打开)

  • oppoa7电池容量有多大(oppo a7电池容量)

    oppoa7电池容量有多大(oppo a7电池容量)

  • vivo如何反向充电(vivo手机怎么反向充电给别的手机)

    vivo如何反向充电(vivo手机怎么反向充电给别的手机)

  • 电脑开机自动修复怎么办(电脑开机自动修复硬盘)

    电脑开机自动修复怎么办(电脑开机自动修复硬盘)

  • 微信回执单号在哪里找(微信回执单号在哪里找视频)

    微信回执单号在哪里找(微信回执单号在哪里找视频)

  • oppor17天气图标怎么恢复(oppo手机天气图标)

    oppor17天气图标怎么恢复(oppo手机天气图标)

  • 视觉SLAM总结——SuperPoint / SuperGlue(视觉slam ba)

    视觉SLAM总结——SuperPoint / SuperGlue(视觉slam ba)

  • 固定资产的进项税额不允许抵扣的增值税属于
  • 新个税税率法
  • 什么是保函业务?如何进行核算?
  • 什么是调账的依据
  • 支付给外包公司的工资备注怎么写
  • 开票加收税点会减少吗
  • 个税退税是公司退还是个人退
  • 资产负债表里是科目还是项目
  • 季度不超过9万
  • 管理费用科目代码
  • 补交以前年度增值税的科目处理
  • 留样检测的产品计入什么科目?
  • 冲回上年多提的费用会计分录
  • 境内货代公司之间付美金
  • 利润分配亏损太多如何处理?
  • 工资薪金与年终奖筹划
  • 银行代发工资当月没发下个月发没事儿吧
  • 二手店铺转让手续流程
  • 公司对公账户每年费用
  • 食堂伙食费账务处理
  • 银行账户注销以后预留印鉴
  • 餐查账征收企业所得税会计分录?
  • 高新企业奖励补贴交税吗
  • 生产成本中的电费计入制造费用吗
  • 个人给单位垫付的款怎么做账
  • 应交税金年终怎么计算
  • 收到投资款怎么做记账凭证
  • Mac系统中使用QuickTime Player实现屏幕录像图文教程
  • php面向对象是什么意思
  • app制作公司开发一个app的价格
  • PHP:stream_context_set_option()的用法_Stream函数
  • 转让股权怎么做会计分录
  • 如何处理收到的短信
  • 购入固定资产后海通融资怎么办
  • php实现文件下载功能
  • 发票开错了怎么处理好?
  • 在产品定额工时怎么算
  • php单例模式demo
  • 报个税时显示扣缴单位无有效的税费种认定信息
  • yolov5m
  • vue前端代码实例
  • php读取php文件内容
  • HTML常用标记
  • php上传图片到文件夹
  • 取得抵债资产支付的税费一般不包括下列哪种
  • 增值税申报表期初未缴税额
  • 香港企业的所得税怎么算
  • 金蝶会计报表公式
  • 万元版和十万元版发票图片
  • 什么是子公司 和控股的区别
  • 背书的银行承兑汇票怎么做账
  • 不征税收入怎么申报增值税
  • 融资性租赁税率
  • 一般纳税人不得领用专票的情形
  • 社保怎么进行账户转移
  • 水泥建材销售公司有哪些
  • 员工外面有自己的公司
  • 新成立的公司怎样建账
  • 滞纳金冲留底税额怎么算
  • 暂估费用的账务处理管理
  • 电子承兑到期怎么申请付款
  • 发票专用章盖在中间行不行
  • 计入当期损益是不是计入三大期间费用
  • mysql中的where子句
  • sql中的join
  • win10 下一代
  • 晨枫U盘启动工具v2.0
  • win10系统关闭防火墙服务
  • win10系统的优化
  • lnmp一键安装包 linux
  • win10应用商店下载不了
  • 文科生也能看懂的电子电路学PDf
  • bat关闭bat
  • 批处理常用命令总结
  • ubuntu系统的手机
  • 河南税务机关
  • 北京西城税务局
  • 厂房原值如何核定
  • 怎样在开票系统中增加新的名称
  • 上缴财政总额是什么意思
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设