位置: IT常识 - 正文

深度学习中的FPN详解

编辑:rootadmin
深度学习中的FPN详解

推荐整理分享深度学习中的FPN详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

目录

一、FPN提出原因

二、FPN的参考思想

三、特征金字塔

 四、FPN具体思路

一、FPN提出原因

卷积网络中,深层网络容易响应语义特征,浅层网络容易响应图像特征。然而,在目标检测中往往因为卷积网络的这个特征带来了不少麻烦:

高层网络虽然能响应语义特征,但是由于Feature Map的尺寸太小,拥有的几何信息并不多,不利于目标的检测;浅层网络虽然包含比较多的几何信息,但是图像的语义特征并不多,不利于图像的分类。这个问题在小目标检测中更为突出。

因此,如果我们能够合并深层和浅层特征的话,同时满足目标检测和图像分类的需要,那我们的问题可能就迎刃而解啦~

二、FPN的参考思想

既然我们的FPN是特征金字塔,当然参考的也与金字塔有关啦。

FPN使用的是图像金字塔的思想。

传统的图像金字塔采用输入多尺度图像的方式构建多尺度的特征。简单来说,就是我们输入一张图像后,我们可以通过一些手段获得多张不同尺度的图像,我们将这些不同尺度的图像的4个顶点连接起来,就可以构造出一个类似真实金字塔的一个图像金字塔。整个过程有点像是我们看一个物品由远及近的过程(近大远小原理)。

其中,中间的图像是原始图像,尺寸越来越小的图片是经过下采样处理后的结果,而尺寸越来越大的图片是经过上采样处理后的结果。这样我们可以提取到更多的有用的信息。

三、特征金字塔

运用这种金字塔的思想可以提高算法的性能,但是他需要大量的运算和内存。

因此特征金字塔要在速度和准确率之间进行权衡,通过它获得更加鲁棒的语义信息。

图像中存在不同大小的目标,而不同的目标具有不同的特征,所以我们需要特征金字塔来利用浅层的特征将简单的目标区分开,利用深层的特征将复杂的目标区分开。即利用大的特征图区分简单目标,利用小的特征图区分复杂目标。

 四、FPN具体思路

提出的思路如下图所示:

深度学习中的FPN详解

图(a):

先对原始图像构造图像金字塔,然后在图像金字塔的每一层提出不同的特征,然后进行相应的预测。优点:精度不错;缺点:计算量大得恐怖,占用内存大。直接pass!

图(b):

通过对原始图像进行卷积和池化操作来获得不同尺寸的feature map,在图像的特征空间中构造出金字塔。

因为浅层的网络更关注于细节信息,高层的网络更关注于语义信息,更有利于准确检测出目标,因此利用最后一个卷积层上的feature map来进行预测分类。

优点:速度快、内存少。缺点:仅关注深层网络中最后一层的特征,却忽略了其它层的特征。

图(c):

同时利用低层特征和高层特征。就是首先在原始图像上面进行深度卷积,然后分别在不同的特征层上面进行预测。

优点:在不同的层上面输出对应的目标,不需要经过所有的层才输出对应的目标(即对于有些目标来说,不用进行多余的前向操作),速度更快,又提高了算法的检测性能。

缺点:获得的特征不鲁棒,都是一些弱特征(因为很多的特征都是从较浅的层获得的)。

图(d)这才是我们真正的FPN

 简单概括来说就是:自下而上,自上而下,横向连接和卷积融合。

整体过程:

(1)自下而上:先把预处理好的图片送进预训练的网络,比如像ResNet这些,这一步就是构建自下而上的网络,就是对应下图中的(1,2,3)这一组金字塔。

(2)自上而下:将层3进行一个复制变成层4,对层4进行上采样操作(就是2 * up),再用1 * 1卷积对层2进行降维处理,然后将两者对应元素相加(这里就是高低层特征的一个汇总),这样我们就得到了层5,层6以此类推,是由层5和层1进行上述操作得来的。这样就构成了自上而下网络,对应下图(4,5,6)金字塔。(其中的层2与上采样后的层4进行相加,就是横向连接的操作)

(3)卷积融合:最后我们对层4,5,6分别来一个3 * 3卷积操作得到最终的预测(对应下图的predict)。

欢迎大家在评论区批评指正~

本文链接地址:https://www.jiuchutong.com/zhishi/298943.html 转载请保留说明!

上一篇:jsoup的使用(jsoup js)

下一篇:vue-router路由懒加载(vue router-view路由详解)

  • 事业单位怎么给分
  • 会议服务费免税吗
  • 其他应收款如何清理
  • 个人独资企业可以核定征收吗
  • 出租车手撕票可以换成增值税发票吗
  • 无形资产建造期间的摊销记在哪里
  • 进口增值税的计税价格为
  • 托收承付和委托收款的含义和相同之处
  • 应交增值税进项税额转出借贷方向表示什么
  • 购进商品交印花税
  • 累计折旧是费用岗负责的吗
  • 更新改造过程中被替换部件的账面价值
  • 长期合同收入与应收帐款如何处理?
  • 一般纳税人从按照简易计税方法依照3%
  • 离婚房屋权属变动怎么办
  • 暖气冷气热水的增值税适用税率是多少?
  • 用现金发工资不给怎么办
  • 软件合同审核要点
  • 网络发票和纸质发票不一致会计处理
  • 汇算清缴时交的税怎么算
  • ping命令出现unreachable
  • 设备维修费增值税
  • 支付宝支付凭证图片
  • 预测“叫停GPT-4后续AI大模型”后续:这是一个囚徒困境
  • realtek自动安装
  • 苹果电脑隐藏软件功能怎么开启
  • 库存股属于什么项目
  • 用科目汇总表怎么登记总账
  • mcshield.exe是什么进程
  • 出租固定资产取得的收入属于收入要素吗
  • 税务局要求小规模纳税人开专票
  • php超时限制
  • opencv dng
  • 谷粒商城二十五springCloud之Sleuth+Zipkin 服务链路追踪
  • java上传文件 multipartfile
  • 购货没有发票
  • 可以抵扣土地增值税的项目
  • git web hook
  • 中小企业的资产负债率均值是多少
  • 标书注意事项与如何制作标书
  • 新收入准则修订的目的
  • python中的生成器
  • 不确认递延所得税资产的特殊情况举例
  • 账面原材料比实际库存多怎么办
  • 现汇跟承兑有什么区别
  • 购买礼品送客户取得普票怎么做账
  • 个人所得税的征收模式为()A
  • 费用报销单如何粘贴票据
  • 不交社保的职业
  • 在职职工暖气费补助款
  • 结转本月收支
  • 固定资产对外投资通过固定资产清理吗
  • 打官司产生的费用开成什么发票
  • 应付职工薪酬的工资是实发工资还是应发工资
  • 固定资产是指什么
  • xp系统net framework 3.5
  • Win Server 2003 使用技巧图解
  • windows server 2003 sp1.
  • windows2008r2驱动包
  • u盘启动pe装机工具怎么用
  • SUSE Linux Enterprise Server 11 SP3安装教程详解
  • mac怎么获取文件路径快捷键
  • centos挂载lun
  • linux sort命令参数及用法详解
  • win7系统360浏览器书签
  • win8软件安装
  • computed缓存
  • android自定义控件入门与实战
  • unity3D游戏开发
  • Linux修改tomcat默认端口号8080
  • node.js文件流
  • java.基础
  • js跨域请求json数据
  • java list转set的方法
  • python搜索功能
  • jquery手册手机版
  • unity3d鼠标点击移动
  • 狠抓组织收入工作
  • 印花税核算有两种情况,是如何处理的?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设