位置: IT常识 - 正文

深度学习中的FPN详解

编辑:rootadmin
深度学习中的FPN详解

推荐整理分享深度学习中的FPN详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

目录

一、FPN提出原因

二、FPN的参考思想

三、特征金字塔

 四、FPN具体思路

一、FPN提出原因

卷积网络中,深层网络容易响应语义特征,浅层网络容易响应图像特征。然而,在目标检测中往往因为卷积网络的这个特征带来了不少麻烦:

高层网络虽然能响应语义特征,但是由于Feature Map的尺寸太小,拥有的几何信息并不多,不利于目标的检测;浅层网络虽然包含比较多的几何信息,但是图像的语义特征并不多,不利于图像的分类。这个问题在小目标检测中更为突出。

因此,如果我们能够合并深层和浅层特征的话,同时满足目标检测和图像分类的需要,那我们的问题可能就迎刃而解啦~

二、FPN的参考思想

既然我们的FPN是特征金字塔,当然参考的也与金字塔有关啦。

FPN使用的是图像金字塔的思想。

传统的图像金字塔采用输入多尺度图像的方式构建多尺度的特征。简单来说,就是我们输入一张图像后,我们可以通过一些手段获得多张不同尺度的图像,我们将这些不同尺度的图像的4个顶点连接起来,就可以构造出一个类似真实金字塔的一个图像金字塔。整个过程有点像是我们看一个物品由远及近的过程(近大远小原理)。

其中,中间的图像是原始图像,尺寸越来越小的图片是经过下采样处理后的结果,而尺寸越来越大的图片是经过上采样处理后的结果。这样我们可以提取到更多的有用的信息。

三、特征金字塔

运用这种金字塔的思想可以提高算法的性能,但是他需要大量的运算和内存。

因此特征金字塔要在速度和准确率之间进行权衡,通过它获得更加鲁棒的语义信息。

图像中存在不同大小的目标,而不同的目标具有不同的特征,所以我们需要特征金字塔来利用浅层的特征将简单的目标区分开,利用深层的特征将复杂的目标区分开。即利用大的特征图区分简单目标,利用小的特征图区分复杂目标。

 四、FPN具体思路

提出的思路如下图所示:

深度学习中的FPN详解

图(a):

先对原始图像构造图像金字塔,然后在图像金字塔的每一层提出不同的特征,然后进行相应的预测。优点:精度不错;缺点:计算量大得恐怖,占用内存大。直接pass!

图(b):

通过对原始图像进行卷积和池化操作来获得不同尺寸的feature map,在图像的特征空间中构造出金字塔。

因为浅层的网络更关注于细节信息,高层的网络更关注于语义信息,更有利于准确检测出目标,因此利用最后一个卷积层上的feature map来进行预测分类。

优点:速度快、内存少。缺点:仅关注深层网络中最后一层的特征,却忽略了其它层的特征。

图(c):

同时利用低层特征和高层特征。就是首先在原始图像上面进行深度卷积,然后分别在不同的特征层上面进行预测。

优点:在不同的层上面输出对应的目标,不需要经过所有的层才输出对应的目标(即对于有些目标来说,不用进行多余的前向操作),速度更快,又提高了算法的检测性能。

缺点:获得的特征不鲁棒,都是一些弱特征(因为很多的特征都是从较浅的层获得的)。

图(d)这才是我们真正的FPN

 简单概括来说就是:自下而上,自上而下,横向连接和卷积融合。

整体过程:

(1)自下而上:先把预处理好的图片送进预训练的网络,比如像ResNet这些,这一步就是构建自下而上的网络,就是对应下图中的(1,2,3)这一组金字塔。

(2)自上而下:将层3进行一个复制变成层4,对层4进行上采样操作(就是2 * up),再用1 * 1卷积对层2进行降维处理,然后将两者对应元素相加(这里就是高低层特征的一个汇总),这样我们就得到了层5,层6以此类推,是由层5和层1进行上述操作得来的。这样就构成了自上而下网络,对应下图(4,5,6)金字塔。(其中的层2与上采样后的层4进行相加,就是横向连接的操作)

(3)卷积融合:最后我们对层4,5,6分别来一个3 * 3卷积操作得到最终的预测(对应下图的predict)。

欢迎大家在评论区批评指正~

本文链接地址:https://www.jiuchutong.com/zhishi/298943.html 转载请保留说明!

上一篇:jsoup的使用(jsoup js)

下一篇:vue-router路由懒加载(vue router-view路由详解)

  • 微信为啥没有漂流瓶呢(微信为啥没有漂亮头像)

    微信为啥没有漂流瓶呢(微信为啥没有漂亮头像)

  • 华为mate8nfc感应不了(mate8的nfc感应区在哪)

    华为mate8nfc感应不了(mate8的nfc感应区在哪)

  • 3400g配什么主板(3400g配什么主板好)

    3400g配什么主板(3400g配什么主板好)

  • 按键精灵打开后白屏(按键精灵打开后不是全屏)

    按键精灵打开后白屏(按键精灵打开后不是全屏)

  • 为什么wps编辑不了里面的内容(为什么wps编辑不了word里面的内容)

    为什么wps编辑不了里面的内容(为什么wps编辑不了word里面的内容)

  • 一天开关机一次对手机有害吗(一天开关机一次伤机吗)

    一天开关机一次对手机有害吗(一天开关机一次伤机吗)

  • tt语音是什么(tt语音又叫什么)

    tt语音是什么(tt语音又叫什么)

  • 苹果6.1寸手机是什么型号(苹果6.1寸是多大)

    苹果6.1寸手机是什么型号(苹果6.1寸是多大)

  • wps无法输入任何内容(wps无法输入任何内容 但可以删除)

    wps无法输入任何内容(wps无法输入任何内容 但可以删除)

  • 华为nova7se没有返回键吗(华为nova7se没有录音功能)

    华为nova7se没有返回键吗(华为nova7se没有录音功能)

  • 抖音直播为什么不显示本场音浪(抖音直播为什么小孩不能出现在画面里)

    抖音直播为什么不显示本场音浪(抖音直播为什么小孩不能出现在画面里)

  • vivo手机摄像头黑屏是怎么回事(vivo手机摄像头打不开怎么回事)

    vivo手机摄像头黑屏是怎么回事(vivo手机摄像头打不开怎么回事)

  • 抖音怎么解绑公会(抖音怎么解绑公司账号)

    抖音怎么解绑公会(抖音怎么解绑公司账号)

  • 米8lite是哪款(米8lite和米8区别)

    米8lite是哪款(米8lite和米8区别)

  • 5g手机是不是很费流量(5g手机是不是很费电)

    5g手机是不是很费流量(5g手机是不是很费电)

  • 发qq是什么意思(qq有人给你发d啥意思)

    发qq是什么意思(qq有人给你发d啥意思)

  • 多闪怎么看访客记录(多闪看过的人在哪里)

    多闪怎么看访客记录(多闪看过的人在哪里)

  • 华为9x指纹解锁在哪(华为9x指纹解锁怎么没有了)

    华为9x指纹解锁在哪(华为9x指纹解锁怎么没有了)

  • 联华充值卡微信能用吗(联华充值卡怎么充值到微信账户)

    联华充值卡微信能用吗(联华充值卡怎么充值到微信账户)

  • 红米note8pro上市时间(红米note8pro 发布)

    红米note8pro上市时间(红米note8pro 发布)

  • 抖音点赞的视频不见了怎么回事(抖音点赞的视频会推荐给好友吗)

    抖音点赞的视频不见了怎么回事(抖音点赞的视频会推荐给好友吗)

  • line服务器当前无响应(手机line服务器当前无响应)

    line服务器当前无响应(手机line服务器当前无响应)

  • Windows 10屏幕键盘很快就可以选择不同的背景图像(Windows10屏幕键盘在哪)

    Windows 10屏幕键盘很快就可以选择不同的背景图像(Windows10屏幕键盘在哪)

  • python如何访问字典(python访问字符串)

    python如何访问字典(python访问字符串)

  • 自然人电子税务局
  • 非正常损失的货物,增值税做什么科目
  • 工程款转入冻结账户能拿回
  • 分公司报增值税吗
  • 计算企业所得税可以扣除的项目有
  • 销售费用变动率税收政策
  • 资产总额季度平均
  • 融资租赁租入固定资产折旧可以税前扣除吗
  • 没收逾期未退包装物押金收益,应计入( )科目
  • 润滑油交消费税税率
  • 境外企业国内签订合同如何缴纳印花税?
  • 自由职业者知乎
  • 会计低值易耗品有哪些
  • 财产行为税税种
  • 拿库存商品抵债怎么做账
  • 广告业文化事业建设费2023标准
  • 外贸公司有出口退税吗
  • linux转换windows
  • win10怎么调出命令行窗口
  • u盘装机大师怎么用
  • 小微企业免征税额度
  • php occ
  • php oci_connect
  • PHP:pg_send_query_params()的用法_PostgreSQL函数
  • windows11 beta渠道
  • 销售多余材料的收入会计分录
  • 国有资产无偿划转协议
  • 购销合同印花税计算方法
  • oss对象储存的副本储存原则
  • vue引入mui
  • php7多线程支持如何
  • 停在花朵上,好像在认真的听同学们读课文修改病句
  • 股东以原材料出资
  • 个体工商户注册资本是多少
  • 资本公积常用的计量方法
  • 金税盘减免税款借方余额
  • sql2008安装出现以下错误
  • 长期股权投资初始投资成本的确定
  • 法人给对公账户转账
  • 长投会计分录总结
  • 月度合并报表与年度合并区别
  • 资产总额是营业收入吗
  • 股权转让怎么做账
  • 小微企业是怎样自己认定的呢
  • 运输费用如何做账
  • 没有收到款项签认债有用吗
  • 公司办公室装修装修
  • 城市综合配套
  • 以前年度不合规发票如何调年报
  • 申请开立基本存款账户时,银行应按照
  • 机票行程单上没有金额怎么报销
  • 同城票据交换差额户金额从哪得来的
  • 增值税发票红冲和作废的区别
  • 应交税费科目账务处理
  • 所有者权益的概念和特征
  • 固定资产一次性扣除账务处理
  • 会计的几种折旧类型
  • sql中去掉结果为零的
  • win7打开浏览器很慢
  • win8无法修复你的电脑
  • win7系统开关机怎么没有声音
  • groove音乐怎么添加本地音乐
  • linux防止攻击
  • 如何修改apache
  • windows xp能装微信吗
  • win7速度
  • Win10怎么安装软件
  • 红石id
  • android secure
  • cocos2d-x window实现鼠标移动 键盘事件
  • 谈谈对环境保护认识话题三分钟
  • linux那么多命令怎么记
  • unity2d 阴影
  • javascript对象的属性和方法
  • javascript高级程序设计pdf百度云
  • 深入理解新发展理念,推进供给侧结构性改革心得体会
  • python中ans
  • 公共配套设施如何计算成本
  • 济南高新区工商局政务大厅电话
  • 普洱房产管理局官网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设