位置: IT常识 - 正文

目标检测->SSD算法(目标检测数据集)

编辑:rootadmin
目标检测->SSD算法

推荐整理分享目标检测->SSD算法(目标检测数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测map达到多少比较好,目标检测算法,目标检测SSD,目标检测SSD,目标检测ssd算法详解,目标检测SSD,目标检测ssd原理,目标检测ssd算法详解,内容如对您有帮助,希望把文章链接给更多的朋友!

目标检测算法总体分为:基于区域的算法和基于回归的算法

1)基于区域的算法: RCNN, Fast RCNN, Faster RCNN, Mask RCNN 等。整个检测过程分为两个阶段。在第一个阶段,检测器需要找到一些假设的区域 (ROI);在第二个阶段,检测器需要在这些假设区域上进行分类 (classification) 和 位置回归 (bounding box regression)。

2)基于回归的算法:YOLO系列 等。检测是一个端到端 (end-to-end) 的过程,直接回归出物体的类别和位置。

SSD(Single Shot MultiBox Detector)是一个one stage的检测算法。它可以认为是 Faster RCNN 和 YOLO 的结合:采用了基于回归的模式(类似于YOLO),在一个网络中直接回归出物体的类别和位置,因此检测速度很快。同时也利用了基于区域的概念(类似于Faster RCNN),在检测的过程中,使用了许多候选区域作为ROI。

Faster RCNN的回顾:

Faster RCNN存在的问题:

1)对小目标检测效果很差(只在一个特征层进行预测,这个特征层已经经过很多卷积层之后的,经过的越多,抽象层次越高,图像的细节信息保留越少,小目标效果越差,要在相对低层次上的特征来进行预测)

2)模型大,检测速度慢(两次预测,two stages方法的通病)

SSD网络

目标检测->SSD算法(目标检测数据集)

在不同特征尺度上预测不同尺度的目标

骨干网络:

SSD的骨干网络是基于传统的图像分类网络,采用了vgg16的部分网络作为基础网络。如图所示,经过10个卷积层(conv layer) 和 3个池化层(max pooling) 的处理,我们可以得到一个尺寸为 38×38×512 的特征图 (Conv4_3 feature map)。下一步,我们需要在这个特征图上进行回归,得到物体的位置和类别。

回归 (Regression):

和 YOLO 的回归操作相似,首先我们先考虑在特征图的每个位置上,有且只有一个候选框(default box)的情况。

1)位置回归:检测器需要给出框中心偏移量 (cx,cy),相对于图片尺寸的宽度和高度 (w,h),总计需要回归4个参数。(Fast RCNN是每一个类别都要一个回归框,总共(N+1)*4个参数)

2)分类: 对于每一个 bounding box,我们需要给出 20个类别+1个背景类的得分(score)。

对于每一个位置,我们需要一个25维的向量来存储检测物体的位置和类别信息。对于我们的38×38的特征图,我们需要一个维度为 38×38×25 的空间来存储这些信息。因此,检测器需要学习特征图(38×38×512)到检测结果(38×38×25)的映射关系。这一步转换,使用的是卷积操作:使用25个3×3的卷积核,对特征图进行卷积。到这里,我们已经完成了在每个位置上回归一个框的操作。

3)多个候选框:SSD在每个位置上,希望回归k个基于不同尺寸的框。因此在每个位置上需要 25×k 维的空间,存储这些框的回归和分类信息,因而卷积操作变成了使用 25×k个3×3的卷积核,来获得 38×38×25k 维度的检测结果图(score map)。

4)多个特征图:对于神经网络,浅层的特征图包含了更较多的细节信息,更适合进行小物体的检测;而较深的特征图包含了更多的全局信息,更适合大物体的检测。因此,通过在不同的特征图上对不同尺寸的候选框进行回归,可以对不同尺寸的物体有更好的检测结果。

SSD的检测精度和速度都非常出色,76.8 mAP 和 22FPS 超过了Faster RCNN和YOLO

本文链接地址:https://www.jiuchutong.com/zhishi/299702.html 转载请保留说明!

上一篇:ChatGPT常用开源项目汇总(cat 开源)

下一篇:【微信小程序】选择器组件picker(微信小程序开发一个多少钱)

  • 微信怎么设置壁纸(微信怎么设置壁纸主题背景)

    微信怎么设置壁纸(微信怎么设置壁纸主题背景)

  • 苹果12重启按什么键(苹果重启按什么键13)

    苹果12重启按什么键(苹果重启按什么键13)

  • 手机蓝牙共享wifi给电脑上网(手机蓝牙共享wifi给平板)

    手机蓝牙共享wifi给电脑上网(手机蓝牙共享wifi给平板)

  • 一个手机怎么才能同时登2个微信号(一个手机怎么才能注册两个微信)

    一个手机怎么才能同时登2个微信号(一个手机怎么才能注册两个微信)

  • 微信文字特效有哪些(微信文字特效有哪些2022)

    微信文字特效有哪些(微信文字特效有哪些2022)

  • 微信表情包旺财是什么意思(微信表情包旺财狗是什么意思)

    微信表情包旺财是什么意思(微信表情包旺财狗是什么意思)

  • 华为实名认证能找回账号吗(华为实名认证能解除吗)

    华为实名认证能找回账号吗(华为实名认证能解除吗)

  • ipad air3静音键在哪里(ipad air3 静音)

    ipad air3静音键在哪里(ipad air3 静音)

  • 电脑显示器当电视看需要什么东西(电脑显示器当电视怎么接音响)

    电脑显示器当电视看需要什么东西(电脑显示器当电视怎么接音响)

  • 苹果6p微信视频对方听不见(苹果6p微信视频没有声音)

    苹果6p微信视频对方听不见(苹果6p微信视频没有声音)

  • 页眉有一条线怎么去掉(页眉上有根线)

    页眉有一条线怎么去掉(页眉上有根线)

  • 抖音直播放电视剧可以吗(抖音直播放电视剧版权怎么申请)

    抖音直播放电视剧可以吗(抖音直播放电视剧版权怎么申请)

  • ios11beat版是什么意思(ios11 beta1)

    ios11beat版是什么意思(ios11 beta1)

  • 抖音私信已读是什么意思(抖音私信已读是对方点开视频了吗)

    抖音私信已读是什么意思(抖音私信已读是对方点开视频了吗)

  • 华为mate30是什么屏幕(华为mate30算什么级别的手机)

    华为mate30是什么屏幕(华为mate30算什么级别的手机)

  • 腾讯地图是哪个公司的(腾讯地图是哪个国家的公司)

    腾讯地图是哪个公司的(腾讯地图是哪个国家的公司)

  • 微信提示音怎么开启(微信提示音怎么设置)

    微信提示音怎么开启(微信提示音怎么设置)

  • vivox23全屏怎么设置(vivo怎么设全屏)

    vivox23全屏怎么设置(vivo怎么设全屏)

  • 手机左上角出现圆圈(手机左上角出现e是什么原因)

    手机左上角出现圆圈(手机左上角出现e是什么原因)

  • macOS11怎么关闭睡眠模式? mac禁止电脑休眠的技巧(macos15关闭sip)

    macOS11怎么关闭睡眠模式? mac禁止电脑休眠的技巧(macos15关闭sip)

  • Windows 7系统如何创建硬盘分区?(win7系统咋样)

    Windows 7系统如何创建硬盘分区?(win7系统咋样)

  • uniapp中的renderjs使用(uniapp中的onload)

    uniapp中的renderjs使用(uniapp中的onload)

  • JAVA开发与运维(web生产环境部署)(java开发和运维)

    JAVA开发与运维(web生产环境部署)(java开发和运维)

  • 城建税的计税依据是增值税和消费税的和吗
  • 房产税从价改从租,多缴税款要加收滞纳金吗
  • 财务软件购买税点多少钱
  • 投标保证金保险怎么买
  • 专利权的入账价值计算公式
  • 股权转让企业所得税税率
  • 虚开增值税普通发票罪的立案标准
  • 查补以前年度所得税如何填写申报表
  • 进项票退回已抵扣税额
  • 开办费转入管理费用分录
  • 增值税计税依据包含消费税吗
  • 销项发票遗失怎么办
  • 暂估收入销项税与后期开票不一致
  • 定期定额自行申报表计税依据
  • 小微企业季度销售额超过30万增值税
  • 土地增值税允许扣除的评估价
  • 进项为13%,销售时是否可按9%
  • 企业识别码怎么查询
  • 广告公司的主营业务成本包括哪些
  • 营销策划费用计算公式
  • 栗耳簇舌巨嘴鸟,巴西潘塔纳尔保护区里 (© Ana Gram/Shutterstock)
  • php不同用户登录不同页面
  • 公司买手机怎么做账务处理
  • php中split
  • 生产车间报表表格图片
  • sentstrt.exe - sentstrt进程是什么文件 有什么用
  • php
  • 土地出让金的收费标准 60%
  • 专项储备购买安全设备会计分录
  • 企业安全生产费用不得出现赤字
  • 企业期末结转本期实现的各项收入
  • 图像识别算法汇总表
  • vget命令
  • 进项税额计入其他流动资产
  • 没有什么盈利的公司应该进吗
  • 异地提供建筑服务预缴
  • 支付版权使用费怎么记账
  • 现金流出包括所有股票吗
  • 生产车间年终奖计入什么科目
  • c语言指针妙用
  • 以前年度的成本忘了结转然后怎么办
  • 第一次购买金税盘会计分录
  • 社平工资调整补差能补多少
  • 劳务费如何计提
  • 2021劳动报酬收入个人所得税怎么算
  • 企业期货投资收益要交所得税吗
  • 亏损弥补的会计处理方法
  • 做好成本会计的基础工作主要对企业成本管理有什么意义
  • sqlserver日期计算年龄
  • win7命令提示符
  • win8如何卸载360安全卫士?
  • windows10经常假死
  • mac wifi时断时续
  • info.exe病毒
  • 微软发布新系统
  • 系统升级为中狼
  • linux安装fping
  • win8怎么关电脑
  • grep正则表达式运用举例
  • 用linux做服务器
  • win10玩饥荒
  • win8是怎么样的
  • javascript入门教程
  • Cocos2d-x之getVisibleSize,getContentSize,boundingBox,getContentSizeInPixels,convertToGL,convertToUI
  • Javascript之BOM(window对象)详解
  • jquery的实现原理
  • glsurfaceview特性
  • JAVASCRIPT IE 与 FF 中兼容写法记录
  • android新手入门
  • javascript中array数组对象的含义及常用方法
  • 八大排序算法的时间空间复杂度
  • 用javascript
  • android布局背景颜色的代码
  • 办税服务厅怎么开通扣缴端数据下载
  • 东莞市税务局稽查局
  • 新疆电子税务局下载app
  • 税务局三方协议变更
  • 下设机构和内设的区别
  • 企业所得税预缴时间规定
  • 重庆国税网上怎么申报
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设