位置: IT常识 - 正文

目标检测->SSD算法(目标检测数据集)

编辑:rootadmin
目标检测->SSD算法

推荐整理分享目标检测->SSD算法(目标检测数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测map达到多少比较好,目标检测算法,目标检测SSD,目标检测SSD,目标检测ssd算法详解,目标检测SSD,目标检测ssd原理,目标检测ssd算法详解,内容如对您有帮助,希望把文章链接给更多的朋友!

目标检测算法总体分为:基于区域的算法和基于回归的算法

1)基于区域的算法: RCNN, Fast RCNN, Faster RCNN, Mask RCNN 等。整个检测过程分为两个阶段。在第一个阶段,检测器需要找到一些假设的区域 (ROI);在第二个阶段,检测器需要在这些假设区域上进行分类 (classification) 和 位置回归 (bounding box regression)。

2)基于回归的算法:YOLO系列 等。检测是一个端到端 (end-to-end) 的过程,直接回归出物体的类别和位置。

SSD(Single Shot MultiBox Detector)是一个one stage的检测算法。它可以认为是 Faster RCNN 和 YOLO 的结合:采用了基于回归的模式(类似于YOLO),在一个网络中直接回归出物体的类别和位置,因此检测速度很快。同时也利用了基于区域的概念(类似于Faster RCNN),在检测的过程中,使用了许多候选区域作为ROI。

Faster RCNN的回顾:

Faster RCNN存在的问题:

1)对小目标检测效果很差(只在一个特征层进行预测,这个特征层已经经过很多卷积层之后的,经过的越多,抽象层次越高,图像的细节信息保留越少,小目标效果越差,要在相对低层次上的特征来进行预测)

2)模型大,检测速度慢(两次预测,two stages方法的通病)

SSD网络

目标检测->SSD算法(目标检测数据集)

在不同特征尺度上预测不同尺度的目标

骨干网络:

SSD的骨干网络是基于传统的图像分类网络,采用了vgg16的部分网络作为基础网络。如图所示,经过10个卷积层(conv layer) 和 3个池化层(max pooling) 的处理,我们可以得到一个尺寸为 38×38×512 的特征图 (Conv4_3 feature map)。下一步,我们需要在这个特征图上进行回归,得到物体的位置和类别。

回归 (Regression):

和 YOLO 的回归操作相似,首先我们先考虑在特征图的每个位置上,有且只有一个候选框(default box)的情况。

1)位置回归:检测器需要给出框中心偏移量 (cx,cy),相对于图片尺寸的宽度和高度 (w,h),总计需要回归4个参数。(Fast RCNN是每一个类别都要一个回归框,总共(N+1)*4个参数)

2)分类: 对于每一个 bounding box,我们需要给出 20个类别+1个背景类的得分(score)。

对于每一个位置,我们需要一个25维的向量来存储检测物体的位置和类别信息。对于我们的38×38的特征图,我们需要一个维度为 38×38×25 的空间来存储这些信息。因此,检测器需要学习特征图(38×38×512)到检测结果(38×38×25)的映射关系。这一步转换,使用的是卷积操作:使用25个3×3的卷积核,对特征图进行卷积。到这里,我们已经完成了在每个位置上回归一个框的操作。

3)多个候选框:SSD在每个位置上,希望回归k个基于不同尺寸的框。因此在每个位置上需要 25×k 维的空间,存储这些框的回归和分类信息,因而卷积操作变成了使用 25×k个3×3的卷积核,来获得 38×38×25k 维度的检测结果图(score map)。

4)多个特征图:对于神经网络,浅层的特征图包含了更较多的细节信息,更适合进行小物体的检测;而较深的特征图包含了更多的全局信息,更适合大物体的检测。因此,通过在不同的特征图上对不同尺寸的候选框进行回归,可以对不同尺寸的物体有更好的检测结果。

SSD的检测精度和速度都非常出色,76.8 mAP 和 22FPS 超过了Faster RCNN和YOLO

本文链接地址:https://www.jiuchutong.com/zhishi/299702.html 转载请保留说明!

上一篇:ChatGPT常用开源项目汇总(cat 开源)

下一篇:【微信小程序】选择器组件picker(微信小程序开发一个多少钱)

  • 应交税费科目的借贷方向
  • 新企业会计准则2021
  • 营业总收入包含投资收益吗
  • 豆粕适用税率
  • 工程销项税率
  • 2020小规模纳税人印花税怎么算
  • 购房补贴退契税3个月没到账
  • 库存现金余额过大的定性
  • 收到存款利息属于现金流量表
  • 增值税普通发票和电子普通发票的区别
  • 小规模专票丢了怎么办
  • 药店税票税点
  • 小规模增值税缴纳怎么算
  • 应付职工薪酬包括公积金吗
  • 个税申报密码是什么意思
  • 个人所得税征收计算方法
  • 备抵法发生坏账分录
  • 网络销售平台优势有哪些
  • 关联企业借款利息税前扣除
  • 土地使用税和房产税
  • 购买方现金折扣计入什么科目
  • 企业所得税按月或者按季预缴
  • 半成品加工费计入什么科目
  • 台式电脑开不了机怎么办 屏幕黑屏
  • 支付航天开票技术服务费280
  • 代收消费税计算
  • php unset()
  • 捐赠支出税前扣除条件
  • php数组有哪几种类型
  • 应退税款抵扣欠税款的账务处理
  • 融资租赁怎么做到表外
  • 外国人在中国工作有五险一金吗
  • 企业营运资金管理存在的问题
  • phpqrcode
  • 劳务所得和经营所得有啥区别
  • php的时间戳
  • lstm crf
  • 创建command对象
  • 农民专业合作社名词解释
  • 应收利息的会计处理方法
  • 委托 研发费用
  • php匹配邮箱
  • 其他收益结转到什么账户
  • 银行结算方式有哪几种方式?其具体内容是什么?
  • 个人劳务费免税额度 年度
  • 积分获取和消费的关系
  • 数据库系统中,用户通过什么访问数据
  • 什么情况需要个人所得税
  • 新领的发票怎么导入uk开票系统
  • 土地转让需要批准吗
  • 支付宝可以对公账户转账吗怎么转
  • 复利终值和年金终值的公式
  • 农村的扶贫政策是什么
  • 签合同的名称和内容
  • 旅游公司怎么交增值税
  • 专用发票怎么入账
  • 商业健康保险抵扣个税规定
  • 一个真正的企业应该具备哪些特征
  • mysql索引类型及原理
  • sqlserver1053怎么解决
  • Linux下mysql 5.6.17 安装图文教程
  • xp开机延时启动程序
  • centos挂载点
  • 在windows 10
  • centos7 中文支持
  • win7关机总是自动重启
  • python 读中文文件
  • [置顶]bilinovel
  • javascriptj
  • 安卓手机自定义ua
  • python怎么用数组
  • bootstrap和css的关系
  • js从数组中选出最大的三个数
  • 详解各种汽油一吨等于多少升
  • 异地社保如何在本地使用医保
  • 增值税预缴税款退税申请怎么写
  • 技术转让条件
  • 陕西地方水利建设基金减免政策2023
  • 广州国税地税上班时间
  • 天津市各区国税局待遇一样吗?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设