位置: IT常识 - 正文

目标检测->SSD算法(目标检测数据集)

编辑:rootadmin
目标检测->SSD算法

推荐整理分享目标检测->SSD算法(目标检测数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测map达到多少比较好,目标检测算法,目标检测SSD,目标检测SSD,目标检测ssd算法详解,目标检测SSD,目标检测ssd原理,目标检测ssd算法详解,内容如对您有帮助,希望把文章链接给更多的朋友!

目标检测算法总体分为:基于区域的算法和基于回归的算法

1)基于区域的算法: RCNN, Fast RCNN, Faster RCNN, Mask RCNN 等。整个检测过程分为两个阶段。在第一个阶段,检测器需要找到一些假设的区域 (ROI);在第二个阶段,检测器需要在这些假设区域上进行分类 (classification) 和 位置回归 (bounding box regression)。

2)基于回归的算法:YOLO系列 等。检测是一个端到端 (end-to-end) 的过程,直接回归出物体的类别和位置。

SSD(Single Shot MultiBox Detector)是一个one stage的检测算法。它可以认为是 Faster RCNN 和 YOLO 的结合:采用了基于回归的模式(类似于YOLO),在一个网络中直接回归出物体的类别和位置,因此检测速度很快。同时也利用了基于区域的概念(类似于Faster RCNN),在检测的过程中,使用了许多候选区域作为ROI。

Faster RCNN的回顾:

Faster RCNN存在的问题:

1)对小目标检测效果很差(只在一个特征层进行预测,这个特征层已经经过很多卷积层之后的,经过的越多,抽象层次越高,图像的细节信息保留越少,小目标效果越差,要在相对低层次上的特征来进行预测)

2)模型大,检测速度慢(两次预测,two stages方法的通病)

SSD网络

目标检测->SSD算法(目标检测数据集)

在不同特征尺度上预测不同尺度的目标

骨干网络:

SSD的骨干网络是基于传统的图像分类网络,采用了vgg16的部分网络作为基础网络。如图所示,经过10个卷积层(conv layer) 和 3个池化层(max pooling) 的处理,我们可以得到一个尺寸为 38×38×512 的特征图 (Conv4_3 feature map)。下一步,我们需要在这个特征图上进行回归,得到物体的位置和类别。

回归 (Regression):

和 YOLO 的回归操作相似,首先我们先考虑在特征图的每个位置上,有且只有一个候选框(default box)的情况。

1)位置回归:检测器需要给出框中心偏移量 (cx,cy),相对于图片尺寸的宽度和高度 (w,h),总计需要回归4个参数。(Fast RCNN是每一个类别都要一个回归框,总共(N+1)*4个参数)

2)分类: 对于每一个 bounding box,我们需要给出 20个类别+1个背景类的得分(score)。

对于每一个位置,我们需要一个25维的向量来存储检测物体的位置和类别信息。对于我们的38×38的特征图,我们需要一个维度为 38×38×25 的空间来存储这些信息。因此,检测器需要学习特征图(38×38×512)到检测结果(38×38×25)的映射关系。这一步转换,使用的是卷积操作:使用25个3×3的卷积核,对特征图进行卷积。到这里,我们已经完成了在每个位置上回归一个框的操作。

3)多个候选框:SSD在每个位置上,希望回归k个基于不同尺寸的框。因此在每个位置上需要 25×k 维的空间,存储这些框的回归和分类信息,因而卷积操作变成了使用 25×k个3×3的卷积核,来获得 38×38×25k 维度的检测结果图(score map)。

4)多个特征图:对于神经网络,浅层的特征图包含了更较多的细节信息,更适合进行小物体的检测;而较深的特征图包含了更多的全局信息,更适合大物体的检测。因此,通过在不同的特征图上对不同尺寸的候选框进行回归,可以对不同尺寸的物体有更好的检测结果。

SSD的检测精度和速度都非常出色,76.8 mAP 和 22FPS 超过了Faster RCNN和YOLO

本文链接地址:https://www.jiuchutong.com/zhishi/299702.html 转载请保留说明!

上一篇:ChatGPT常用开源项目汇总(cat 开源)

下一篇:【微信小程序】选择器组件picker(微信小程序开发一个多少钱)

  • 华为手环7带gps吗(华为手环7带膜吗)

    华为手环7带gps吗(华为手环7带膜吗)

  • oppopdvm00是什么型号手机(oppopdvm00是什么手机)

    oppopdvm00是什么型号手机(oppopdvm00是什么手机)

  • vivox70pro+前置像素是多少(vivox70前置像素)

    vivox70pro+前置像素是多少(vivox70前置像素)

  • 海尔洗衣机err7什么故障(海尔洗衣机err7故障处理图解)

    海尔洗衣机err7什么故障(海尔洗衣机err7故障处理图解)

  • 支付宝亲情卡怎么解除关系(支付宝亲情卡怎么转到余额)

    支付宝亲情卡怎么解除关系(支付宝亲情卡怎么转到余额)

  • 抖音复制链接拍同款怎么拍(抖音复制链接拍同款教程)

    抖音复制链接拍同款怎么拍(抖音复制链接拍同款教程)

  • 探探看不到对方个人信息(探探看不到对方的动态是不是被拉黑了)

    探探看不到对方个人信息(探探看不到对方的动态是不是被拉黑了)

  • 苹果电脑是不是typec接口(苹果电脑是不是只有一个盘)

    苹果电脑是不是typec接口(苹果电脑是不是只有一个盘)

  • 抖音多少人在玩(抖音多少人在玩游戏)

    抖音多少人在玩(抖音多少人在玩游戏)

  • 微信运动添加关注的人找不到(微信运动添加关注搜不到对方)

    微信运动添加关注的人找不到(微信运动添加关注搜不到对方)

  • 数据的属性类型有哪些(数据的属性类型包括)

    数据的属性类型有哪些(数据的属性类型包括)

  • 怎么把手机里的自动续费关掉(怎么把手机里的大视频传到电脑)

    怎么把手机里的自动续费关掉(怎么把手机里的大视频传到电脑)

  • vivox27屏幕多大英寸(vivox27屏幕尺寸多少)

    vivox27屏幕多大英寸(vivox27屏幕尺寸多少)

  • 亚马逊海外自营表示什么(亚马逊海外自营多久到货)

    亚马逊海外自营表示什么(亚马逊海外自营多久到货)

  • 移动卡激活sim输入几位(移动卡激活sim输入密码)

    移动卡激活sim输入几位(移动卡激活sim输入密码)

  • 小爱的永恒模式是啥(小米小爱永恒模式)

    小爱的永恒模式是啥(小米小爱永恒模式)

  • 苹果x双卡怎么弄(苹果x双卡怎么设置)

    苹果x双卡怎么弄(苹果x双卡怎么设置)

  • http是一种什么

    http是一种什么

  • a1534是哪一年的(a1534 macbook 配置)

    a1534是哪一年的(a1534 macbook 配置)

  • iphone xr是什么基带(平果xr是什么基带)

    iphone xr是什么基带(平果xr是什么基带)

  • ppt怎么取消音乐(wps ppt怎么取消音乐)

    ppt怎么取消音乐(wps ppt怎么取消音乐)

  • 门禁怎么安装(苹果门禁怎么安装)

    门禁怎么安装(苹果门禁怎么安装)

  • 微博怎么发红包(微博怎么发红包给粉丝)

    微博怎么发红包(微博怎么发红包给粉丝)

  • echarts 横纵坐标设置(echarts纵坐标加单位)

    echarts 横纵坐标设置(echarts纵坐标加单位)

  • js中遍历对象数组并获取对象相应的属性值(js怎样遍历对象中的每个元素)

    js中遍历对象数组并获取对象相应的属性值(js怎样遍历对象中的每个元素)

  • 折旧年限与税法有关吗
  • 开普票需要交税多少
  • 投标成交服务费
  • 业务活动表本月数和本年累计数
  • 有限合伙企业应当
  • 个人所得税怎么扣
  • 小规模纳税人认定标准2023
  • 所购税控盘减免税款
  • 合伙企业季度所得税预缴不用纳税调整是吗
  • 年末结转增值税之后增值税有余额嘛
  • 货物及劳务税目
  • 补记固定资产
  • 企业领用本企业生产的产品会计分录
  • 总公司亏损分公司盈利如何处理
  • 发票冲销后还能用吗
  • 企业购买的预付卡赠送客户怎么入账
  • 逃避缴纳税款是税收法多少条
  • 专票多开怎么算
  • 职工福利费扣除标准2022
  • 研发费用需要发什么科目
  • 金融公司一般有哪些业务
  • 住房公积金的工资基数什么意思
  • 年终汇算清缴怎么计算
  • 幼儿园开发成本
  • 贴现利息计算器
  • 打开我的电脑出现找不到应用程序
  • win11前面板耳机没声音
  • 安装额外语言
  • 信用卡扣手续费怎么算的
  • 上个月多计提的费用怎么调整
  • 疫情期间企业贷款利率多少
  • 任务栏音量图标点击无反应
  • 命令行wifi
  • 融资租入的设备为什么属于资产
  • php -i
  • 进项税额是
  • 发票开具的常见错误
  • chat function
  • 个人借款放在哪个科目
  • js浅拷贝和深拷贝的方法
  • php获取前一天的时间
  • python字符串中变量替换
  • 大小周是否违反劳动法
  • 发票的普票和专票什么区别
  • 机动车发票哪几联 做帐
  • 非营利组织会计就是用于确认、计量
  • centos7.3安装
  • 办公室租金会有公摊吗
  • 银行对账单由谁负责
  • 开票机号填错了怎么办
  • 给员工买保险的好处和坏处
  • 长期借款利息如何计算
  • 以前年度损益调整借贷方向
  • 编制记账凭证的步骤
  • 货物抵货款的账务处理
  • 收到海关进口关税怎么办
  • 网上银行回单可以做账吗
  • 报销差旅费用什么收款凭证还是转账凭证
  • 增值税专用发票丢了怎么补救
  • 新医院会计制度什么时候实施
  • mysql 隐式游标
  • windows10安装教程u盘安装
  • 酷炫技术:使用ssh登录管理windows系统
  • winxp系统桌面图片
  • 提高生殖能力
  • mount挂载文件系统
  • [置顶]电影名字《收件人不详》
  • OpenGL Tips: 在Visual C++中调用FreeGLUT
  • es6数组函数
  • sqlite数据库修改及升级
  • css如何把图片重叠在一起
  • 编写一个bash脚本程序,用for循环实现
  • JavaScript中的数据类型分为两大类
  • unityugui
  • unity开发项目
  • python 变参
  • 安装配置jsp运行环境
  • 福建省国家税务局网
  • 河南政务服务网官网
  • 税务局残疾人就业保障金
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设