位置: IT常识 - 正文

目标检测->SSD算法(目标检测数据集)

编辑:rootadmin
目标检测->SSD算法

推荐整理分享目标检测->SSD算法(目标检测数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测map达到多少比较好,目标检测算法,目标检测SSD,目标检测SSD,目标检测ssd算法详解,目标检测SSD,目标检测ssd原理,目标检测ssd算法详解,内容如对您有帮助,希望把文章链接给更多的朋友!

目标检测算法总体分为:基于区域的算法和基于回归的算法

1)基于区域的算法: RCNN, Fast RCNN, Faster RCNN, Mask RCNN 等。整个检测过程分为两个阶段。在第一个阶段,检测器需要找到一些假设的区域 (ROI);在第二个阶段,检测器需要在这些假设区域上进行分类 (classification) 和 位置回归 (bounding box regression)。

2)基于回归的算法:YOLO系列 等。检测是一个端到端 (end-to-end) 的过程,直接回归出物体的类别和位置。

SSD(Single Shot MultiBox Detector)是一个one stage的检测算法。它可以认为是 Faster RCNN 和 YOLO 的结合:采用了基于回归的模式(类似于YOLO),在一个网络中直接回归出物体的类别和位置,因此检测速度很快。同时也利用了基于区域的概念(类似于Faster RCNN),在检测的过程中,使用了许多候选区域作为ROI。

Faster RCNN的回顾:

Faster RCNN存在的问题:

1)对小目标检测效果很差(只在一个特征层进行预测,这个特征层已经经过很多卷积层之后的,经过的越多,抽象层次越高,图像的细节信息保留越少,小目标效果越差,要在相对低层次上的特征来进行预测)

2)模型大,检测速度慢(两次预测,two stages方法的通病)

SSD网络

目标检测->SSD算法(目标检测数据集)

在不同特征尺度上预测不同尺度的目标

骨干网络:

SSD的骨干网络是基于传统的图像分类网络,采用了vgg16的部分网络作为基础网络。如图所示,经过10个卷积层(conv layer) 和 3个池化层(max pooling) 的处理,我们可以得到一个尺寸为 38×38×512 的特征图 (Conv4_3 feature map)。下一步,我们需要在这个特征图上进行回归,得到物体的位置和类别。

回归 (Regression):

和 YOLO 的回归操作相似,首先我们先考虑在特征图的每个位置上,有且只有一个候选框(default box)的情况。

1)位置回归:检测器需要给出框中心偏移量 (cx,cy),相对于图片尺寸的宽度和高度 (w,h),总计需要回归4个参数。(Fast RCNN是每一个类别都要一个回归框,总共(N+1)*4个参数)

2)分类: 对于每一个 bounding box,我们需要给出 20个类别+1个背景类的得分(score)。

对于每一个位置,我们需要一个25维的向量来存储检测物体的位置和类别信息。对于我们的38×38的特征图,我们需要一个维度为 38×38×25 的空间来存储这些信息。因此,检测器需要学习特征图(38×38×512)到检测结果(38×38×25)的映射关系。这一步转换,使用的是卷积操作:使用25个3×3的卷积核,对特征图进行卷积。到这里,我们已经完成了在每个位置上回归一个框的操作。

3)多个候选框:SSD在每个位置上,希望回归k个基于不同尺寸的框。因此在每个位置上需要 25×k 维的空间,存储这些框的回归和分类信息,因而卷积操作变成了使用 25×k个3×3的卷积核,来获得 38×38×25k 维度的检测结果图(score map)。

4)多个特征图:对于神经网络,浅层的特征图包含了更较多的细节信息,更适合进行小物体的检测;而较深的特征图包含了更多的全局信息,更适合大物体的检测。因此,通过在不同的特征图上对不同尺寸的候选框进行回归,可以对不同尺寸的物体有更好的检测结果。

SSD的检测精度和速度都非常出色,76.8 mAP 和 22FPS 超过了Faster RCNN和YOLO

本文链接地址:https://www.jiuchutong.com/zhishi/299702.html 转载请保留说明!

上一篇:ChatGPT常用开源项目汇总(cat 开源)

下一篇:【微信小程序】选择器组件picker(微信小程序开发一个多少钱)

  • 百度广告位减少后,推广怎样玩?(百度的广告位)

    百度广告位减少后,推广怎样玩?(百度的广告位)

  • word表格如何调整行高(word表格如何调换两行)

    word表格如何调整行高(word表格如何调换两行)

  • 手机6gb十64gb是什么意思

    手机6gb十64gb是什么意思

  • 光纤收发器ab端随便吗(锐捷光纤收发器ab端)

    光纤收发器ab端随便吗(锐捷光纤收发器ab端)

  • 华为手机下载的安装包在哪里(华为手机下载的音频在哪)

    华为手机下载的安装包在哪里(华为手机下载的音频在哪)

  • 手机属于数码产品吗(手机属于数码产品类吗)

    手机属于数码产品吗(手机属于数码产品类吗)

  • 微信步数2万步是多少公里(微信步数2万步图片)

    微信步数2万步是多少公里(微信步数2万步图片)

  • 微信设置仅聊天会怎样(微信设置仅聊天后对方能看到什么)

    微信设置仅聊天会怎样(微信设置仅聊天后对方能看到什么)

  • 抖音给好友发不了语音(抖音给好友发不了视频)

    抖音给好友发不了语音(抖音给好友发不了视频)

  • 抖音访客记录在哪里看(抖音访客记录在哪里打开)

    抖音访客记录在哪里看(抖音访客记录在哪里打开)

  • 苹果无指纹是什么意思(iphone 无指纹)

    苹果无指纹是什么意思(iphone 无指纹)

  • 佳能m50能拍星空吗(佳能m50能拍星空镜头吗)

    佳能m50能拍星空吗(佳能m50能拍星空镜头吗)

  • 苹果xr通话记录不显示来电人名字(iphone通话记录)

    苹果xr通话记录不显示来电人名字(iphone通话记录)

  • vue滚动字幕怎样添加(vue文字向上循环滚动)

    vue滚动字幕怎样添加(vue文字向上循环滚动)

  • 华为圆点悬浮怎么取消(华为圆点悬浮怎么锁屏幕)

    华为圆点悬浮怎么取消(华为圆点悬浮怎么锁屏幕)

  • 淘宝双十一津贴在哪里领(淘宝双十一津贴可以叠加吗)

    淘宝双十一津贴在哪里领(淘宝双十一津贴可以叠加吗)

  • 苹果储存其他怎么删除(苹果储存中其他怎么删除)

    苹果储存其他怎么删除(苹果储存中其他怎么删除)

  • 苹果手机怎么调声音(苹果手机怎么调震动和静音)

    苹果手机怎么调声音(苹果手机怎么调震动和静音)

  • 魅族16s什么时候上市(魅族16s什么时候停产的)

    魅族16s什么时候上市(魅族16s什么时候停产的)

  • 搜索历史怎么彻底清除吗(怎么彻底清除搜索历史)

    搜索历史怎么彻底清除吗(怎么彻底清除搜索历史)

  • 打电话怎么消除回音(打电话怎么消除周围的噪音华为)

    打电话怎么消除回音(打电话怎么消除周围的噪音华为)

  • [已解决|多种方案]Error: Rule can only have one resource source (provided resource and test + include + excl(有多种解决方法的问题)

    [已解决|多种方案]Error: Rule can only have one resource source (provided resource and test + include + excl(有多种解决方法的问题)

  • phpcms怎么登陆后台(phpcms手机端)

    phpcms怎么登陆后台(phpcms手机端)

  • 资金账簿印花税怎么算
  • 工资延期发放最多不能超过多少天
  • 金税四期记账报税流程
  • 房产税是按不含税租金收入
  • 养老保险滞纳金最高限额规定
  • 减税后含税单价计算公式
  • 收到商业承兑汇票到期,向银行办妥有关入账手续
  • 劳务公司劳务协议范本
  • 转登记纳税人留抵退税政策
  • 受赠房产转让可以免个税
  • 房地产开发企业增值税税率
  • 代扣五险一金会扣多少
  • 净水设备配件计算方法
  • 企业维修厂房购进材料怎样做账务处理?
  • 国债利润收入属于收入吗
  • 进项税小于销项税怎么处理
  • 国税怎么查缴税明细
  • 没有认证方式
  • 增值税普通发票税率
  • 建安企业异地个税怎么交
  • 培训费可以抵扣企业所得税
  • 增值税普票销售方无开户行账号是否可以
  • 兼职取酬案例剖析
  • 企业为员工购买团体医疗险可以全额税前扣除
  • 借主营业务成本贷库存商品
  • 新注册的公司用不用开公户
  • 已申报未导入什么意思呀
  • 退还工会经费会退回吗
  • 日用品做账时放什么东西
  • 网易打不开怎么退出游戏
  • 个体工商税务登记需要费用
  • 商场收取租金要缴纳哪些税
  • 任务栏图标调大了怎么办
  • 赠送客户的商品计入什么科目
  • 如何利用命令符复制文件
  • windows11怎么设置锁屏时间
  • 支付保证金需要附件
  • 转让二手设备如何交易
  • PHP:pg_send_query()的用法_PostgreSQL函数
  • 公司买发票的费用怎么做账
  • 公司内部往来双向挂账
  • 机器学习中的数学原理——过拟合、正则化与惩罚函数
  • opencv讲解
  • redisson php
  • 2022年windows11windows10最强VMware Workstation 16 Pro for Windows虚拟机软件最新授权版16.2.3-19376536版本
  • 专利收费的职能包括
  • 商品调价差额调整单会计分录
  • 哪些税费可以抵扣
  • 织梦如何采集文章
  • 什么情况下适用简易程序
  • 季度利润表中的利润总额
  • 一般纳税人简易征收的适用范围
  • 库存现金账实不符怎么处理
  • 车辆etc设备
  • 职工福利费支出不超过工资薪金总额的
  • 车辆按揭贷款需要什么
  • 预收账款的金额是什么
  • 销售一批产品给丙公司,该批产品标价200万yuan
  • 办理分公司的流程样本
  • mysql5.6免安装版配置
  • windows server 2008下一些设置技巧及优化经验总结
  • linux pptp客户端
  • winxp系统用户不见了
  • 在Linux系统中安装镜像步骤
  • ubuntu20.10安装教程
  • 怎么通过mac连接wifi
  • win8怎么彻底删除安装的软件
  • win10画图功能
  • win7如何删除系统启动项
  • python 执行命令
  • 超全面的竣工验收流程及资料
  • socketjs-node/info
  • window.requestAnimationFrame是什么意思,怎么用
  • js鼠标滑动特效
  • onSaveInstanceState和onRestoreInstanceState触发的时机
  • 非正常户解除申请理由
  • 建筑一般纳税人开3%
  • 国税系统打印不了发票怎么办
  • 网上报个人所得税
  • 上海市税务局的电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设