位置: IT常识 - 正文

【三维目标检测】CenterPoint(一)(三维目标通用模板)

编辑:rootadmin
【三维目标检测】CenterPoint(一)

推荐整理分享【三维目标检测】CenterPoint(一)(三维目标通用模板),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:三维目标示例,三维目标通用模板,三维目标是什么意思?,三维目标示例,三维目标识别,三维目标还能用吗,三维目标识别,单目三维目标检测,内容如对您有帮助,希望把文章链接给更多的朋友!

        CenterPoint是一种anchor free的三维目标检测算法模型,发表在CVPR 2021,论文名称为《Center-based 3D Object Detection and Tracking》。其主要特点在于通过预测物体的中心点来进行目标检测和位置回归,而不需要预先产生大量候选框(anchor)。因而,这种方法的后处理更加简洁,相邻目标可通过直接选择热力图中心点来确定最终目标,不需要非极大值抑制(NMS)操作来合并重叠的候选框。但这也会带来一个缺点,CenterPoint无法区分同类型且中心点接近的目标。CenterPoint可看作是二维CorneNet和CenterNet到三维空间的一个扩展。因此,了解CornerNet和CenterNet模型有利于加深对CenterPoint的理解。CenterPoint和CenterNet来源于同一个课题组的研究成果。在nuScenes数据集的3D检测和跟踪任务中,单阶段的CenterPoint模型的NDS为65.5,AMOTA为63.8。

1 源码与输入数据

        接下来介绍的源码来源于mmdetection3d框架中的CenterPoint模型。mmdetection3d安装和调试验证可参考本专栏之前的博客【mmdetection3d】mmdetection3d安装详细步骤_Coding的叶子的博客-CSDN博客_mmdetection3d安装,里面有详细介绍。

        数据采用的是nuScenes数据集,完整版和Mini版均可。NuScenes数据集详细介绍请参考博文:nuScenes数据集详细介绍_Coding的叶子的博客-CSDN博客_nuscence数据集。

2 mmdetection3d nuScenes数据处理与模型训练

        mmdetection3d NuScenes处理过程请参考博文:mmdetection3d nuScenes (持续更新)_Coding的叶子的博客-CSDN博客。

        完整版NuScenes处理命令为:

python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes

        Mini版NuScenes处理命令为:

python tools/create_data.py nuscenes --version v1.0-mini --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes【三维目标检测】CenterPoint(一)(三维目标通用模板)

        在进行程序研究或调试时,建议直接采用Mini 版NuScenes,下载速度较快且占用存储空间较小。mmdetection3d NuScenes数据集预处理完成之后,运行下述命令即可开始CenterPoint训练。

python tools/train.py configs/centerpoint/centerpoint_0075voxel_second_secfpn_4x8_cyclic_20e_nus.py3 CenterPoint简介

        CenterPoint模型的整体结构如下图所示,由最初的一阶段模型扩展为了两阶段模型。第二阶段负责对第一阶段的检测结果进行微调修正,与基于候选框的两阶段目标检测思想基本一致。这里重点介绍CenterPoint的第一个阶段,并且单阶段的CenterPoint可直接完成对三维目标的检测。

图1 CenterPoint模型结构

        CenterPoint模型的关键数据和路径包含如下几个方面。带着这几个关键点来深入理解算法程序时效率会大大提高。

3.1 输入数据

        输入数据来源于nuScenes的顶部激光雷达点云数据。点云数据包含了空间三维坐标x、y、z、雷达反射强度和雷达线束序号,共5个维度。线束序号取值范围0~31,即雷达的32线。数据包括10个类别,分属6个大类,如下所示。

[['car'], ['truck', 'construction_vehicle'], ['bus', 'trailer'], ['barrier'], ['motorcycle', 'bicycle'], ['pedestrian', 'traffic_cone']]3.2 真实标签

        真实标签主要包括中心偏移(dx、dy)、高度(z)、尺寸对数(log(size_x)、log(size_y)、log(size_z))、偏航角正弦值(sin(rot))、偏航角余弦值(cos(rot))、速度(vx、vy)和热力图(heatmap)。

        每个热力图检测一个小类目标,即场景中相同类型目标的中心由同一个特征图来预测。因此,在计算热力图的真实标签时,同一类型多目标的高斯热力图可能会出现重叠,重叠时保留最大值。另一方面,在预测时,如果相邻的预测中心点其热力图峰值也相近,而后处理直接以最大取值作为最终预测结果。因此,CenterPoint无法区分同类型且中心点接近的目标。

3.3 模型推理

        CenterPoint模型推理过程如下:

输入点云通过体素化和稀疏卷积特征得到256x180x180特征图,尺度为180x180,特征维度为256。特征图通过Second主干网络和Neck拼接得到512x180x180维特征。由于输入数据被分为了6个大类,且每个热力图仅预测一类目标,因而模型预测任务也被分为6个Head。每个Head分别预测相应类别目标的位置偏移(reg,2x180x180)、高度(height,1x180x180)、尺寸(dim,3x180x180)、偏航角(rot,2x180x180)、速度(vel,2x180x180)、热力图(heatmap,Kx180x180)。其中,热力图维度中的K表示每个大类下的子类别个数,进步确定一个热力图只能预测一个类别。

        模型推理预测的结果与真实标签一一对应。热力图的损失函数为GaussianFocalLoss。其它预测值的损失函数为L1Loss,并且速度损失权重为0.2,其它权重均为1.0。

4 模型结构与代码详解

        模型详细结构及推理过程请参考下一篇博客:【三维目标检测】CenterPoint(二)_Coding的叶子的博客-CSDN博客。

5【python三维深度学习】python三维点云从基础到深度学习_Coding的叶子的博客-CSDN博客_三维点云深度学习
本文链接地址:https://www.jiuchutong.com/zhishi/287259.html 转载请保留说明!

上一篇:最贵的安卓应用是什么(最贵的安卓应用软件)

下一篇:antd的upload组件的各种上传、下载操作(vue)(antd upload组件)

  • 微信公众号怎样快速与安全的涨粉(微信公众号怎样发布内容)

    微信公众号怎样快速与安全的涨粉(微信公众号怎样发布内容)

  • 钉钉怎么注册新账号(钉钉公司怎么注册使用)

    钉钉怎么注册新账号(钉钉公司怎么注册使用)

  • 给多人发邮件用什么号隔开(给多人发邮件用什么格式)

    给多人发邮件用什么号隔开(给多人发邮件用什么格式)

  • vivo手机自带浏览器卸载(vivo手机自带浏览器缓存视频在哪)

    vivo手机自带浏览器卸载(vivo手机自带浏览器缓存视频在哪)

  • 本地服务器是什么(本地 服务器)

    本地服务器是什么(本地 服务器)

  • 光猫的光纤灯一直闪(光猫的光纤灯一直闪烁是什么原因)

    光猫的光纤灯一直闪(光猫的光纤灯一直闪烁是什么原因)

  • 拼多多快递在路上可以退货吗(拼多多快递在路上怎么改地址)

    拼多多快递在路上可以退货吗(拼多多快递在路上怎么改地址)

  • 苹果手机11系列是双卡吗

    苹果手机11系列是双卡吗

  • 华为畅享10plus是双卡双待吗(华为畅享10plus是什么型号)

    华为畅享10plus是双卡双待吗(华为畅享10plus是什么型号)

  • usb外置光驱能接电视吗(usb外置光驱接机顶盒)

    usb外置光驱能接电视吗(usb外置光驱接机顶盒)

  • k20pro dc调光怎么开启(k20prodc调光在哪)

    k20pro dc调光怎么开启(k20prodc调光在哪)

  • qq音乐登录限制几个人(qq音乐登陆限制)

    qq音乐登录限制几个人(qq音乐登陆限制)

  • 掌通家园有回放功能吗(掌通家园能不能看回放)

    掌通家园有回放功能吗(掌通家园能不能看回放)

  • 手机都是黑白的了怎么办(手机都是黑白的怎么回事)

    手机都是黑白的了怎么办(手机都是黑白的怎么回事)

  • 快手能设置特别关注吗(快手设置特别关注怎么取消)

    快手能设置特别关注吗(快手设置特别关注怎么取消)

  • vivox27隐藏图标在哪里(vivox27隐藏图标教程)

    vivox27隐藏图标在哪里(vivox27隐藏图标教程)

  • 华为mate20x和pro对比

    华为mate20x和pro对比

  • Vue中使用Fullcalendar思路(vue中使用nodejs)

    Vue中使用Fullcalendar思路(vue中使用nodejs)

  • 【uniapp】上拉触底加载更多的两种方式,组件里面和页面里面 scroll-view组件和onReachBottom触底方法,以及部分安卓机型scroll-view很难触发问题,且可以固定表头(uniapp scroll-view 上下滑动)

    【uniapp】上拉触底加载更多的两种方式,组件里面和页面里面 scroll-view组件和onReachBottom触底方法,以及部分安卓机型scroll-view很难触发问题,且可以固定表头(uniapp scroll-view 上下滑动)

  • 【JavaScript】五个常用功能/案例:计时器 | 流程控制 | 闭包应用 | arguments剩余参数 | 二次封装函数(javascriptj)

    【JavaScript】五个常用功能/案例:计时器 | 流程控制 | 闭包应用 | arguments剩余参数 | 二次封装函数(javascriptj)

  • 和日期相关的代码和bug——一道力扣题中的小发现(跟日期有关的名字)

    和日期相关的代码和bug——一道力扣题中的小发现(跟日期有关的名字)

  • 普通发票的税率1%
  • 发行股票的手续费计入什么费用
  • 商品进销差价属于流动资产吗
  • 无形资产减值损失一经确认在以后期间不得转回
  • 纳税人采取预收的措施
  • 未进行账务处理违反什么
  • 不交增值税当月还需要计提税金吗?
  • 销售费用的运费算不算增值税
  • 企业所得税清算报备是什么意思
  • 非营利组织企业所得税政策
  • 办税员可以增加办税员吗
  • win10怎么恢复被系统删除的文件
  • 华为Mate50Pro配置多少
  • rebootandselectproperbotdevice
  • win11安装失败无法开机
  • 公司向法人借款有税务风险吗
  • 收到发票怎么入库
  • 侵权行为 法律行为
  • 重装系统前需要注意什么
  • windows10激活密钥免费2023
  • 股份支付费用是股权激励成本吗?
  • replace.exe进程
  • 委托代销商品的科目编码
  • 收到现金股利会影响利润吗
  • php操作文件的常用函数
  • 长期待摊费用是非流动资产吗
  • 红字专用发票是红色的吗
  • npm install或npm i后没有依赖包node_modules?
  • jupyter用法
  • des算法加密解密过程
  • php call stack
  • 功能强大的php发展趋势
  • ps命令显示进程状态
  • 固定资产投资入股是否缴纳增值税
  • dedecms怎么用
  • mysqldump -r
  • 应收票据到期后账务处理
  • 合并报表中的抵损益
  • 发票作废是冲红吗
  • 如何把excel数据导入到word表格
  • mysql数据库的设计与实现
  • 增值税发票查询全国统一发票查询平台
  • 享受残疾人增值服务的是
  • 全年一次性奖金税率表2023最新
  • 企业收到退税款在年报怎么填
  • 发票加上税额之后怎么还多了呢
  • 应交税费属于什么负债
  • 支付结算规定的基本要求
  • 自己开发自己施工
  • 清算资金往来借贷方什么意思
  • 失业人员的养老金
  • 公司里的废品的处理一般是谁负责
  • 折扣 会计
  • 应付职工社会保险费计入什么科目
  • 加油票怎么做会计分录
  • 借主营业务成本贷库存商品什么意思
  • 改制后的企业
  • mysql配置文件优化详解
  • 电脑上的win8键盘怎么打开
  • xp系统安装程序没反应
  • window7 aero
  • Win7打印机驱动备份
  • win8命令提示符管理员怎么打开
  • sqlmangr.exe - sqlmangr是什么进程 有什么用
  • 安装macos10.15.7
  • windows mobile10
  • cocos2d环境配置
  • python用于读取文本文件内容的方法
  • js移动元素位置
  • android新手入门
  • android网络通信http
  • javascript设置字体
  • android app安全
  • python集合的基本操作
  • 税务风险科是干什么的
  • 江苏常州税务局电话人工服务电话
  • 湖南国税电子税务局网
  • 工商变更信息如何在网上打印?
  • 香港买iphone要交多少税
  • 深化体制改革的根本
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设