位置: IT常识 - 正文

【三维目标检测】CenterPoint(一)(三维目标通用模板)

编辑:rootadmin
【三维目标检测】CenterPoint(一)

推荐整理分享【三维目标检测】CenterPoint(一)(三维目标通用模板),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:三维目标示例,三维目标通用模板,三维目标是什么意思?,三维目标示例,三维目标识别,三维目标还能用吗,三维目标识别,单目三维目标检测,内容如对您有帮助,希望把文章链接给更多的朋友!

        CenterPoint是一种anchor free的三维目标检测算法模型,发表在CVPR 2021,论文名称为《Center-based 3D Object Detection and Tracking》。其主要特点在于通过预测物体的中心点来进行目标检测和位置回归,而不需要预先产生大量候选框(anchor)。因而,这种方法的后处理更加简洁,相邻目标可通过直接选择热力图中心点来确定最终目标,不需要非极大值抑制(NMS)操作来合并重叠的候选框。但这也会带来一个缺点,CenterPoint无法区分同类型且中心点接近的目标。CenterPoint可看作是二维CorneNet和CenterNet到三维空间的一个扩展。因此,了解CornerNet和CenterNet模型有利于加深对CenterPoint的理解。CenterPoint和CenterNet来源于同一个课题组的研究成果。在nuScenes数据集的3D检测和跟踪任务中,单阶段的CenterPoint模型的NDS为65.5,AMOTA为63.8。

1 源码与输入数据

        接下来介绍的源码来源于mmdetection3d框架中的CenterPoint模型。mmdetection3d安装和调试验证可参考本专栏之前的博客【mmdetection3d】mmdetection3d安装详细步骤_Coding的叶子的博客-CSDN博客_mmdetection3d安装,里面有详细介绍。

        数据采用的是nuScenes数据集,完整版和Mini版均可。NuScenes数据集详细介绍请参考博文:nuScenes数据集详细介绍_Coding的叶子的博客-CSDN博客_nuscence数据集。

2 mmdetection3d nuScenes数据处理与模型训练

        mmdetection3d NuScenes处理过程请参考博文:mmdetection3d nuScenes (持续更新)_Coding的叶子的博客-CSDN博客。

        完整版NuScenes处理命令为:

python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes

        Mini版NuScenes处理命令为:

python tools/create_data.py nuscenes --version v1.0-mini --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes【三维目标检测】CenterPoint(一)(三维目标通用模板)

        在进行程序研究或调试时,建议直接采用Mini 版NuScenes,下载速度较快且占用存储空间较小。mmdetection3d NuScenes数据集预处理完成之后,运行下述命令即可开始CenterPoint训练。

python tools/train.py configs/centerpoint/centerpoint_0075voxel_second_secfpn_4x8_cyclic_20e_nus.py3 CenterPoint简介

        CenterPoint模型的整体结构如下图所示,由最初的一阶段模型扩展为了两阶段模型。第二阶段负责对第一阶段的检测结果进行微调修正,与基于候选框的两阶段目标检测思想基本一致。这里重点介绍CenterPoint的第一个阶段,并且单阶段的CenterPoint可直接完成对三维目标的检测。

图1 CenterPoint模型结构

        CenterPoint模型的关键数据和路径包含如下几个方面。带着这几个关键点来深入理解算法程序时效率会大大提高。

3.1 输入数据

        输入数据来源于nuScenes的顶部激光雷达点云数据。点云数据包含了空间三维坐标x、y、z、雷达反射强度和雷达线束序号,共5个维度。线束序号取值范围0~31,即雷达的32线。数据包括10个类别,分属6个大类,如下所示。

[['car'], ['truck', 'construction_vehicle'], ['bus', 'trailer'], ['barrier'], ['motorcycle', 'bicycle'], ['pedestrian', 'traffic_cone']]3.2 真实标签

        真实标签主要包括中心偏移(dx、dy)、高度(z)、尺寸对数(log(size_x)、log(size_y)、log(size_z))、偏航角正弦值(sin(rot))、偏航角余弦值(cos(rot))、速度(vx、vy)和热力图(heatmap)。

        每个热力图检测一个小类目标,即场景中相同类型目标的中心由同一个特征图来预测。因此,在计算热力图的真实标签时,同一类型多目标的高斯热力图可能会出现重叠,重叠时保留最大值。另一方面,在预测时,如果相邻的预测中心点其热力图峰值也相近,而后处理直接以最大取值作为最终预测结果。因此,CenterPoint无法区分同类型且中心点接近的目标。

3.3 模型推理

        CenterPoint模型推理过程如下:

输入点云通过体素化和稀疏卷积特征得到256x180x180特征图,尺度为180x180,特征维度为256。特征图通过Second主干网络和Neck拼接得到512x180x180维特征。由于输入数据被分为了6个大类,且每个热力图仅预测一类目标,因而模型预测任务也被分为6个Head。每个Head分别预测相应类别目标的位置偏移(reg,2x180x180)、高度(height,1x180x180)、尺寸(dim,3x180x180)、偏航角(rot,2x180x180)、速度(vel,2x180x180)、热力图(heatmap,Kx180x180)。其中,热力图维度中的K表示每个大类下的子类别个数,进步确定一个热力图只能预测一个类别。

        模型推理预测的结果与真实标签一一对应。热力图的损失函数为GaussianFocalLoss。其它预测值的损失函数为L1Loss,并且速度损失权重为0.2,其它权重均为1.0。

4 模型结构与代码详解

        模型详细结构及推理过程请参考下一篇博客:【三维目标检测】CenterPoint(二)_Coding的叶子的博客-CSDN博客。

5【python三维深度学习】python三维点云从基础到深度学习_Coding的叶子的博客-CSDN博客_三维点云深度学习
本文链接地址:https://www.jiuchutong.com/zhishi/287259.html 转载请保留说明!

上一篇:最贵的安卓应用是什么(最贵的安卓应用软件)

下一篇:antd的upload组件的各种上传、下载操作(vue)(antd upload组件)

  • 红米k40防水吗(红米k40手机防水吗?)

    红米k40防水吗(红米k40手机防水吗?)

  • vivo手机如何设置返回键(vivo手机如何设置动态壁纸)

    vivo手机如何设置返回键(vivo手机如何设置动态壁纸)

  • 微信聊天记录误删怎么找回(微信聊天记录误删)

    微信聊天记录误删怎么找回(微信聊天记录误删)

  • 手机黑屏开不开而且闪屏(手机黑屏开不开机苹果一直闪屏)

    手机黑屏开不开而且闪屏(手机黑屏开不开机苹果一直闪屏)

  • 借的充电宝不还会怎样(借的充电宝不还钱会怎么样)

    借的充电宝不还会怎样(借的充电宝不还钱会怎么样)

  • 蓝牙耳机都有延迟吗(蓝牙耳机有延时正常吗)

    蓝牙耳机都有延迟吗(蓝牙耳机有延时正常吗)

  • 12123验证失败是什么原因(12123上不去用户验证失败)

    12123验证失败是什么原因(12123上不去用户验证失败)

  • 拼多多访客下降原因(拼多多没有访客量怎么办)

    拼多多访客下降原因(拼多多没有访客量怎么办)

  • 微信可以不绑定手机号吗(微信可以不绑定银行卡实名认证吗)

    微信可以不绑定手机号吗(微信可以不绑定银行卡实名认证吗)

  • main函数必须位于程序的最前面吗(main函数必须位于其他函数之前)

    main函数必须位于程序的最前面吗(main函数必须位于其他函数之前)

  • chmtl00h是什么型号(chm tl00)

    chmtl00h是什么型号(chm tl00)

  • 兼容性检查器怎么回事(兼容性检查器怎么解决word)

    兼容性检查器怎么回事(兼容性检查器怎么解决word)

  • 加好友需要短信验证怎么回事(加好友需要短信验证)

    加好友需要短信验证怎么回事(加好友需要短信验证)

  • 小米5splus屏幕是lcd吗(小米5splus屏幕是什么)

    小米5splus屏幕是lcd吗(小米5splus屏幕是什么)

  • 无线网络连接不可用怎么回事(无线网络连接不可上网怎么回事)

    无线网络连接不可用怎么回事(无线网络连接不可上网怎么回事)

  • 手机信号上的hd可关吗(手机信号上的hd2代表什么意思)

    手机信号上的hd可关吗(手机信号上的hd2代表什么意思)

  • 字符间距去哪里设置(字符间距从哪找)

    字符间距去哪里设置(字符间距从哪找)

  • 华为怎么关闭勿扰模式(华为怎么关闭勿触屏模式)

    华为怎么关闭勿扰模式(华为怎么关闭勿触屏模式)

  • 竖排文档如何调整字间距(文档变竖排)

    竖排文档如何调整字间距(文档变竖排)

  • 苹果lcd和oled的区别(苹果lcd和oled对比视频)

    苹果lcd和oled的区别(苹果lcd和oled对比视频)

  • 32根地址线内存多少(地址线32根内存多大)

    32根地址线内存多少(地址线32根内存多大)

  • 苹果面容id可以设置几个(苹果面容id可以设置几个人脸)

    苹果面容id可以设置几个(苹果面容id可以设置几个人脸)

  • 苹果手机有指南针吗(苹果手机有指南针功能吗怎么用)

    苹果手机有指南针吗(苹果手机有指南针功能吗怎么用)

  • 2023最新win10家庭版激活秘钥/序列号/神key分享 附激活工具(windows家庭版最新版本)

    2023最新win10家庭版激活秘钥/序列号/神key分享 附激活工具(windows家庭版最新版本)

  • Win7鼠标右击文件没有以管理员身份运行的选项?(win7鼠标点右键没反应)

    Win7鼠标右击文件没有以管理员身份运行的选项?(win7鼠标点右键没反应)

  • 个人所得税全年一次性奖金优惠政策
  • 税筹是什么意思,有哪些工具
  • 增值税的免税项目有哪些
  • 报销金额限制多少
  • 资产处置损益和固定资产清理的区别
  • 委托收款结算方式流程图
  • 自然人独资企业交哪些税
  • 会计档案交接怎么填写
  • 企业递延所得税费用的计算公式
  • 汽车按揭费用收合法吗?
  • 退回投标保证金分录
  • 多层股权结构设计控制法
  • 公司购买销售材料怎么写会计分录?
  • 增值税可以不计提,直接缴纳吗
  • 去税务局领用发票要多久
  • 租赁房屋的装修
  • 税控服务费全额抵扣文件
  • 对外捐赠视同销售分录
  • 预付帐款科目如何转平?
  • 出口退税率怎么算公式是什么
  • 移动网速测试软件
  • windows10无线网卡怎么连接无线网
  • 不是公司员工差评怎么写
  • 研发费用资本化可以加计扣除吗
  • php的数组函数
  • 公允价值变动损益会计处理
  • 科目余额表和资产负债表的金额不一致的原因
  • 免税是政府补助吗
  • vue加载速度慢
  • 激光器原理及应用
  • Http协议之Content-Type理解
  • 【深度学习】详解 MAE
  • AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略
  • 应收账款周转率多少合适
  • 哪些人不要申报个税
  • python怎么过滤多余空格
  • 专家劳务费能否抵扣个税
  • 预缴所得税年底处理账务吗
  • 厂房无偿使用交税吗
  • 固定资产核算应包括什么
  • 股东以固定资产投资要交增值税?
  • 单位的车辆
  • 将购进的材料用于自制生产用设备
  • 工地零电零水布置图
  • 购买材料时如果没有取得购买材料的发票
  • 小规模没交税有什么后果
  • 个人往对公账户上存款怎么存
  • 建筑业一般纳税人增值税税负率
  • 年末坏账准备计提余额减少说明什么
  • 预付账款无法取得发票如何做账
  • 物流行业会计的工作内容
  • 会计凭证销毁的地方
  • mysql 修改配置
  • sql如何对两个表数据求和
  • 让Windows Server 2008系统安全更上一层楼
  • Mac OS X 10.9 Mavericks系统怎么激活?
  • linux 详解
  • linux vim 查找替换
  • linux挂起
  • 代理服务器只能代理客户端http的请求
  • win7开机错误代码
  • linux安装步骤
  • VS2013 OpenGL MFC 编程问题
  • HttpURLConnection连接 详解
  • 多个版本python
  • cocos2dx openGL
  • jsp实现ajax
  • 多态和封装的区别
  • jQuery Validation PlugIn的使用方法详解
  • unityshader插件
  • 使用简单工厂模式的好处
  • javascript编程基础
  • Javascript中Array.prototype.map()详解
  • 安卓app控件
  • 快速掌握英语的方法
  • python中pyinstaller
  • 网上交购置税怎么拿完税证明
  • 咸阳高新区税务局地址
  • 珠海市高新区国土局局长
  • 2021税务稽查重点方向
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设