位置: IT常识 - 正文

【BEV】TPVFormer复现以及原理

编辑:rootadmin
【BEV】TPVFormer复现以及原理 1. 前言

推荐整理分享【BEV】TPVFormer复现以及原理,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

在环视图像的网络中,常使用鸟瞰图来进行特征提取,尽管比体素表示更加高效,但也会损失部分信息,为了解决这个问题,TPVFormer论文中提出了三个视图来表示三维特征的方法,并且在实验中验证了仅使用图像作为输入,能够与雷达获得相当的分割效果。

本文主要介绍如何在本地运行mini数据集,以及生成对应的视频,后续会对源码进行深入学习。

mini数据集: https://pan.baidu.com/s/1oKvicVacbPFZNtXO7l9t7A?pwd=p4h4 提取码: p4h4

结果可视化:https://www.bilibili.com/video/BV1oX4y1o7FQ/?spm_id_from=333.999.0.0 BEV交流群,v群:Rex1586662742、q群:468713665。

2. 运行

在TPVFormer的仓库中,作者只针对完整的nuscenes数据集制作了 nuscenes_infos_train.pkl、nuscenes_infos_val.pkl,对于学习者来说,通常无法在完整nuscences数据集上进行测试,在后来的咨询下,原作者也是给出了mini数据集的pkl文件,通过下文的链接即可获得。以及liar文件

2.1 运行eval.py

在整理好数据集后,运行下面的指令就可以进行验证了

python eval.py --py-config xxxx --ckpt-path xxxx

直接运行应该会报错,如果报错为 self.table_names 里面没有 “lidarseg”,则需要修改如下内容 将/home/snk/anaconda3/envs/tpv/lib/python3.8/site-packages/nuscenes_devkit-1.1.10-py3.8.egg/nuscenes/nuscenes.py文件中的 self.table_names中添加一个变量 ‘lidarseg’

self.table_names = ['category', 'attribute', 'visibility', 'instance', 'sensor', 'calibrated_sensor', 'ego_pose', 'log', 'scene', 'sample', 'sample_data', 'sample_annotation', 'map','lidarseg']【BEV】TPVFormer复现以及原理

同时在附近添加一行代码

self.lidarseg = self.__load_table__('lidarseg')

再次运行

python eval.py --py-config xxxx --ckpt-path xxxx2.2 vis_scence.py

按照项目中的指示来安装环境可能会有问题,可以按照下面的方式来安装

pip install vtk==9.0.1pip install mayavi==4.7.3sudo apt updatesudo apt install xvfb

安装完毕即可运行生成视频,个人生成的视频见下方的链接。

python visualization/vis_scence ...python visualization/generate_videos.py

如果报错说pyqt5有问题,就卸载pyqt5

3 论文简介3.1 原理学习

一般只用俯视图来计算三维特征,而在本文中主要提出了一种表征三维特征的方法,即提出了tri-perspective view representation(TPV),通过三个方向的特征,很容易完成纯视觉的3d分割、3d语义分割等,作者将TPVFormer对标特斯拉的occupancy network。TPVFormer的主要流程如下图所示:

输入为6张环视图片,通过Image Backbone,可以得到不同尺度的特征层,多尺度特征层目前应用十分广泛。再通过TPVFormer模块可以获得TPV特征,最终将三个方向特聚合在[100,100,8]的体素中,每个体素特征是由三个方向的特征相加得到。在训练时,使用真实Lidar来监督,在预测时,可以输出稠密的体素特征。

img_feats = self.extract_img_feat(img=img, use_grid_mask=use_grid_mask) // 提取多尺度特征outs = self.tpv_head(img_feats, img_metas) # [1, 10000, 256]、 [1, 800, 256]、[1, 800, 256] 三个方向的BEV特征outs = self.tpv_aggregator(outs, points) # 分割结果

为何要提出三个方向的特征图,论文通过下图来进行说明: 如果直接用Voxel来表示三维特征,那么会极大的增加计算量,而直接用BEV特征会损失高度上的信息,而TPV在前面两者之间进行了折中处理,在保留不同视图特征的同时,极大的减少了计算量。因此,如何得到TPV特征是本文的重点。

上图即第一张图的补充版本,主要看后半段,TPVFormer可以分为Cross-Attention和HyBird-Attention,其中Cross-Attention就是在不同尺度上的特征层做self-atten,HyBird-Attention是TPV三个特征之间做self-atten,且全部使用deformable transformer来减少计算量。通过TPVFormer之后,就得到了TPV特征。通过TPV特征,即可获得任意一个Voexl在3D空间中的特征,然后利用分割头即可对其分类,以达到Occupancy的效果。

3.2 结果

4、总结

本文介绍了如何在本地进行TPVFormer的运行,对论文中的原理图片进行了学习,主要是学习到了文章中是如何进行TPV特征提取,以及如何使用TPV特征,文章的代码十分友好,后续会继续对源码进行学习。

本文链接地址:https://www.jiuchutong.com/zhishi/298640.html 转载请保留说明!

上一篇:【工程实践】np.loadtxt()读取数据(工程实践指的是)

下一篇:vue和react的区别(vue和react区别大吗)

  • IQOO如何关闭锁屏原子随身听(iQOO如何关闭锁屏壁纸的锁屏)

    IQOO如何关闭锁屏原子随身听(iQOO如何关闭锁屏壁纸的锁屏)

  • 美颜相机自动提亮怎么关闭(美颜相机怎么取消自动美颜)

    美颜相机自动提亮怎么关闭(美颜相机怎么取消自动美颜)

  • 鸿蒙系统怎么设置永不休眠(鸿蒙系统怎么设置手电筒快捷键)

    鸿蒙系统怎么设置永不休眠(鸿蒙系统怎么设置手电筒快捷键)

  • 互联网新闻信息服务有哪些(互联网新闻信息许可证)

    互联网新闻信息服务有哪些(互联网新闻信息许可证)

  • 电脑一插u盾就黑屏(电脑一插u盾就死机什么原因)

    电脑一插u盾就黑屏(电脑一插u盾就死机什么原因)

  • 微信无法扫码(微信无法扫码支付怎么回事)

    微信无法扫码(微信无法扫码支付怎么回事)

  • 8英寸平板小吗(8英寸平板电脑多大长和宽)

    8英寸平板小吗(8英寸平板电脑多大长和宽)

  • ipad充电器可以充iphone11吗(ipad充电器可以充电脑吗)

    ipad充电器可以充iphone11吗(ipad充电器可以充电脑吗)

  • 发出去的微信删除对方还能看见吗(发出的微信删除后对方还看得见吗)

    发出去的微信删除对方还能看见吗(发出的微信删除后对方还看得见吗)

  • word为什么前面空白但是字上不去(Word为什么前面莫名其妙空出一格)

    word为什么前面空白但是字上不去(Word为什么前面莫名其妙空出一格)

  • z390支持内存频率(z390-a支持内存频率)

    z390支持内存频率(z390-a支持内存频率)

  • 华为畅享10e可以指纹解锁吗(华为畅享10E可以玩原神吗)

    华为畅享10e可以指纹解锁吗(华为畅享10E可以玩原神吗)

  • sim卡哪一面朝上(华为sim卡哪一面朝上)

    sim卡哪一面朝上(华为sim卡哪一面朝上)

  • 号码停机怎么恢复正常(号码停机怎么恢复使用)

    号码停机怎么恢复正常(号码停机怎么恢复使用)

  • 被拉黑还能收到短信吗(被拉黑还能收到验证消息吗)

    被拉黑还能收到短信吗(被拉黑还能收到验证消息吗)

  • b站电子票怎么转赠(b站的电子票可以转让吗)

    b站电子票怎么转赠(b站的电子票可以转让吗)

  • funtouch os是什么系统(funtouch os 10)

    funtouch os是什么系统(funtouch os 10)

  • 手机充电器电压(苹果手机充电器电压)

    手机充电器电压(苹果手机充电器电压)

  • 抖音怎么调全屏(华为matepad11抖音怎么调全屏)

    抖音怎么调全屏(华为matepad11抖音怎么调全屏)

  • 抖音忘记密码怎么登录(抖音忘记密码怎么找回账号)

    抖音忘记密码怎么登录(抖音忘记密码怎么找回账号)

  • 手机漏液怎么防止扩大(手机漏液怎么防止烧主板)

    手机漏液怎么防止扩大(手机漏液怎么防止烧主板)

  • 苹果蓝牙耳机一般需要充多久电(苹果蓝牙耳机一边有声音一边没声音)

    苹果蓝牙耳机一般需要充多久电(苹果蓝牙耳机一边有声音一边没声音)

  • mate20pro耐摔吗(mate20pro好用吗)

    mate20pro耐摔吗(mate20pro好用吗)

  • xr听筒有杂音(xr听筒有杂音怎么解决)

    xr听筒有杂音(xr听筒有杂音怎么解决)

  • uki语音匹配怎么找到(uki语音匹配怎么玩)

    uki语音匹配怎么找到(uki语音匹配怎么玩)

  • win10无法启动(win10无法启动网络发现,保存后再进还是关闭状态)

    win10无法启动(win10无法启动网络发现,保存后再进还是关闭状态)

  • vivox27没有人脸识别吗(vivo手机没有人脸识别功能怎么办)

    vivox27没有人脸识别吗(vivo手机没有人脸识别功能怎么办)

  • win10怎么手动修复引导文件(win10怎么手动修改时间)

    win10怎么手动修复引导文件(win10怎么手动修改时间)

  • iconify图标使用(iconfonf)

    iconify图标使用(iconfonf)

  • 企业所得税会计科目
  • 不动产租赁开票税目
  • 收到失业金返还什么意思
  • 企业卖车需要交印花税吗
  • 建筑业差额纳税怎么算
  • 个人所得税汇缴报告
  • 盈余公积可用于集体福利吗
  • 企业购买预付卡怎么做账
  • 营改增后对外投资无形资产是否需要交增值税呢?
  • 大病医疗保险为什么贵
  • 公司股权转1元转让还涉及哪些税务风险?
  • 农场管委会是什么性质单位
  • 购进非税货物有折扣怎么做账?
  • 购物预付卡怎么用
  • 进项税额抵扣不完怎么办
  • 冲抵货款销售返利会计分录怎么写?
  • 视同销售收入计入会计利润中吗
  • ukey开票界面
  • surface安装win10专业版
  • 资产负债表期初和期末指的是什么
  • 结转已经销售商品成本
  • 企业微信api错误码
  • 百合花怎么养殖简单
  • 未到期责任准备金是什么意思
  • PHP:apache_getenv()的用法_Apache函数
  • php常用的设计模式在开发中的实例
  • 租房交了押金
  • 同一控制下的企业合并,合并方在企业合并中取得的资产
  • ErrorCaptureStackTrace(err); Error [ERR_MODULE_NOT_FOUND]: Cannot find module
  • 逾期增值税扣税凭证
  • 金融资产减值的账务处理
  • 子公司破产对母公司是利好还是利空
  • php实现有序数组的数据
  • 通行费电子发票抵扣填写到附表二的第几栏次
  • 待抵扣进项税额是什么情况下用的
  • 个税的本期收入是什么意思
  • 建设单位和施工单位的责任和义务
  • 奖金没有做到工资里怎么入账
  • 织梦下载站源码带采集
  • 小规模免税怎么做账务处理
  • 核定征收可以不用申报吗
  • CentOS 7.3上SQL Server vNext CTP 1.2安装教程
  • 小规模纳税人可以开13的税吗
  • 两处取得工资薪金如何申报
  • 装饰公司购入材料税额会计分录
  • 信用减值损失与资产减值损失
  • 小规模纳税人记账报税流程
  • 作废的金额包含在总额里面吗
  • 收到电费发票做账怎么做
  • 闲置固定资产如何折旧
  • 接受代销货物的会计分录
  • 冲暂估成本怎么做分录
  • 建筑业异地预缴个税税率
  • 发票作废了还能恢复吗?
  • 废品损失的计算方法及废品损失的范围
  • linux 文件
  • win10提示测试模式
  • windows2.0下载
  • macbookair网页全屏
  • linux中使用什么命令可以把两个文件合并
  • win7看视频黑屏有声音
  • linux添加新硬盘后网卡无法启动
  • synchost.exe - synchost是什么进程 有什么作用
  • linux扩容inode
  • win7 64位旗舰版如何实现快速删除U盘?win7快速删除U盘的设置方法
  • win10 mobile 1709
  • dos命令批量处理文件
  • nodejs 异步io底层原理
  • bat error
  • bootstrap按钮图标
  • js中的tostring方法
  • 安卓开发常用代码
  • python爬取教程
  • 山东省国家地税局官网
  • 广东税务局查验
  • 北京社保个人账户10万元退休金多少
  • 建筑业增值税纳税义务发生时间包括
  • 什么是税务证书密码
  • 小微企业房产税优惠减免政策
  • 山西省地方税务总局官网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设