位置: IT常识 - 正文

KITTI数据集可视化(一):点云多种视图的可视化实现

编辑:rootadmin
KITTI数据集可视化(一):点云多种视图的可视化实现

推荐整理分享KITTI数据集可视化(一):点云多种视图的可视化实现,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

如有错误,恳请指出。

在本地上,可以安装一些软件,比如:Meshlab,CloudCompare等3D查看工具来对点云进行可视化。而这篇博客是将介绍一些代码工具将KITTI数据集进行可视化操作,包括点云鸟瞰图,FOV图,以及标注信息在图像+点云上的显示。

文章目录1. 数据集准备2. 环境准备3. KITTI数据集可视化4. 点云可视化5. 鸟瞰图可视化1. 数据集准备

KITTI数据集作为自动驾驶领域的经典数据集之一,比较适合我这样的新手入门。以下资料是为了实现对KITTI数据集的可视化操作。首先在官网下载对应的数据:http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d,下载后数据的目录文件结构如下所示:

├── dataset│ ├── KITTI│ │ ├── object│ │ │ ├──KITTI│ │ │ ├──ImageSets│ │ │ ├──training│ │ │ ├──calib & velodyne & label_2 & image_22. 环境准备

这里使用了一个kitti数据集可视化的开源代码:https://github.com/kuixu/kitti_object_vis,按照以下操作新建一个虚拟环境,并安装所需的工具包。其中千万不要安装python3.7以上的版本,因为vtk不支持。

# 新建python=3.7的虚拟环境conda create -n kitti_vis python=3.7 # vtk does not support python 3.8conda activate kitti_vis# 安装opencv, pillow, scipy, matplotlib工具包pip install opencv-python pillow scipy matplotlib# 安装3D可视化工具包(以下指令会自动安转所需的vtk与pyqt5)conda install mayavi -c conda-forge# 测试python kitti_object.py --show_lidar_with_depth --img_fov --const_box --vis3. KITTI数据集可视化

下面依次展示 KITTI 数据集可视化结果,这里通过设置 data_idx=10 来展示编号为000010的数据,代码中dataset需要修改为数据集实际路径。(最后会贴上完整代码)

def visualization(): import mayavi.mlab as mlab dataset = kitti_object(os.path.join(ROOT_DIR, '../dataset/KITTI/object')) # determine data_idx data_idx = 100 # Load data from dataset objects = dataset.get_label_objects(data_idx) print("There are %d objects.", len(objects)) img = dataset.get_image(data_idx) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img_height, img_width, img_channel = img.shape pc_velo = dataset.get_lidar(data_idx)[:,0:3] calib = dataset.get_calibration(data_idx)

代码来源于参考资料,在后面会贴上我自己修改的测试代码。以下包含9种可视化的操作:

1. 图像显示def show_image(self): Image.fromarray(self.img).show() cv2.waitKey(0)

结果展示:

2. 图片上绘制2D bbox def show_image_with_2d_boxes(self): show_image_with_boxes(self.img, self.objects, self.calib, show3d=False) cv2.waitKey(0)

结果展示:

3. 图片上绘制3D bbox def show_image_with_3d_boxes(self): show_image_with_boxes(self.img, self.objects, self.calib, show3d=True) cv2.waitKey(0)

结果展示:

4. 图片上绘制Lidar投影 def show_image_with_lidar(self): show_lidar_on_image(self.pc_velo, self.img, self.calib, self.img_width, self.img_height) mlab.show()

结果展示:

5. Lidar绘制3D bbox def show_lidar_with_3d_boxes(self): show_lidar_with_boxes(self.pc_velo, self.objects, self.calib, True, self.img_width, self.img_height) mlab.show()

结果展示:

6. Lidar绘制FOV图 def show_lidar_with_fov(self): imgfov_pc_velo, pts_2d, fov_inds = get_lidar_in_image_fov(self.pc_velo, self.calib, 0, 0, self.img_width, self.img_height, True) draw_lidar(imgfov_pc_velo) mlab.show()

结果展示:

KITTI数据集可视化(一):点云多种视图的可视化实现

7. Lidar绘制3D图 def show_lidar_with_3dview(self): draw_lidar(self.pc_velo) mlab.show()

结果展示:

8. Lidar绘制BEV图

BEV图的显示与其他视图不一样,这里的代码需要有点改动,因为这里需要lidar点云的其他维度信息,所以输入不仅仅是xyz三个维度。改动代码:

# 初始pc_velo = dataset.get_lidar(data_idx)[:, 0:3]# 改为(要增加其他维度才可以查看BEV视图)pc_velo = dataset.get_lidar(data_idx)[:, 0:4]

测试代码:

def show_lidar_with_bev(self): from kitti_util import draw_top_image, lidar_to_top top_view = lidar_to_top(self.pc_velo) top_image = draw_top_image(top_view) cv2.imshow("top_image", top_image) cv2.waitKey(0)

结果展示:

9. Lidar绘制BEV图+2D bbox

同样,这里的代码改动与3.8节一样,需要点云的其他维度信息

def show_lidar_with_bev_2d_bbox(self): show_lidar_topview_with_boxes(self.pc_velo, self.objects, self.calib) mlab.show()

结果展示:

完整测试代码

参考代码:

import mayavi.mlab as mlabfrom kitti_object import kitti_object, show_image_with_boxes, show_lidar_on_image, \ show_lidar_with_boxes, show_lidar_topview_with_boxes, get_lidar_in_image_fov, \ show_lidar_with_depthfrom viz_util import draw_lidarimport cv2from PIL import Imageimport timeclass visualization: # data_idx: determine data_idx def __init__(self, root_dir=r'E:\Study\Machine Learning\Dataset3d\kitti', data_idx=100): dataset = kitti_object(root_dir=root_dir) # Load data from dataset objects = dataset.get_label_objects(data_idx) print("There are {} objects.".format(len(objects))) img = dataset.get_image(data_idx) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img_height, img_width, img_channel = img.shape pc_velo = dataset.get_lidar(data_idx)[:, 0:3] # 显示bev视图需要改动为[:, 0:4] calib = dataset.get_calibration(data_idx) # init the params self.objects = objects self.img = img self.img_height = img_height self.img_width = img_width self.img_channel = img_channel self.pc_velo = pc_velo self.calib = calib # 1. 图像显示 def show_image(self): Image.fromarray(self.img).show() cv2.waitKey(0) # 2. 图片上绘制2D bbox def show_image_with_2d_boxes(self): show_image_with_boxes(self.img, self.objects, self.calib, show3d=False) cv2.waitKey(0) # 3. 图片上绘制3D bbox def show_image_with_3d_boxes(self): show_image_with_boxes(self.img, self.objects, self.calib, show3d=True) cv2.waitKey(0) # 4. 图片上绘制Lidar投影 def show_image_with_lidar(self): show_lidar_on_image(self.pc_velo, self.img, self.calib, self.img_width, self.img_height) mlab.show() # 5. Lidar绘制3D bbox def show_lidar_with_3d_boxes(self): show_lidar_with_boxes(self.pc_velo, self.objects, self.calib, True, self.img_width, self.img_height) mlab.show() # 6. Lidar绘制FOV图 def show_lidar_with_fov(self): imgfov_pc_velo, pts_2d, fov_inds = get_lidar_in_image_fov(self.pc_velo, self.calib, 0, 0, self.img_width, self.img_height, True) draw_lidar(imgfov_pc_velo) mlab.show() # 7. Lidar绘制3D图 def show_lidar_with_3dview(self): draw_lidar(self.pc_velo) mlab.show() # 8. Lidar绘制BEV图 def show_lidar_with_bev(self): from kitti_util import draw_top_image, lidar_to_top top_view = lidar_to_top(self.pc_velo) top_image = draw_top_image(top_view) cv2.imshow("top_image", top_image) cv2.waitKey(0) # 9. Lidar绘制BEV图+2D bbox def show_lidar_with_bev_2d_bbox(self): show_lidar_topview_with_boxes(self.pc_velo, self.objects, self.calib) mlab.show()if __name__ == '__main__': kitti_vis = visualization() # kitti_vis.show_image() # kitti_vis.show_image_with_2d_boxes() # kitti_vis.show_image_with_3d_boxes() # kitti_vis.show_image_with_lidar() # kitti_vis.show_lidar_with_3d_boxes() # kitti_vis.show_lidar_with_fov() # kitti_vis.show_lidar_with_3dview() # kitti_vis.show_lidar_with_bev() kitti_vis.show_lidar_with_bev_2d_bbox() # print('...') # cv2.waitKey(0)

此外,下面再提供两份可视化代码。

4. 点云可视化

这里的同样使用的是上述的图例,且直接输入的KITTI数据集的.bin文件,即可显示点云图像。

参考代码:import numpy as npimport mayavi.mlabimport os# 000010.bin这里需要填写文件的位置# bin_file = '../data/object/training/velodyne/000000.bin'# assert os.path.exists(bin_file), "{} is not exists".format(bin_file)kitti_file = r'E:\Study\Machine Learning\Dataset3d\kitti\training\velodyne\000100.bin'pointcloud = np.fromfile(file=kitti_file, dtype=np.float32, count=-1).reshape([-1, 4])# pointcloud = np.fromfile(str("000010.bin"), dtype=np.float32, count=-1).reshape([-1, 4])print(pointcloud.shape)x = pointcloud[:, 0] # x position of pointy = pointcloud[:, 1] # y position of pointz = pointcloud[:, 2] # z position of pointr = pointcloud[:, 3] # reflectance value of pointd = np.sqrt(x ** 2 + y ** 2) # Map Distance from sensorvals = 'height'if vals == "height": col = zelse: col = dfig = mayavi.mlab.figure(bgcolor=(0, 0, 0), size=(640, 500))mayavi.mlab.points3d(x, y, z, col, # Values used for Color mode="point", colormap='spectral', # 'bone', 'copper', 'gnuplot' # color=(0, 1, 0), # Used a fixed (r,g,b) instead figure=fig, )x = np.linspace(5, 5, 50)y = np.linspace(0, 0, 50)z = np.linspace(0, 5, 50)mayavi.mlab.plot3d(x, y, z)mayavi.mlab.show()输出结果:

ps:这里的输出点云结果相比上面的点云输出结果更加的完善,而且参考的中心坐标点也不一样。

5. 鸟瞰图可视化

代码中的鸟瞰图范围可以自行设置。同样,输入的也只需要是.bin文件即可展示其鸟瞰图。

参考代码:import numpy as npfrom PIL import Imageimport matplotlib.pyplot as plt# 点云读取:000010.bin这里需要填写文件的位置kitti_file = r'E:\Study\Machine Learning\Dataset3d\kitti\training\velodyne\000100.bin'pointcloud = np.fromfile(file=kitti_file, dtype=np.float32, count=-1).reshape([-1, 4])# 设置鸟瞰图范围side_range = (-40, 40) # 左右距离# fwd_range = (0, 70.4) # 后前距离fwd_range = (-70.4, 70.4)x_points = pointcloud[:, 0]y_points = pointcloud[:, 1]z_points = pointcloud[:, 2]# 获得区域内的点f_filt = np.logical_and(x_points > fwd_range[0], x_points < fwd_range[1])s_filt = np.logical_and(y_points > side_range[0], y_points < side_range[1])filter = np.logical_and(f_filt, s_filt)indices = np.argwhere(filter).flatten()x_points = x_points[indices]y_points = y_points[indices]z_points = z_points[indices]res = 0.1 # 分辨率0.05mx_img = (-y_points / res).astype(np.int32)y_img = (-x_points / res).astype(np.int32)# 调整坐标原点x_img -= int(np.floor(side_range[0]) / res)y_img += int(np.floor(fwd_range[1]) / res)print(x_img.min(), x_img.max(), y_img.min(), x_img.max())# 填充像素值height_range = (-2, 0.5)pixel_value = np.clip(a=z_points, a_max=height_range[1], a_min=height_range[0])def scale_to_255(a, min, max, dtype=np.uint8): return ((a - min) / float(max - min) * 255).astype(dtype)pixel_value = scale_to_255(pixel_value, height_range[0], height_range[1])# 创建图像数组x_max = 1 + int((side_range[1] - side_range[0]) / res)y_max = 1 + int((fwd_range[1] - fwd_range[0]) / res)im = np.zeros([y_max, x_max], dtype=np.uint8)im[y_img, x_img] = pixel_value# imshow (灰度)im2 = Image.fromarray(im)im2.show()# imshow (彩色)# plt.imshow(im, cmap="nipy_spectral", vmin=0, vmax=255)# plt.show()结果展示:

后续的工作会加深对点云数据的理解,整个可视化项目的工程见:KITTI数据集的可视化项目,有需要的朋友可以自行下载。

参考资料:

1. KITTI自动驾驶数据集可视化教程

2. kitti数据集在3D目标检测中的入门

3. kitti数据集在3D目标检测中的入门(二)可视化详解

4. kitti_object_vis项目

本文链接地址:https://www.jiuchutong.com/zhishi/300214.html 转载请保留说明!

上一篇:js算法 字母大小写转换(如何在js中给字母排序)

下一篇:【vue2】使用elementUI进行表单验证实操(附源码)(vue el-)

  • 荣耀50手电筒快捷键在哪里(荣耀50手电筒快捷键在哪里设置)

    荣耀50手电筒快捷键在哪里(荣耀50手电筒快捷键在哪里设置)

  • 华为手机相册照片怎么压缩打包(华为手机相册照片正在加载)

    华为手机相册照片怎么压缩打包(华为手机相册照片正在加载)

  • 拼多多买的火车票怎么取(拼多多买的火车票能在12306上退吗?)

    拼多多买的火车票怎么取(拼多多买的火车票能在12306上退吗?)

  • 苹果电池变成黄颜色怎么调绿(苹果电池变成黄色了怎么办)

    苹果电池变成黄颜色怎么调绿(苹果电池变成黄色了怎么办)

  • 照片重命名的快捷键(照片重命名快捷键ctrl加什么功能)

    照片重命名的快捷键(照片重命名快捷键ctrl加什么功能)

  • 拼多多的市场定位(拼多多的市场定位和目标市场)

    拼多多的市场定位(拼多多的市场定位和目标市场)

  • 快手直播收到的礼物为什么不显示(快手直播收到的黄钻是啥意思)

    快手直播收到的礼物为什么不显示(快手直播收到的黄钻是啥意思)

  • 花呗明星来电怎么取消(花呗明星来电服务收费吗)

    花呗明星来电怎么取消(花呗明星来电服务收费吗)

  • 小米手机下载微信不适配怎么办(小米手机下载微乐家乡麻将)

    小米手机下载微信不适配怎么办(小米手机下载微乐家乡麻将)

  • 戴尔n4110是哪一年的(dell inspiration n4110)

    戴尔n4110是哪一年的(dell inspiration n4110)

  • 一根sata数据线上最多可接几个硬盘(一根sata数据线上最多可以接几块硬盘或光驱)

    一根sata数据线上最多可接几个硬盘(一根sata数据线上最多可以接几块硬盘或光驱)

  • 红米8a是全网通手机吗(红米8a是什么手机)

    红米8a是全网通手机吗(红米8a是什么手机)

  • 怎么把剪映里的视频保存到手机里(怎么把剪映里的视频发到抖音)

    怎么把剪映里的视频保存到手机里(怎么把剪映里的视频发到抖音)

  • 苹果11支持无线快充吗(苹果11支持无线充电多少W)

    苹果11支持无线快充吗(苹果11支持无线充电多少W)

  • ios13怎么换微信提醒音(iphone13微信怎么换行)

    ios13怎么换微信提醒音(iphone13微信怎么换行)

  • qq面对面快传视频存哪了(QQ面对面快传视频播放不了)

    qq面对面快传视频存哪了(QQ面对面快传视频播放不了)

  • 拼多多月卡咋取消(拼多多月卡取消自动续费的界面)

    拼多多月卡咋取消(拼多多月卡取消自动续费的界面)

  • wrzx6是什么牌子(wz是什么品牌)

    wrzx6是什么牌子(wz是什么品牌)

  • xs和xsmax的区别(xs和xsmax的区别对比)

    xs和xsmax的区别(xs和xsmax的区别对比)

  • 拼多多怎么免拼单在哪(拼多多怎么免拼机会用完了怎么办)

    拼多多怎么免拼单在哪(拼多多怎么免拼机会用完了怎么办)

  • 手机无线网出现感叹号(手机无线网出现6是什么意思)

    手机无线网出现感叹号(手机无线网出现6是什么意思)

  • 苹果电脑Macbook键盘灯怎么打开或关闭(苹果电脑macbookpro使用教程)

    苹果电脑Macbook键盘灯怎么打开或关闭(苹果电脑macbookpro使用教程)

  • 2022最新完美破解微擎小程序前端后端模块牛牛盲盒、牛牛盲盒小程序、盲盒小程序-OK源码中国破解(完美破费是什么意思)

    2022最新完美破解微擎小程序前端后端模块牛牛盲盒、牛牛盲盒小程序、盲盒小程序-OK源码中国破解(完美破费是什么意思)

  • 工业产值是含税价格吗
  • 啥子是增值税
  • 接受捐赠的增值税处理
  • 结转完工入库产品成本计算
  • 个税累计扣除项目合计2712.5是什么
  • 本期实际抵减税额合计
  • 通信费税前列支的标准和报销票据的要求
  • 固定资产大修理支出标准
  • 预收账款本期发生额怎么算
  • 车辆购置附加税证丢了能过户吗
  • 医院 科室承包
  • 教育费附加计费单位
  • 对账状态未对账
  • 补提固定资产折旧账务处理
  • 从2017年7月1日起到现在多少天
  • 小规模纳税季度申报
  • 公司用窗帘用什么颜色
  • 计算消费税要价税分离吗
  • 对公工行证书收入摘要写什么
  • 一般纳税人汇算清缴操作流程
  • 建筑企业预缴企业所得税会计分录
  • 零元股权转让会亏本吗
  • 客户汇公司账户怎么汇
  • 生产成本期末余额在贷方
  • 实收资本的期初余额在借方还是贷方
  • mac如何登陆两个微信
  • mac显示器颜色不正常
  • flash动画导出视频有水印吗
  • 项目款申请
  • 会计利润利润总额的计算
  • 公司购买空调计入什么费用
  • linux 传输文件
  • 一本书装订费多少钱
  • 即征即退增值税账务处理
  • 企业会计准则应付利息计入什么科目?
  • php冒泡法排序
  • 退休返聘人员算临时工吗
  • 对于企业无法支付的应付账款
  • php+jquery+html实现点击不刷新加载更多的实例代码
  • od输出结构
  • 公司发放工作服账务处理
  • phpcms教程
  • 印花税和工会经费用不用计提
  • 有留抵税额可以注销吗
  • 财务报表上期金额是指什么意思
  • 金税四期主要核查什么?
  • 免税收入是否可抵扣
  • 工资与社保的关系图
  • 多交的税费申请抵扣下期
  • 应收账款周转率分析
  • 出口退税免抵退税额要交城建税吗
  • 其他权益工具投资公允价值变动计入什么科目
  • 投资收益的账务怎么处理
  • 错账查找方法主要有
  • 支票有效期10天是自然日还是工作日
  • win7激活失败提示错误代码0x80072F8F
  • win8 联网
  • 修改双系统的引导顺序
  • ksysslim.exe
  • xp系统exiting pxe rom
  • Linux配置防火墙端口
  • centos6.5关闭休眠
  • 如何解决笔记本电脑温度过高 蓝屏
  • win8开始界面如何设置成win7
  • musirc4.71.exe - musirc4是什么进程文件 有什么作用
  • win7系统盘扩大
  • js如何使用
  • node.js 模块
  • css全局样式基础代码
  • Node.js中的事件循环是什么意思
  • unity点击播放声音
  • javascript制作简易计算机
  • shell脚本中获取日期
  • python获取文件内所有函数
  • django for
  • 河北国家税务局发票查询系统
  • 重庆税务登记证在哪里办理
  • 青海的医疗保险费是多少钱
  • 晋江电视
  • 准予扣除是什么意思
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设