位置: IT常识 - 正文

Nuscenes 数据集浅析(nyu数据集)

编辑:rootadmin
Nuscenes 数据集浅析 Nuscenes 数据集浅析

推荐整理分享Nuscenes 数据集浅析(nyu数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:nuscenes数据集读取数据,ntu数据集,nyud数据集,ntu数据集,ntu数据集,nyu数据集,nuscenes数据集读取数据,nuscenes数据集怎么处理,内容如对您有帮助,希望把文章链接给更多的朋友!

参考:Nuscenes官网链接 注意:文中存在官网还未更新的内容,一般采用红色部分,进行标记。

1.数据集简要介绍

nuScenes 数据集(发音为 /nuːsiːnz/)是由Motional(前身为nuTonomy)团队开发的自动驾驶公共大规模数据集。在波士顿和新加坡收集了1000个驾驶场景,这两个城市以其密集的交通和极具挑战性的驾驶环境而闻名。手动选择20秒时长的场景,以展示多样化和有趣的驾驶机动、交通状况和意外行为。收集不同大陆的数据进一步使我们能够研究计算机视觉算法泛化能力,在不同位置、天气条件、车辆类型、植被、道路标记以及左右手交通。

2019 年 3 月,我们发布了包含全部 1000 个场景的完整 nuScenes 数据集。 完整的数据集包括大约 140 万个相机图像、39 万个激光雷达扫描、140 万个毫米波雷达扫描和 4 万个关键帧中的 140 万个对象边界框。nuScenes 数据集的灵感来自开创性的 KITTI 数据集。 nuScenes 是第一个提供来自自动驾驶汽车的整个传感器套件(6 个摄像头、1 个激光雷达、5 个雷达、GPS、IMU)的数据的大规模数据集。 与 KITTI 相比,nuScenes 包含 7 倍以上的对象标注。 应对目标检测和跟踪任务,我们在整个数据集上用 2Hz 的准确 3D 边界框注释 23 个对象类别。此外,标注了对象级别的属性,例如可见性、运动和姿态。

2020 年 7 月,我们发布了 nuScenes-lidarseg。 应对激光雷达语义分割任务中,我们使用 32 个可能的语义标签为 nuScenes 的关键帧中标注每个激光雷达点。 因此,nuScenes-lidarseg 在 40,000 个点云和 1000 个场景(850 个用于训练和验证的场景,以及 150 个用于测试的场景)中包含 14 亿个标注点。

2. 数据采集2.1 场景计划

对于 nuScenes 数据集,我们在波士顿和新加坡收集了大约 15 小时的驾驶数据。 对于完整的 nuScenes 数据集,我们发布了来自波士顿海港和新加坡 One North、皇后镇和荷兰村地区的数据。 驾驶路线经过精心挑选,以捕捉具有挑战性的场景。 我们的目标是多样化的地点、时间和天气条件。 为了平衡不同类别频率分布,我们包含了更多具有稀有类的场景(例如自行车),全部由人类专家标注。

2.2 采集车配置

组成:6 个摄像头、1 个激光雷达、5 个雷达、GPS、IMU。

为了在 LIDAR 和摄像头之间实现良好的跨模态数据对齐,当顶部 LIDAR 扫过摄像头 FOV 的中心时,会触发摄像头的曝光。图像的时间戳为曝光触发时间;而激光雷达扫描的时间戳是当前激光雷达帧实现全旋转的时间。鉴于相机的曝光时间几乎是瞬时的,这种方法通常会产生良好的数据对齐。 请注意,相机以 12Hz 运行,而 LIDAR 以 20Hz 运行。 12 次相机曝光尽可能均匀地分布在 20 次激光雷达扫描中,因此并非所有激光雷达扫描都有相应的相机帧。 将摄像头的帧速率降低到 12Hz 有助于降低感知系统的计算、带宽和存储需求。

3. 数据格式

文中描述了 nuScenes 中使用的数据库模式,由多个json文件组成。所有标注和元数据(包括校准、地图、车辆坐标等)都包含在关系数据库中。在数据库表中,每一行都可以通过其唯一的主键标记来标识。

eg. 读取数据,可以在 nusc 看到多个属性信息,具体的参考见3.x。

from nuscenes.nuscenes import NuScenesnusc = NuScenes(version='v1.0-mini', dataroot=args.root, verbose=True)3.1 attribute 属性

属性是实例的属性,在类别保持不变的情况下可以更改。 eg. 正在停放/停止/移动的车辆,以及自行车是否有骑手。

attribute { "token": <str> -- 唯一记录标识符. "name": <str> -- 属性名字. "description": <str> -- 属性描述.}3.2 calibrated_sensor 标定的传感器Nuscenes 数据集浅析(nyu数据集)

在特定车辆上校准的特定传感器(激光雷达/雷达/相机)。所有外参都是相对于自车框架给出的。所有相机图像都没有失真和校正。

calibrated_sensor { "token": <str> -- 唯一记录标识符. "sensor_token": <str> -- 指向传感器类型的外部键. "translation": <float> [3] -- 坐标系平移x,y,z,单位m. "rotation": <float> [4] -- 坐标系旋转w,x,y,z. "camera_intrinsic": <float> [3, 3] -- 相机内存,传感器没有则为空.}3.3 category 类别

物体类别的分类(例如车辆、人类),子类别由句号划分(例如 human.pedestrian.adult)。

category { "token": <str> -- 唯一记录标识符. "name": <str> -- 分类名称。 按句号划分子类别. "description": <str> -- 类别描述. "index": <int> -- nuScenes-lidarseg 的 .bin 标签文件中出于效率原因使用的标签的索引,该字段以前不存在.}3.4 ego_pose 自身姿态

车辆本身在特定时间戳的姿势,相对于日志地图的全局坐标系。自身位姿 是我们论文中描述的基于激光雷达地图的定位算法的输出,定位在 x-y 平面上是二维的。

ego_pose { "token": <str> -- 唯一记录标识符. "translation": <float> [3] -- 坐标系平移: x, y, z. z一直为0. "rotation": <float> [4] -- 坐标系旋转四元数: w, x, y, z. "timestamp": <int> -- Unix 时间戳.}3.5 instance 实例

一个对象实例,例如: 特定车辆。该表是我们观察到的所有对象实例的枚举,请注意,不会跨场景跟踪实例。

instance { "token": <str> -- 唯一记录标识符. "category_token": <str> -- 指向物体类别的外部键. "nbr_annotations": <int> -- 该实例的标注数目. "first_annotation_token": <str> -- Foreign key. Points to the first annotation of this instance. "last_annotation_token": <str> -- Foreign key. Points to the last annotation of this instance.}3.6 lidarseg 雷达分割

nuScenes-lidarseg 标注和与关键帧的激光雷达点云之间的映射。

lidarseg { "token": <str> -- 唯一记录标识符. "filename": <str> -- 包含 nuScenes-lidarseg 标签的 .bin 文件的名称。使用 numpy 以二进制格式存储的 uint8 的 numpy 数组. "sample_data_token": <str> -- 外部关键字。 Sample_data 对应于带有 is_key_frame=True 注释的激光雷达点云. }3.7 log 日志

数据提取内容的日志信息。

log { "token": <str> -- 唯一记录标识符. "logfile": <str> -- 日志文件名字. "vehicle": <str> -- 车辆名字. "date_captured": <str> -- 日期(YYYY-MM-DD). "location": <str> -- 捕获日志的位置.}3.8 map 地图

地图数据是俯视图,二进制语义掩码的数据。

map { "token": <str> -- 唯一记录标识符.. "log_tokens": <str> [n] -- 外部的键. "category": <str> -- 地图类别,目前只有可行驶的表面和人行道的先验语义. "filename": <str> -- 相对于地图掩码文件的相对路径.}3.9 sample 样本

样本是 2 Hz 带标注的关键帧。 数据是单个 LIDAR 的一次扫描,认为该次扫描时间戳非常接近。

sample { "token": <str> -- 唯一记录标识符. "timestamp": <int> -- Unix 时间戳. "scene_token": <str> -- 指向场景的外部键. "next": <str> -- 外部键. 接下来时间的样本. 场景结尾位置为空. "prev": <str> -- 外部键. 前一刻时间的样本. 场景开始位置为空. "data": <dict> -- 关键帧中的数据,内含有RADAR、LIDAR、CAM数据的token "anns": <list> -- 标注框。}

注意:data 、anns为新增属性,官方文档中省略未提 或者 暂未更新。

3.10 sample_annotation 样本标注

定义样本中所见对象位置的边界框,所有位置数据都是相对于全局坐标系给出的。

sample_annotation { "token": <str> -- 唯一记录标识符. "sample_token": <str> -- 外部键.注意:这指向一个样本而不是样本数据,因为注释是在样本级别完成的,考虑到所有相关的样本数据. "instance_token": <str> -- 实例键. 此标注属于哪个对象实例,随着时间的推移,一个实例可以有多个注释. "attribute_tokens": <str> [n] -- 属性键. 标注的属性列表,属性会随着时间而改变,所以它们属于这里,而不是在实例表中. "visibility_token": <str> -- 可见性键. 可见性也可能随时间而改变,如果没有标注可见性,则标记为空字符串. "translation": <float> [3] -- 包围盒中心位置: center_x, center_y, center_z. "size": <float> [3] -- 包围盒的尺寸: width, length, height. "rotation": <float> [4] -- 包围盒的旋转: w, x, y, z. "num_lidar_pts": <int> -- 盒子中的激光点数. 该样本中雷达扫描识别的点数. "num_radar_pts": <int> -- 盒子中毫米波雷达点数,该样本中毫米波雷达扫描识别的点数,这个数字是所有毫米波传感器的总和,没有过滤任何无效点. "next": <str> -- 外部键. 下一时刻来自同一个对象实例的样本注释,如果这是此对象的最后一个注释,则为空. "prev": <str> -- 外部键. 上一时刻来自同一个对象实例的样本注释,如果这是此对象的第一个注释,则为空. "category_name": <str> -- 类别名称.例如如下形式:'human.pedestrian.adult'}

注意:category_name为新增属性,官方文档中省略未提 或者 暂未更新。

3.11 sample_data 样本数据

传感器数据,例如:图像、点云或毫米波。 对于 is_key_frame=True 的 sample_data,时间戳应该非常接近它指向的样本。 对于非关键帧,sample_data 指向时间最近的样本 sample。

sample_data { "token": <str> -- 唯一记录标识符. "sample_token": <str> -- 样本键. 与其相联系的样本键. "ego_pose_token": <str> -- 自运动键. "calibrated_sensor_token": <str> -- 标定传感器键. "filename": <str> -- 硬盘数据块的相对路径. "fileformat": <str> -- 数据文件格式. "width": <int> -- 图像宽(像素). "height": <int> -- 图像高(像素). "timestamp": <int> -- Unix 时间戳. "is_key_frame": <bool> -- 如果样本数据是关键帧则为真, 否则为假. "next": <str> -- 下一帧外部键. 下一时刻来自同传感器的样本数据. 如果是场景结束则为空. "prev": <str> -- 上一帧外部键. 上一时刻来自同传感器的样本数据. 如果是场景开始则为空. "sensor_modality": <str> -- 传感器模态,如lidar "channel": <str> -- 通道,如LIDAR_TOP}

注意:sensor_modality、channel为新增属性,官方文档中省略未提 或者 暂未更新。

3.12 scene 场景

场景是从日志中提取的 20 秒长的连续帧序列, 多个场景可以来自同一个日志。 请注意,物体对象身份(实例标记)不会跨场景保留。

scene { "token": <str> -- 唯一记录标识符. "name": <str> -- 短字符串标识符. "description": <str> -- 场景更详尽的描述. "log_token": <str> -- 日志键. 指向数据提取位置的日志. "nbr_samples": <int> -- 场景中样本数量. "first_sample_token": <str> -- 第一样本键,指向场景中的第一个样本. "last_sample_token": <str> -- 最终样本键,指向场景中的最后一个样本.}3.13 sensor 传感器

一种具体的传感器类型

sensor { "token": <str> -- 唯一记录标识符. "channel": <str> -- 传感器通道名称. "modality": <str> {camera, lidar, radar} -- 传感器模式,支持括号中的类别.}3.14 visibility 可见性

实例的可见性是在所有 6 个图像中可见的注释部分,分为 0-40%、40-60%、60-80% 和 80-100% 的 4 个容器。

visibility { "token": <str> -- 唯一记录标识符. "level": <str> -- 可见性等级. "description": <str> -- 可见性等级描述.}
本文链接地址:https://www.jiuchutong.com/zhishi/288036.html 转载请保留说明!

上一篇:最短命的iPad是什么(ipad最长使用时间)

下一篇:DevTools 无法加载来源映射:无法加载 chrome-extension: 警告的原因以及如何去除(全网最全 最详细解决方案)(devtools无法加载源映射less.map)

  • 微信电话接不到没提示怎么办(微信电话接不到是什么原因)

    微信电话接不到没提示怎么办(微信电话接不到是什么原因)

  • 微信订阅号消息怎么关闭(微信订阅号消息看一看关闭不了)

    微信订阅号消息怎么关闭(微信订阅号消息看一看关闭不了)

  • 电脑找不到苹果手机热点怎么办(电脑找不到苹果手机的个人热点)

    电脑找不到苹果手机热点怎么办(电脑找不到苹果手机的个人热点)

  • 快捷指令里没有自动化(快捷指令里没有考勤打卡)

    快捷指令里没有自动化(快捷指令里没有考勤打卡)

  • vivo手机录屏一卡一卡的(vivo手机录屏一小时不能录了)

    vivo手机录屏一卡一卡的(vivo手机录屏一小时不能录了)

  • 手机淘宝我的评价怎么删除(手机淘宝我的评价在哪里找?)

    手机淘宝我的评价怎么删除(手机淘宝我的评价在哪里找?)

  • cpu有什么用?(cpu有什么用处)

    cpu有什么用?(cpu有什么用处)

  • 键盘进水会永久失灵吗(键盘进水会永久失效吗)

    键盘进水会永久失灵吗(键盘进水会永久失效吗)

  • t0101是什么指令(t指令用于指定什么)

    t0101是什么指令(t指令用于指定什么)

  • 手机卡长时间不交费会自动注销吗(手机卡长时间不交费会怎么样)

    手机卡长时间不交费会自动注销吗(手机卡长时间不交费会怎么样)

  • 拼多多的单号为什么填不到淘宝上(拼多多单号为啥尾数都一样)

    拼多多的单号为什么填不到淘宝上(拼多多单号为啥尾数都一样)

  • p40耳机孔在哪里(华为p40耳机孔在哪里)

    p40耳机孔在哪里(华为p40耳机孔在哪里)

  • 抖音实名认证解除还可以再认证吗(抖音实名认证解绑后账号还能用吗)

    抖音实名认证解除还可以再认证吗(抖音实名认证解绑后账号还能用吗)

  • 手机充电时间过长对电池有影响吗(手机充电时间过长开不了机)

    手机充电时间过长对电池有影响吗(手机充电时间过长开不了机)

  • 小米air2蓝牙耳机可以单独使用吗?(小米air2蓝牙耳机声音不平衡)

    小米air2蓝牙耳机可以单独使用吗?(小米air2蓝牙耳机声音不平衡)

  • win10怎么关掉杀毒软件(如何关闭windows 10杀毒)

    win10怎么关掉杀毒软件(如何关闭windows 10杀毒)

  • 手机怎么省电(手机怎么省电模式)

    手机怎么省电(手机怎么省电模式)

  • 手机wps发送文件夹(手机wps发送文件显示文件为空或不存在)

    手机wps发送文件夹(手机wps发送文件显示文件为空或不存在)

  • 计算机病毒是计算机系统中自动产生的(计算机病毒是计算机隐藏在哪里的)

    计算机病毒是计算机系统中自动产生的(计算机病毒是计算机隐藏在哪里的)

  • ipad排线松了怎么拍打(ipadmini排线松了)

    ipad排线松了怎么拍打(ipadmini排线松了)

  • 苹果闪电接口什么意思(苹果闪电接口有什么用)

    苹果闪电接口什么意思(苹果闪电接口有什么用)

  • 情侣空间解除了情侣相册会消失吗(情侣空间解除了相册相片还能找回来吗)

    情侣空间解除了情侣相册会消失吗(情侣空间解除了相册相片还能找回来吗)

  • 小爱同学为什么不能放音乐了(小爱同学为什么连接不上蓝牙)

    小爱同学为什么不能放音乐了(小爱同学为什么连接不上蓝牙)

  • 安卓怎么传照片给苹果(安卓怎么传照片到另一个手机上)

    安卓怎么传照片给苹果(安卓怎么传照片到另一个手机上)

  • x27升降摄像头怎么打开(x27的升降摄像头)

    x27升降摄像头怎么打开(x27的升降摄像头)

  • 微信声音怎么设置大小(微信声音怎么设置别的声音)

    微信声音怎么设置大小(微信声音怎么设置别的声音)

  • 苹果的carplay怎么用(苹果的carplay怎么下载)

    苹果的carplay怎么用(苹果的carplay怎么下载)

  • evga显卡是什么档次(为什么很少有人讨论evga的显卡)

    evga显卡是什么档次(为什么很少有人讨论evga的显卡)

  • 网上蛋糕商城JSP页面(网上蛋糕商城jsp页面)

    网上蛋糕商城JSP页面(网上蛋糕商城jsp页面)

  • 湖南省增值税发票图片
  • 税收分类编码如果选择大类开票会怎样
  • 运费收入算销售收入吗
  • 房地产开发企业销售自行开发的房地产项目
  • 今年补交上年的对外捐赠(视同销售收入)的税怎么处理?
  • 预提费用在资产负债表里写在哪
  • 临时工工资怎么申报个人所得税
  • 有营业额有成本怎么算成本占比
  • 微信收入算现金流出吗
  • 金税盘维护费抵税账务处理
  • 子公司之间资产划拨会计处理
  • 购入土地使用权以什么为计税依据
  • 会议费报销税务规定
  • 公司合并是不是先变更股权
  • 微税平台怎么打印发票
  • 小微企业资质证书
  • 哪些进项税不能加计抵减
  • 研发费用的扣除比例是多少
  • 当月工资补扣个税吗
  • 购买使用过的固定资产如何计提折旧
  • 物业营改增什么时候开始
  • 一般纳税人增值税及附加税费申报表怎么填
  • 申请银行汇票手续费记账凭证
  • 出口销售收入记账方法有哪些?
  • 腾达路由器管理员密码
  • 主管会计的具体工作
  • macos big sur值得升级吗
  • chrome谷歌浏览器
  • laravel框架关键技术解析
  • 自产应税消费品用于在建工程要交增值税吗
  • php面向对象的三大特性
  • php ajax请求
  • 溢价收购股权会计处理案例
  • php计算圆的周长和面积代码
  • 什么是神经网络算法
  • 前端开发做什么副业
  • uniapp前端 django后端
  • 人民日报公共事件的报道问题
  • 帝国cms移动端
  • 代收代缴水费收不上来怎么办
  • 劳务派遣差额征税政策
  • 固定资产对外投资
  • 主营业务收入借贷方
  • 帮客户代付保证金合法吗
  • 销项税计提多了
  • 减免增值税记账
  • 应收票据和应付票据的区别
  • 报税中反写是什么意思
  • 租赁写字楼的需求有哪些
  • 记账发生错账怎么办
  • 如何查看网络连接密码
  • ubuntu14.4安装教程
  • win10 version 1607 累积更新失败卡了怎么办
  • centos查看当前yum源
  • win7一键共享软件
  • 远程电脑屏幕桌面图标什么都没有了
  • windows7开机
  • Win7系统如何清除流氓屏保
  • linux就该这么
  • win7系统点击图标没反应
  • windows7默认网关不可用
  • Win8.1 32位和64位有什么区别 Win8.1 32位和64区别详细介绍
  • perl-v
  • javascript创建对象
  • 怎么在dos下运行
  • cocos 2dx
  • JavaScript驾驭网页-DOM
  • nodejs实战
  • ug输入代码
  • 对应用进行单元测试的是
  • python计算π值
  • html仿淘宝
  • android应用程序包下载安装
  • android界面设计规范
  • 重庆电子税务局网页版登录
  • 办理授权税务事项有哪些
  • 网上发票分配
  • 增值税和消费税申报对比不符怎么处理
  • 汽车销售流程有哪些环节?每个环节的主要内容是什么?
  • 湖北职称网上申请流程
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设