位置: IT常识 - 正文

(二)Cityscapes数据集简介(cityscape dataset)

发布时间:2024-01-15
(二)Cityscapes数据集简介

推荐整理分享(二)Cityscapes数据集简介(cityscape dataset),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:cityscapes官网,cityscapes数据集介绍,cityscape dataset,cityscape dataset,cityscapes官网,cityscapepro,cityscapes数据集介绍,cityscape dataset,内容如对您有帮助,希望把文章链接给更多的朋友!

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录1.简介目录结构参考资料1.简介

Daimler AG现在称为Mercedes-Benz研发中心和达姆施塔特工业大学(德语:Technische Universität Darmstadt)研究人员开放的数据集,论文发表在2016年的CVPR。cityscapess采集自德国及附近国家的50个城市,包括了春夏秋三个季节的街区场景,且使用双目相机的获取了立体视觉视频序列。研究人员认为雨雪等极端天气需要特殊的处理方法和数据集进行研究,因此在cityscapess数据集中没有采集此类数据。数据采集使用的是1/3英寸 CMOS 2MP sensors (OnSemi安森美 AR0331),帧率为17的卷帘相机,包括左目和右目,基线距离22cm,采集的是色彩深度为16位的的HDR图像。

数据集有选自27个城市的5000张图像进行了pixel-level像素级的语义和实例标注,可用于训练语义分割网络,这5000张中的每一张都取自于对应的一个包含30帧的视频序列的第20帧,剩余23个城市的20000张图像进行了粗略标注,这20000张图像是每间隔20s或汽车行驶20m采集一张得到的。精标一张数据平均1.5h,粗标一张数据7min。不同的标注人员对选出来的30张数据进行重复标注,像素一致性达96%,去除可标注为unclear的类别后,像素一致性达98%。

分割数据集包含了33个类,因部分类别数据量过于稀少,在验证数据集上,只有19个语义分割类,因此要根据*_polygons.json文件生成*_labelTrainIds.png用以训练语义分割网络,可借助cityscapesScripts工程中的cityscapesscripts/preparation/createTrainIdLabelImgs.py脚本,在语义分割的5000张图像的标注文件中,转换后训练时设置成ignore_indexe的类别255的像素个数分布为max: 1105427.0, min: 114462.0, avg: 263878.772,图像大小是2048x1024,255的占比最高大于50%。有个问题就是,使用语义分割模型测试输入一张图像,其输出每个像素的类别,这些类别都在0-18上,是无法预测出255这种类别的,对于在标签文件上本来属于255类别的像素也会被预测成0-18,这是否会影响模型的推理输出呢?

语义分割数据集以城市为单位划分,分成了train:2975张,validation:500张,test:1525张, 与KITTI/CamVid/DUS数据集进行对比,

更多的交通参与实例(汽车和人)

human和vehicle数量分布,与Caltech和KITTI对比

立体信息,汽车到相机距离的分布(二)Cityscapes数据集简介(cityscape dataset)

目录结构

示例:

.├── gtBbox3d│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster├── gtFine│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster├── leftImg8bit│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster

路径:{root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext} 参数解读:

{root},数据集根路径,安装使用cityscapesScripts提供的工具csViewer和csLabelTool等时,需先设置export CITYSCAPES_DATASET={root}type,数据的类型,如gtFine精准标注的分割数据,leftImg8bit左目LDR图像等split,可能的值有train/val/test/train_extra/demoVideo等,有些可能时空的city,采集数据的城市seq,图像数据所在视频序列编码,6位数字frame,图像所在视频帧的编码,6位数字ext,文件扩展名,如标注的json文件_polygons.json,全景分割中使用的实例标签文件instanceIds.png等

以上路径中的type可选的值有:

gtFine,精准标注的5000张数据的标注文件,同样划分成train/val/test,对于每个图像对应的标注文件有以下几个:aachen_000085_000019_gtFine_color.pngaachen_000085_000019_gtFine_instanceIds.pngaachen_000085_000019_gtFine_labelIds.pngaachen_000085_000019_gtFine_polygons.json_gtFine_polygons.json,标注生成的json文件,可用来生成_instanceTrainIds.png和_labelTrainIds.png_labelIds.png,以labelId展示的语义分割标签文件,_instanceIds.png,以labelId展示的实例分割标签文件_color.png,可视化文件

在使用gtFine中的数据做语义分割和实例分割模型训练时,需将标注文件转成19个类的TrainIds上,可以借助cityscapesScripts中的csCreateTrainIdLabelImgs和csCreateTrainIdInstanceImgs工具生成以下图像:aachen_000085_000019_gtFine_instanceTrainIds.pngaachen_000085_000019_gtFine_labelTrainIds.pnggtCoarse,粗略标注的19998张图像leftImg8bit,左目8位LDR图像rightImg8bit右目8位LDR图像gtBbox3d,2020年7月发布的3d 汽车检测的标注文件,对精准标注的5000张图像标注了汽车的3d检测框,可见论文Cityscapes 3D (Gählert et al., CVPRW '20)gtBboxCityPersons,17年发布的行人检测标注文件

cityscapesScripts中提供的工具主要有:

csViewer,可视化图像,及对应的标注文件,可调整透明度csLabelTool,数据集使用的标注文件csCreateTrainIdLabelImgs,根据_polygons.json生成labels.py中定义的TrainIds语义分割标签图像csCreateTrainIdInstanceImgs,根据_polygons.json生成labels.py中定义的TrainIds标签实例分割图像

详细的可以在cityscapesScripts中找到.

总结一下,这个2015年公开的数据集,到现在可以支持验证的任务有:

语义分割实例分割全景语义分割3D 物体检测(汽车)行人检测

其有左目右目的数据和视差图,应该可以用来做单目深度估计网络的训练.

参考资料

1.https://www.cityscapes-dataset.com/dataset-overview/ 2.https://github.com/mcordts/cityscapesScripts

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

本文链接地址:https://www.jiuchutong.com/zhishi/295986.html 转载请保留说明!

上一篇:resnet(4)------全连接层与softmax(resnet+unet)

下一篇:前端实现vue3使用axios调用后端接口(vue前端代码实例)

  • 到底应该怎么样做软文推广(到底应该怎么样才能度过一生)

    到底应该怎么样做软文推广(到底应该怎么样才能度过一生)

  • 网络营销5大原则,一种就能让你成功(网络营销5大原则是什么)

    网络营销5大原则,一种就能让你成功(网络营销5大原则是什么)

  • 腾讯微视可以直播吗(腾讯微视可以直播电影吗)

    腾讯微视可以直播吗(腾讯微视可以直播电影吗)

  • 淘宝评分4.6严重吗(淘宝评分4.0)

    淘宝评分4.6严重吗(淘宝评分4.0)

  • 苹果微信扬声器声音小(苹果微信扬声器语音听不见)

    苹果微信扬声器声音小(苹果微信扬声器语音听不见)

  • 华为畅享11plus什么时候上市(畅享11plus参数)

    华为畅享11plus什么时候上市(畅享11plus参数)

  • 淘宝卖家快递费怎么谈(淘宝卖家快递费大概是多少)

    淘宝卖家快递费怎么谈(淘宝卖家快递费大概是多少)

  • 惠普3636加墨后检测不到墨盒(惠普3636加墨后无法打印东西)

    惠普3636加墨后检测不到墨盒(惠普3636加墨后无法打印东西)

  • 行间距和行距一样吗(行距和行间距有什么区别)

    行间距和行距一样吗(行距和行间距有什么区别)

  • 番茄小说怎么提现不了(番茄小说怎么提取文字)

    番茄小说怎么提现不了(番茄小说怎么提取文字)

  • 华为运动耳机怎么充电(华为运动耳机怎么连接手机蓝牙)

    华为运动耳机怎么充电(华为运动耳机怎么连接手机蓝牙)

  • b站举报人别人知道吗(b站举报人别人怎么成功)

    b站举报人别人知道吗(b站举报人别人怎么成功)

  • wps为什么电脑上和手机上显示的不一样(wps为什么电脑上的图片到手机上就跟上一页合并了)

    wps为什么电脑上和手机上显示的不一样(wps为什么电脑上的图片到手机上就跟上一页合并了)

  • 计算机网络系统是一个什么系统(计算机网络系统按其覆盖范围可分成三类)

    计算机网络系统是一个什么系统(计算机网络系统按其覆盖范围可分成三类)

  • nova6是双模5G吗 (nova6是双4g吗)

    nova6是双模5G吗 (nova6是双4g吗)

  • 怎么把腾讯视频下载到电脑桌面(怎么把腾讯视频下载到手机相册)

    怎么把腾讯视频下载到电脑桌面(怎么把腾讯视频下载到手机相册)

  • 华硕笔记本end键怎么按(华硕笔记本end键是哪个键)

    华硕笔记本end键怎么按(华硕笔记本end键是哪个键)

  • oppo手机显示hd收费吗(oppo手机显示hd是怎么回事)

    oppo手机显示hd收费吗(oppo手机显示hd是怎么回事)

  • 华为m30和pro有什么不同(华为m30pro和p30pro哪个好)

    华为m30和pro有什么不同(华为m30pro和p30pro哪个好)

  • 微信读书挂着算时长吗(微信读书kundle)

    微信读书挂着算时长吗(微信读书kundle)

  • 拼多多怎么给商家好评(拼多多怎么给商家备注)

    拼多多怎么给商家好评(拼多多怎么给商家备注)

  • p30相机使用技巧(华为p30相机使用技巧)

    p30相机使用技巧(华为p30相机使用技巧)

  • qq文件打开方式怎么改(qq文件打开方式不小心点了始终)

    qq文件打开方式怎么改(qq文件打开方式不小心点了始终)

  • Win11任务栏不显示wifi图标怎么办? win11网络图标不见的解决办法(Win11任务栏不显示)

    Win11任务栏不显示wifi图标怎么办? win11网络图标不见的解决办法(Win11任务栏不显示)

  • dedecms瀑布流无限加载功能之点击加载(瀑布流样式)

    dedecms瀑布流无限加载功能之点击加载(瀑布流样式)

  • 以旧换新销售商品
  • 进项税转出从待认证到月末结转的会计分录是
  • 企业结算时待摊费用怎么办
  • 付款后发票可以抵扣吗
  • 个税申报错了并且已经缴款怎么修改
  • 公司投资款需要纳税吗
  • 返利销售增值税
  • 研发支出期末余额列报
  • 表外负债和表内负债对比
  • 购置办公用品有什么好处
  • 销售免税药品要进项税额转出吗
  • 银行代扣水费发票怎么开
  • 员工工资可以计入在建工程吗
  • 增值税缴纳地方怎么填
  • 内销选择性征收关税政策试点
  • 个人所得税费怎么计算2021
  • 库存商品结转成本摘要怎么写
  • 费用未入账是什么意思
  • 医疗保险费扣除比例
  • 劳动生产总值计算公式.doc
  • 办理税务迁移
  • 发票金额与实际付款金额不一致
  • mac与iphone联动
  • i5 8500装win10
  • 其他应收款的二级科目有备用金和老板名可以吗?
  • thinkphp withjoin
  • 现金流量套期的例子
  • 前端页面默认字体
  • 不征税收入税收政策
  • 补提去年的所得税费用是怎么做分录?
  • php time
  • 埃莫尔斯
  • 原版锯齿
  • php提取字符串中某个字符
  • 如何向企业账户转钱
  • 司法拍卖所购的房产
  • 车辆维修费怎么做分录
  • 停车费过路费和汽油费可以一起报销吗
  • html怎么设置隐藏元素
  • php+flash+jQuery多图片上传源码分享
  • 直接融资租赁案例
  • 认缴出资和注册资本
  • 公司多余的钱叫什么
  • 应收补贴款是什么
  • 投资公司投资收益要交增值税吗
  • 房地产企业的固定资产比率越高越好吗
  • SQL Server通过重建方式还原master数据库
  • 业务招待费报销制度及流程
  • 购买电脑固定资产折旧怎么算
  • 会计科目长期待摊费用
  • 应付账款不用付情况说明
  • 小规模纳税人出租不动产优惠政策
  • 汇算清缴后取得上一年发票
  • 汇算清缴退税分录
  • 小规模收到专票可以当普票用吗
  • 小规模纳税人季度不超30万怎么做账
  • 职工教育经费可以结转几年继续抵扣吗
  • sql面试题50题
  • 删除表s
  • ubuntu xenial
  • FreeBSD5.4之apache-2.0.54+php+ZendOptimizer简单安装、设置
  • 重装xp系统进不去
  • ubuntu英文系统安装中文输入法
  • centos5安装步骤
  • u盘运行win10系统
  • 晚上睡觉艾草贴肚脐
  • opengl图形裁剪
  • nodejs初始化
  • 详解16型人格
  • jquery搜索页面内容
  • 微信小程序开发用什么语言
  • js怎么操作css
  • Jquery针对tr td的一些实用操作方法(必看篇)
  • js文字滚动代码
  • 税务系统跨区调动
  • 地税局属于省直单位吗
  • 个人所得税减免标准及明细
  • 浙江国税电子税务局申报时间
  • 如何计算售价多少可以赚去自己心仪的钱
  • 依法行政的观念
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号