位置: IT常识 - 正文

(二)Cityscapes数据集简介(cityscape dataset)

编辑:rootadmin
(二)Cityscapes数据集简介

推荐整理分享(二)Cityscapes数据集简介(cityscape dataset),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:cityscapes官网,cityscapes数据集介绍,cityscape dataset,cityscape dataset,cityscapes官网,cityscapepro,cityscapes数据集介绍,cityscape dataset,内容如对您有帮助,希望把文章链接给更多的朋友!

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录1.简介目录结构参考资料1.简介

Daimler AG现在称为Mercedes-Benz研发中心和达姆施塔特工业大学(德语:Technische Universität Darmstadt)研究人员开放的数据集,论文发表在2016年的CVPR。cityscapess采集自德国及附近国家的50个城市,包括了春夏秋三个季节的街区场景,且使用双目相机的获取了立体视觉视频序列。研究人员认为雨雪等极端天气需要特殊的处理方法和数据集进行研究,因此在cityscapess数据集中没有采集此类数据。数据采集使用的是1/3英寸 CMOS 2MP sensors (OnSemi安森美 AR0331),帧率为17的卷帘相机,包括左目和右目,基线距离22cm,采集的是色彩深度为16位的的HDR图像。

数据集有选自27个城市的5000张图像进行了pixel-level像素级的语义和实例标注,可用于训练语义分割网络,这5000张中的每一张都取自于对应的一个包含30帧的视频序列的第20帧,剩余23个城市的20000张图像进行了粗略标注,这20000张图像是每间隔20s或汽车行驶20m采集一张得到的。精标一张数据平均1.5h,粗标一张数据7min。不同的标注人员对选出来的30张数据进行重复标注,像素一致性达96%,去除可标注为unclear的类别后,像素一致性达98%。

分割数据集包含了33个类,因部分类别数据量过于稀少,在验证数据集上,只有19个语义分割类,因此要根据*_polygons.json文件生成*_labelTrainIds.png用以训练语义分割网络,可借助cityscapesScripts工程中的cityscapesscripts/preparation/createTrainIdLabelImgs.py脚本,在语义分割的5000张图像的标注文件中,转换后训练时设置成ignore_indexe的类别255的像素个数分布为max: 1105427.0, min: 114462.0, avg: 263878.772,图像大小是2048x1024,255的占比最高大于50%。有个问题就是,使用语义分割模型测试输入一张图像,其输出每个像素的类别,这些类别都在0-18上,是无法预测出255这种类别的,对于在标签文件上本来属于255类别的像素也会被预测成0-18,这是否会影响模型的推理输出呢?

语义分割数据集以城市为单位划分,分成了train:2975张,validation:500张,test:1525张, 与KITTI/CamVid/DUS数据集进行对比,

更多的交通参与实例(汽车和人)

human和vehicle数量分布,与Caltech和KITTI对比

立体信息,汽车到相机距离的分布(二)Cityscapes数据集简介(cityscape dataset)

目录结构

示例:

.├── gtBbox3d│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster├── gtFine│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster├── leftImg8bit│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster

路径:{root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext} 参数解读:

{root},数据集根路径,安装使用cityscapesScripts提供的工具csViewer和csLabelTool等时,需先设置export CITYSCAPES_DATASET={root}type,数据的类型,如gtFine精准标注的分割数据,leftImg8bit左目LDR图像等split,可能的值有train/val/test/train_extra/demoVideo等,有些可能时空的city,采集数据的城市seq,图像数据所在视频序列编码,6位数字frame,图像所在视频帧的编码,6位数字ext,文件扩展名,如标注的json文件_polygons.json,全景分割中使用的实例标签文件instanceIds.png等

以上路径中的type可选的值有:

gtFine,精准标注的5000张数据的标注文件,同样划分成train/val/test,对于每个图像对应的标注文件有以下几个:aachen_000085_000019_gtFine_color.pngaachen_000085_000019_gtFine_instanceIds.pngaachen_000085_000019_gtFine_labelIds.pngaachen_000085_000019_gtFine_polygons.json_gtFine_polygons.json,标注生成的json文件,可用来生成_instanceTrainIds.png和_labelTrainIds.png_labelIds.png,以labelId展示的语义分割标签文件,_instanceIds.png,以labelId展示的实例分割标签文件_color.png,可视化文件

在使用gtFine中的数据做语义分割和实例分割模型训练时,需将标注文件转成19个类的TrainIds上,可以借助cityscapesScripts中的csCreateTrainIdLabelImgs和csCreateTrainIdInstanceImgs工具生成以下图像:aachen_000085_000019_gtFine_instanceTrainIds.pngaachen_000085_000019_gtFine_labelTrainIds.pnggtCoarse,粗略标注的19998张图像leftImg8bit,左目8位LDR图像rightImg8bit右目8位LDR图像gtBbox3d,2020年7月发布的3d 汽车检测的标注文件,对精准标注的5000张图像标注了汽车的3d检测框,可见论文Cityscapes 3D (Gählert et al., CVPRW '20)gtBboxCityPersons,17年发布的行人检测标注文件

cityscapesScripts中提供的工具主要有:

csViewer,可视化图像,及对应的标注文件,可调整透明度csLabelTool,数据集使用的标注文件csCreateTrainIdLabelImgs,根据_polygons.json生成labels.py中定义的TrainIds语义分割标签图像csCreateTrainIdInstanceImgs,根据_polygons.json生成labels.py中定义的TrainIds标签实例分割图像

详细的可以在cityscapesScripts中找到.

总结一下,这个2015年公开的数据集,到现在可以支持验证的任务有:

语义分割实例分割全景语义分割3D 物体检测(汽车)行人检测

其有左目右目的数据和视差图,应该可以用来做单目深度估计网络的训练.

参考资料

1.https://www.cityscapes-dataset.com/dataset-overview/ 2.https://github.com/mcordts/cityscapesScripts

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

本文链接地址:https://www.jiuchutong.com/zhishi/295986.html 转载请保留说明!

上一篇:resnet(4)------全连接层与softmax(resnet+unet)

下一篇:前端实现vue3使用axios调用后端接口(vue前端代码实例)

  • 192.168.223.1无线设置(1921682231无线设置向导手机)

    192.168.223.1无线设置(1921682231无线设置向导手机)

  • 移动宽带网关不在线怎么解决(移动宽带显示网关不在线的处理方法)

    移动宽带网关不在线怎么解决(移动宽带显示网关不在线的处理方法)

  • 淘宝开团是什么意思啊(淘宝开团是什么意思,不能直接买吗)

    淘宝开团是什么意思啊(淘宝开团是什么意思,不能直接买吗)

  • qq重新编辑后照片糊了(qq重新编辑照片会模糊是为什么)

    qq重新编辑后照片糊了(qq重新编辑照片会模糊是为什么)

  • iphonex喇叭只有一个响(苹果x有一个喇叭没声音)

    iphonex喇叭只有一个响(苹果x有一个喇叭没声音)

  • 微信怎么搜索群聊(微信怎么搜索群聊并添加)

    微信怎么搜索群聊(微信怎么搜索群聊并添加)

  • 为什么p40拍照不清楚(p40拍照不行)

    为什么p40拍照不清楚(p40拍照不行)

  • 手机格式化了没有备份怎么办(手机格式化了没法激活怎么办)

    手机格式化了没有备份怎么办(手机格式化了没法激活怎么办)

  • 买相机有什么问题需要注意(买相机有什么注意事项)

    买相机有什么问题需要注意(买相机有什么注意事项)

  • 手机售后检测会拆机吗?(手机售后检测会查手机吗)

    手机售后检测会拆机吗?(手机售后检测会查手机吗)

  • 华为手机有红外线吗(华为手机有红外功能的型号有哪些)

    华为手机有红外线吗(华为手机有红外功能的型号有哪些)

  • 苹果11突然死机转圈圈(苹果11突然死机开不了机)

    苹果11突然死机转圈圈(苹果11突然死机开不了机)

  • qq的屏幕分享有声音吗(qq的屏幕分享有记录吗)

    qq的屏幕分享有声音吗(qq的屏幕分享有记录吗)

  • 网络层四个协议有哪些(网络层四个协议是什么)

    网络层四个协议有哪些(网络层四个协议是什么)

  • 4g卡用5g手机上网快吗?(4g卡放在5g手机)

    4g卡用5g手机上网快吗?(4g卡放在5g手机)

  • 承载系统要不要选lte

    承载系统要不要选lte

  • qq群语音聊天限制人数吗(qq群语音通话上限多少人)

    qq群语音聊天限制人数吗(qq群语音通话上限多少人)

  • 微信怎么批量删部分朋友圈(微信怎么批量删除朋友圈内容)

    微信怎么批量删部分朋友圈(微信怎么批量删除朋友圈内容)

  • 手机不亮屏怎么办(手机不亮屏怎么拍照)

    手机不亮屏怎么办(手机不亮屏怎么拍照)

  • x27有红外线功能吗(x27带红外功能吗)

    x27有红外线功能吗(x27带红外功能吗)

  • 分区引导记录是什么(分区引导记录不可引导)

    分区引导记录是什么(分区引导记录不可引导)

  • 微信bundle id在哪里(微信id查不到怎么回事)

    微信bundle id在哪里(微信id查不到怎么回事)

  • 海豚充电宝怎么退押金(海豚充电宝怎么用)

    海豚充电宝怎么退押金(海豚充电宝怎么用)

  • 为什么苹果手机4g变2g(为什么苹果手机突然黑屏打不开)

    为什么苹果手机4g变2g(为什么苹果手机突然黑屏打不开)

  • 小米9是旗舰机吗(小米9旗舰机参数)

    小米9是旗舰机吗(小米9旗舰机参数)

  • 怎么发现微信谁删了我(怎么发现微信谁是群主)

    怎么发现微信谁删了我(怎么发现微信谁是群主)

  • Win10如何降低版本 win10系统退回更新前版本的方法(降低win10版本)

    Win10如何降低版本 win10系统退回更新前版本的方法(降低win10版本)

  • ehRecvr.exe进程安全吗 ehRecvr是什么进程(replace.exe进程)

    ehRecvr.exe进程安全吗 ehRecvr是什么进程(replace.exe进程)

  • phpcms v9是什么(phpcms rce)

    phpcms v9是什么(phpcms rce)

  • 增值税税率改变后原项目的新增单价按哪个税率
  • 企业所得税法
  • 营业税是什么意思 视频
  • 价外税和价内税的理解
  • 去年工资计提错误,今年如何修改
  • 以前年度应收账款无法收回的账务处理
  • 加计扣除和研发费不一致
  • 公司出售房产的税费
  • 股权出让需要交税吗
  • 安全费用中的固定资产如何写会计分录?
  • 员工出差火车票可以抵扣进项吗
  • 宾馆收入应按什么计算
  • 管理费用多计提了怎么冲
  • 税控发票系统
  • 车改补贴是否计入工资总额
  • 诉讼费和保全费什么时候能退还
  • 简易计税项目取得的进项发票可以抵扣别的项目吗
  • 建筑施工企业跨区域如何缴税
  • 转出以前年度成本怎么做账
  • 合同付款会计分录
  • win10设置系统启动
  • cpu天梯图,最新
  • unix和linux适用于
  • 您的磁盘
  • 约定分摊和平均分摊有什么区别
  • 开办补贴
  • php的array_multisort()使用方法介绍
  • 大学网页制作作业dw
  • 公司缴纳残保金怎么做账
  • 天然气票据
  • 增值税业务发生的时间
  • cifar10图像分类实验报告
  • gpt3 transformer
  • 订单超时十分钟
  • java是什么意思
  • 房子是固定资产的好处
  • 高新技术产业企业认定
  • 季度所得税资产总额填错了,会不会有影响
  • 小企业会计准则没有以前年度损益调整科目
  • 防伪码显示查询次数和时间
  • mysql怎样
  • 一般纳税人企业所得税5%还是25%
  • 企业所得税的税收筹划
  • 企业缴纳印花税时需要
  • 增值税退税是否算主营业务收入
  • 现金折扣要扣除什么费用
  • 出口退税没有及时申报
  • 库存现金存入银行是什么凭证
  • 提取的安全生产费
  • 减免税款属于政府补助利得吗
  • 员工预支工资属于什么科目
  • sqlserver模糊查询不用like
  • Win10预览版怎么变回正式版
  • 强行卸载系统应用
  • win7系统屏幕键盘怎么打开
  • win8管理工具在哪里
  • win10系统的设备管理器在哪里
  • window10关闭
  • linux系列
  • cocos2dx schedule
  • JSONLINT:python的json数据验证库实例解析
  • jquery $each
  • vue实现淘宝布局
  • js的点击事件怎么做
  • jquery valid()
  • js的delegate
  • a标签的href点击怎么不跳转
  • 全面解析A型天秤座男
  • 税务上成品油换算
  • 上海社保基数对照表
  • 核定征收,新企业怎么填
  • 平原新区郑州外国语学校
  • 最新印花税税目内容
  • 广东地方税务局官网
  • 江苏省纳税信息查询
  • 进项税小于销项税
  • 软件使用权转让税率
  • 全国税务稽查会议
  • 增值税电子普通发票可以抵扣吗
  • 厦门税务机关办事大厅
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设