位置: IT常识 - 正文

(二)Cityscapes数据集简介(cityscape dataset)

编辑:rootadmin
(二)Cityscapes数据集简介

推荐整理分享(二)Cityscapes数据集简介(cityscape dataset),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:cityscapes官网,cityscapes数据集介绍,cityscape dataset,cityscape dataset,cityscapes官网,cityscapepro,cityscapes数据集介绍,cityscape dataset,内容如对您有帮助,希望把文章链接给更多的朋友!

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录1.简介目录结构参考资料1.简介

Daimler AG现在称为Mercedes-Benz研发中心和达姆施塔特工业大学(德语:Technische Universität Darmstadt)研究人员开放的数据集,论文发表在2016年的CVPR。cityscapess采集自德国及附近国家的50个城市,包括了春夏秋三个季节的街区场景,且使用双目相机的获取了立体视觉视频序列。研究人员认为雨雪等极端天气需要特殊的处理方法和数据集进行研究,因此在cityscapess数据集中没有采集此类数据。数据采集使用的是1/3英寸 CMOS 2MP sensors (OnSemi安森美 AR0331),帧率为17的卷帘相机,包括左目和右目,基线距离22cm,采集的是色彩深度为16位的的HDR图像。

数据集有选自27个城市的5000张图像进行了pixel-level像素级的语义和实例标注,可用于训练语义分割网络,这5000张中的每一张都取自于对应的一个包含30帧的视频序列的第20帧,剩余23个城市的20000张图像进行了粗略标注,这20000张图像是每间隔20s或汽车行驶20m采集一张得到的。精标一张数据平均1.5h,粗标一张数据7min。不同的标注人员对选出来的30张数据进行重复标注,像素一致性达96%,去除可标注为unclear的类别后,像素一致性达98%。

分割数据集包含了33个类,因部分类别数据量过于稀少,在验证数据集上,只有19个语义分割类,因此要根据*_polygons.json文件生成*_labelTrainIds.png用以训练语义分割网络,可借助cityscapesScripts工程中的cityscapesscripts/preparation/createTrainIdLabelImgs.py脚本,在语义分割的5000张图像的标注文件中,转换后训练时设置成ignore_indexe的类别255的像素个数分布为max: 1105427.0, min: 114462.0, avg: 263878.772,图像大小是2048x1024,255的占比最高大于50%。有个问题就是,使用语义分割模型测试输入一张图像,其输出每个像素的类别,这些类别都在0-18上,是无法预测出255这种类别的,对于在标签文件上本来属于255类别的像素也会被预测成0-18,这是否会影响模型的推理输出呢?

语义分割数据集以城市为单位划分,分成了train:2975张,validation:500张,test:1525张, 与KITTI/CamVid/DUS数据集进行对比,

更多的交通参与实例(汽车和人)

human和vehicle数量分布,与Caltech和KITTI对比

立体信息,汽车到相机距离的分布(二)Cityscapes数据集简介(cityscape dataset)

目录结构

示例:

.├── gtBbox3d│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster├── gtFine│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster├── leftImg8bit│ ├── test│ │ ├── berlin│ │ ├── bielefeld│ │ ├── bonn│ │ ├── leverkusen│ │ ├── mainz│ │ └── munich│ ├── train│ │ ├── aachen│ │ ├── bochum│ │ ├── bremen│ │ ├── cologne│ │ ├── darmstadt│ │ ├── dusseldorf│ │ ├── erfurt│ │ ├── hamburg│ │ ├── hanover│ │ ├── jena│ │ ├── krefeld│ │ ├── monchengladbach│ │ ├── strasbourg│ │ ├── stuttgart│ │ ├── tubingen│ │ ├── ulm│ │ ├── weimar│ │ └── zurich│ └── val│ ├── frankfurt│ ├── lindau│ └── munster

路径:{root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext} 参数解读:

{root},数据集根路径,安装使用cityscapesScripts提供的工具csViewer和csLabelTool等时,需先设置export CITYSCAPES_DATASET={root}type,数据的类型,如gtFine精准标注的分割数据,leftImg8bit左目LDR图像等split,可能的值有train/val/test/train_extra/demoVideo等,有些可能时空的city,采集数据的城市seq,图像数据所在视频序列编码,6位数字frame,图像所在视频帧的编码,6位数字ext,文件扩展名,如标注的json文件_polygons.json,全景分割中使用的实例标签文件instanceIds.png等

以上路径中的type可选的值有:

gtFine,精准标注的5000张数据的标注文件,同样划分成train/val/test,对于每个图像对应的标注文件有以下几个:aachen_000085_000019_gtFine_color.pngaachen_000085_000019_gtFine_instanceIds.pngaachen_000085_000019_gtFine_labelIds.pngaachen_000085_000019_gtFine_polygons.json_gtFine_polygons.json,标注生成的json文件,可用来生成_instanceTrainIds.png和_labelTrainIds.png_labelIds.png,以labelId展示的语义分割标签文件,_instanceIds.png,以labelId展示的实例分割标签文件_color.png,可视化文件

在使用gtFine中的数据做语义分割和实例分割模型训练时,需将标注文件转成19个类的TrainIds上,可以借助cityscapesScripts中的csCreateTrainIdLabelImgs和csCreateTrainIdInstanceImgs工具生成以下图像:aachen_000085_000019_gtFine_instanceTrainIds.pngaachen_000085_000019_gtFine_labelTrainIds.pnggtCoarse,粗略标注的19998张图像leftImg8bit,左目8位LDR图像rightImg8bit右目8位LDR图像gtBbox3d,2020年7月发布的3d 汽车检测的标注文件,对精准标注的5000张图像标注了汽车的3d检测框,可见论文Cityscapes 3D (Gählert et al., CVPRW '20)gtBboxCityPersons,17年发布的行人检测标注文件

cityscapesScripts中提供的工具主要有:

csViewer,可视化图像,及对应的标注文件,可调整透明度csLabelTool,数据集使用的标注文件csCreateTrainIdLabelImgs,根据_polygons.json生成labels.py中定义的TrainIds语义分割标签图像csCreateTrainIdInstanceImgs,根据_polygons.json生成labels.py中定义的TrainIds标签实例分割图像

详细的可以在cityscapesScripts中找到.

总结一下,这个2015年公开的数据集,到现在可以支持验证的任务有:

语义分割实例分割全景语义分割3D 物体检测(汽车)行人检测

其有左目右目的数据和视差图,应该可以用来做单目深度估计网络的训练.

参考资料

1.https://www.cityscapes-dataset.com/dataset-overview/ 2.https://github.com/mcordts/cityscapesScripts

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

本文链接地址:https://www.jiuchutong.com/zhishi/295986.html 转载请保留说明!

上一篇:resnet(4)------全连接层与softmax(resnet+unet)

下一篇:前端实现vue3使用axios调用后端接口(vue前端代码实例)

  • 抖音可以绑定银行卡吗(抖音可以绑定银行卡可以解绑吗)

    抖音可以绑定银行卡吗(抖音可以绑定银行卡可以解绑吗)

  • 抖音音浪是什么(抖音音浪是什么时候可以提现)

    抖音音浪是什么(抖音音浪是什么时候可以提现)

  • cdma是什么网络(怎样把手机4g信号变5g)

    cdma是什么网络(怎样把手机4g信号变5g)

  • 笔记本电脑能下载万能钥匙吗(笔记本电脑能下载歌曲到优盘吗)

    笔记本电脑能下载万能钥匙吗(笔记本电脑能下载歌曲到优盘吗)

  • 微信消费别人能查到吗(微信消费别人能收到吗)

    微信消费别人能查到吗(微信消费别人能收到吗)

  • 退出合种树对方有提醒(如何退出合种的树)

    退出合种树对方有提醒(如何退出合种的树)

  • 自己的拼多多ip怎么查(自己的拼多多店铺网址在哪里看)

    自己的拼多多ip怎么查(自己的拼多多店铺网址在哪里看)

  • 打印时会弹出打印到文件(打印弹出对话框)

    打印时会弹出打印到文件(打印弹出对话框)

  • raptor基本符号有哪些(raptor基本符号用法)

    raptor基本符号有哪些(raptor基本符号用法)

  • 计算机多媒体技术主要特征(计算机多媒体技术属于什么类)

    计算机多媒体技术主要特征(计算机多媒体技术属于什么类)

  • qq校园扩列为什么匹配失败(qq 校园扩列)

    qq校园扩列为什么匹配失败(qq 校园扩列)

  • 腾讯课堂怎么分屏观看(腾讯课堂怎么分屏)

    腾讯课堂怎么分屏观看(腾讯课堂怎么分屏)

  • 抖音特效视频制作软件有哪些(抖音特效视频制作方法)

    抖音特效视频制作软件有哪些(抖音特效视频制作方法)

  • oppok3什么时候更新coloros7(oppok3什么时候停产)

    oppok3什么时候更新coloros7(oppok3什么时候停产)

  • 华为手机高清通话设置(华为手机高清通话开关在哪里)

    华为手机高清通话设置(华为手机高清通话开关在哪里)

  • 多媒体的压缩标准有哪些(多媒体的压缩标准是什么)

    多媒体的压缩标准有哪些(多媒体的压缩标准是什么)

  • 优酷可以登录几个设备(优酷可以登录几个平板)

    优酷可以登录几个设备(优酷可以登录几个平板)

  • htc怎么截图(htc怎么截图手机屏幕)

    htc怎么截图(htc怎么截图手机屏幕)

  • 手机膜坏了怎么办(手机膜坏了怎么取下来?)

    手机膜坏了怎么办(手机膜坏了怎么取下来?)

  • 抖音极速版怎么发布视频(抖音极速版怎么赚钱 一天能赚多少)

    抖音极速版怎么发布视频(抖音极速版怎么赚钱 一天能赚多少)

  • xsmax怎么开机(xsmax怎样开机)

    xsmax怎么开机(xsmax怎样开机)

  • 苹果出厂设置在哪里(iphone出厂设置在哪里)

    苹果出厂设置在哪里(iphone出厂设置在哪里)

  • 小米手环nfc怎么用法(小米手环nfc怎么开机)

    小米手环nfc怎么用法(小米手环nfc怎么开机)

  • isignup.exe是什么进程 isignup进程查询

    isignup.exe是什么进程 isignup进程查询

  • 解决Vue报错:Uncaught (in promise) NavigationDuplicated: Avoided redundant navigation to current location(vue uncaught typeerror)

    解决Vue报错:Uncaught (in promise) NavigationDuplicated: Avoided redundant navigation to current location(vue uncaught typeerror)

  • 亏损企业股权转让
  • 中了单位大奖要缴个税吗?
  • 年报和汇算清缴报表数字不一致
  • 非金融单位贷款利息收入列示什么科目
  • 车间管理人工资计入什么科目
  • 运输发票备注怎么填
  • 工业企业成本会计核算的对象是什么
  • 年底向员工客户发放、赠送实物的怎么缴个税
  • 建筑工程类发票
  • 低价销售差额部分计入
  • 增值税销项税额在借方还是贷方
  • 公司过桥贷款怎么贷
  • 建筑业分项目核算会计账务处理
  • 预付账款只有部分开了发票怎么入账
  • 教育费附加会计分录
  • 增值税期末留抵税额的账务处理
  • 企业拿到产权证后是否还需要缴纳土地使用税呢?
  • 差额征税扣除额大于收入时如何开票?
  • 小规模纳税人不用交增值税吗
  • 增值税发票每个月什么时候可以开
  • 支付宝微信结算属于什么结算方式
  • 应付质保金到期怎么办
  • 用商品抵账的会计分录
  • 个人车辆租给公司有什么后果
  • 如何手动更新目录
  • 外购固定资产对账怎么算
  • PHP:mb_ereg_replace()的用法_mbstring函数
  • linux中使用less命令分屏查看
  • 异地预缴税款后当地还交吗
  • win11打开软件出现????????
  • 住房公积金余额查询
  • PHP:pg_send_execute()的用法_PostgreSQL函数
  • 加权平均数的代码
  • 如何安装iis网站服务器
  • thinkphp5 分页
  • ui.exe啥意思
  • php魔术函数
  • 扣缴义务人需要办理税务登记吗
  • 现金流量表 科目
  • 租出固定资产的处理步骤
  • 免费开源的图片app
  • meta最新模型
  • 企业所得税季报资产总额怎么填
  • 固定资产多少可以一次摊销
  • 临时设施账务处理分录
  • 没有实收资本的股权原值
  • mongodb管理工具
  • 自由会计服务类工作者
  • mongodb subtract
  • 普票需要填写全额发票吗
  • 小微企业所得税税率多少
  • 股息和资本收益
  • 上个月的发票未开具
  • 买车抵扣增值税超销项怎么算
  • 待转销项税借方余额是什么意思
  • 残次品销售计入什么科目
  • 费用报销单怎么写 样本图片
  • 公司发放给员工的福利又要回
  • 企业的财务战略
  • Microsoft SQLServer的版本区别及选择
  • Excel导入Sqlserver数据库脚本
  • fedora常用命令
  • mac怎么自定义桌面图标
  • ubuntu和windows比较有什么好处
  • windows7命名规则
  • linux防病毒措施
  • win8系统怎样
  • extjs 为某个事件设置拦截器
  • android item属性
  • js nextSibling属性和previousSibling属性概述及使用注意
  • jquery移动端ui框架
  • 安装了python2.7和3.6怎么切换版本
  • androidstudio安装gradle不成功
  • 增值税纳税申报表附列资料(一)
  • 农民专业合作社章程完整版
  • 本期实际抵扣税金怎么算
  • 税收收入弹性值
  • 吉林省会考成绩查询入口网站官网
  • 济南税务局,济南电子税务局官网
  • 欠税多少构成犯罪
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设