位置: IT常识 - 正文

(一)ADE20K数据集(adas数据集)

编辑:rootadmin
(一)ADE20K数据集

推荐整理分享(一)ADE20K数据集(adas数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:adressa数据集,adressa数据集,adfa-ld数据集,asd数据集,dbp15k数据集,adressa数据集,adressa数据集,adfa-ld数据集,内容如对您有帮助,希望把文章链接给更多的朋友!

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录1.背景简介2.ADE20K3.使用ADE20K参考资料1.背景简介

ADE20K数据集是2016年MIT开放的场景理解的数据集,可用于实例分割,语义分割和零部件分割。利用图像信息进行场景理解 scene understanding和 scene parsing。

语义分割 Semantic Segmentation即最常见的任务,将图像的不同像素按对象类别 object category进行分类,实例分割Instance Segmentation不仅要识别不同物体所属的类别,还需识别出同类的不同物体。零部件分割 Part Segmentation是在识别出的物体上分割出不同部分所属的零部件类别,这对于理解场景帮助机器人与环境交互十分重要,如在某个 scene中分割出来 chair或者 cup,为了坐下或者拿起杯⼦需要找到 objects中对应的 parts,如 chair可以坐的部分, cup的杯柄, 以实现机器⼈与知行特定的任务。

已有分割公开数据集的现状:

类别有限, 且有些数据类别在实际⽣活中并不常⻅如 COCO和 PASCAL数据集;包含的场景过少,如 Cityscapes仅包含城市街区的场景数据;Pascal-Context和 SUN还不错, 但 Pascal-Context主要包含其20个对象类的场景, ⽽SUN在对象级别的标注是不准确的。2.ADE20K

1>ADE20K的官网:https://groups.csail.mit.edu/vision/datasets/ADE20K/index.html

2>ECCV 2016举办的Scene Parsing Challenge 2016http://sceneparsing.csail.mit.edu/index_challenge.html

(一)ADE20K数据集(adas数据集)

3>tool kit github repositoryhttps://github.com/CSAILVision/ADE20K

ADE20K由 27000张图像组成,这些图像来自于SUN(2010年普林斯顿大学公开的数据集)和Places(2014年MIT公开的数据集)数据集,ADE20K中由超过3000个物体类别 category,其中很多图像组成物体的零部件的类别,以及组成零部件的零部件的类别,如 汽车的零部件 门,门上面的零部件 窗户。ADE20K中还标注了实例的 id,可用于实例分割。数据中的图像都进行了匿名化处理,做了人脸和车牌号的模糊,去除了隐私信息。

ADE20K的数据分布

训练集 Training set包含 25574张完整标注图像验证集 Validation set包含 2000张完整标注图像测试集 Test set还没有发布

ADE20K的数据组成

共包含 27574张图像3688个类,类名取自WordNet(WordNet是由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护一个词与词之间存在各种关系的英语字典)707868个对象193238个零部件

数据文件目录结构

.└── ADE20K_2021_17_01 └── images └── ADE └── training └── urban └── street ├── ADE_train_00016869 │ ├── instance_000_ADE_train_00016869.png │ ├── instance_001_ADE_train_00016869.png │ ├── instance_..._ADE_train_00016869.png ├── ADE_train_00016869.jpg ├── ADE_train_00016869.json ├── ADE_train_00016869_parts_1.png ├── ADE_train_00016869_parts_2.png ├── ADE_train_00016869_seg.png ├── ADE_train_00016964 │ ├── instance_000_ADE_train_00016964.png │ ├── instance_001_ADE_train_00016964.png │ ├── instance_..._ADE_train_00016964.png ├── ADE_train_00016964.jpg ├── ADE_train_00016964.json ├── ADE_train_00016964_parts_1.png └── ADE_train_00016964_seg.pngimage_name.jpg原始图像,如ADE_train_00016869.jpg{image_name}_seg.png图像 image_name.jpg对应的类别和实例的标注信息,存储在其每个像素的 RGB通道中,借助 toolkit中的代码utils_ade20k.py可以实现标注信息的解析{image_name}_parts_{i}.png图层 i中包含的零部件,如ADE_train_00016869_parts_1.png{image_name},以文件名命名的文件夹,其中的每个图像分别是一个实例标注信息对应原图的掩码,由 0,1组成。如ADE_train_00016869{image_name}.json包含了图像对应的标注信息,如实例和类别标注信息的多边形,标注的时间,标注实例或对象的属性,如ADE_train_00016869.json

数据集相关的统计信息,譬如包括多少个类别,有多少个对象等,保存在一个序列化文件index_ade20k.pkl中,可以参考ade20k_starter.ipynb读取其中的信息。

print("File loaded, description of the attributes:")print('--------------------------------------------')for attribute_name, desc in index_ade20k['description'].items(): print('* {}: {}'.format(attribute_name, desc))print('--------------------------------------------\n')i = 16868 # 16899, 16964nfiles = len(index_ade20k['filename'])file_name = index_ade20k['filename'][i]num_obj = index_ade20k['objectPresence'][:, i].sum()num_parts = index_ade20k['objectIsPart'][:, i].sum()count_obj = index_ade20k['objectPresence'][:, i].max()obj_id = np.where(index_ade20k['objectPresence'][:, i] == count_obj)[0][0]obj_name = index_ade20k['objectnames'][obj_id]full_file_name = '{}/{}'.format(index_ade20k['folder'][i], index_ade20k['filename'][i])print("The dataset has {} images".format(nfiles))print("The image at index {} is {}".format(i, file_name))print("It is located at {}".format(full_file_name))print("It happens in a {}".format(index_ade20k['scene'][i]))print("It has {} objects, of which {} are parts".format(num_obj, num_parts))print("The most common object is object {} ({}), which appears {} times".format(obj_name, obj_id, count_obj))3.使用ADE20K语义分割

语义分割中使用的训练和验证数据集多是ADEchallenge 2016提供的处理好的数据集,包括150个类,不含背景0,在训练时需将background 0 设置成ignore_index。ADEChallengeData2016.zip的下载地址为

http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

最近的一些工作,如swin transformer和segfomer都在ADEChallengeData2016.zip数据集上进行了验证,这两个算法在商汤的框架mmsegmentation中都有实现,感兴趣的同学可以动手验证一下,需要注意的是使用ade20k数据集时,train_pipeline中的参数需要设置,如下

train_pipeline = [ dict(type='LoadImageFromFile'), dict(type='LoadAnnotations', reduce_zero_label=True)]

挖个坑:在实例分割和零部件分割的应用待补充

参考资料1.https://groups.csail.mit.edu/vision/datasets/ADE20K/2.https://github.com/open-mmlab/mmsegmentation

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

本文链接地址:https://www.jiuchutong.com/zhishi/297846.html 转载请保留说明!

上一篇:TDesign小程序组件库体验(小程序navigator组件)

下一篇:一行代码“黑”掉任意网站(一行简单的代码)

  • 联想个人云t2和t2pro区别(联想个人云t2和t1)

    联想个人云t2和t2pro区别(联想个人云t2和t1)

  • 开心消消乐730关怎么过(开心消消乐730关攻略视频教程)

    开心消消乐730关怎么过(开心消消乐730关攻略视频教程)

  • 苹果信任了验证不了(苹果信任验证失败)

    苹果信任了验证不了(苹果信任验证失败)

  • 苹果多少可以双卡双待(苹果几可以双开)

    苹果多少可以双卡双待(苹果几可以双开)

  • 充电宝充不满(充电宝充不满电一直闪)

    充电宝充不满(充电宝充不满电一直闪)

  • 华为p30和mate20pro区别(华为p30和mate20pro对比哪个好)

    华为p30和mate20pro区别(华为p30和mate20pro对比哪个好)

  • 支付宝数据如何迁移到新手机(支付宝数据如何迁移到苹果手机)

    支付宝数据如何迁移到新手机(支付宝数据如何迁移到苹果手机)

  • 土豆视频不能搜索(土豆视频不能搜索吗)

    土豆视频不能搜索(土豆视频不能搜索吗)

  • 乐视手机怎么分屏?(乐视手机怎么分屏)

    乐视手机怎么分屏?(乐视手机怎么分屏)

  • opj文件用什么软件打开(op文件是什么)

    opj文件用什么软件打开(op文件是什么)

  • oppo手机充电不显示闪充标志(oppo手机充电不显示超级快充了)

    oppo手机充电不显示闪充标志(oppo手机充电不显示超级快充了)

  • 电脑系统激活和不激活有什么区别(电脑系统激活和不激活)

    电脑系统激活和不激活有什么区别(电脑系统激活和不激活)

  • 剪映音乐解析失败怎么回事(剪映音乐解析失败是什么意思)

    剪映音乐解析失败怎么回事(剪映音乐解析失败是什么意思)

  • k歌需要什么设备(k歌配置)

    k歌需要什么设备(k歌配置)

  • 红包最多一次能发多少(红包最多一次能领多少钱)

    红包最多一次能发多少(红包最多一次能领多少钱)

  • 手机怎么给电脑充电(手机怎么给电脑投屏)

    手机怎么给电脑充电(手机怎么给电脑投屏)

  • 淘宝预付款可以退吗(淘宝预付款可以开发票吗)

    淘宝预付款可以退吗(淘宝预付款可以开发票吗)

  • 代理服务器的功能(代理服务器的功能一般不包括)

    代理服务器的功能(代理服务器的功能一般不包括)

  • 鼠标的单击操作是指(鼠标的单击操作方式)

    鼠标的单击操作是指(鼠标的单击操作方式)

  • 苹果x无线充电伤电池吗(苹果x无线充电没反应)

    苹果x无线充电伤电池吗(苹果x无线充电没反应)

  • 旺旺名字是淘宝名字吗(旺旺名字是淘宝账号还是呢称)

    旺旺名字是淘宝名字吗(旺旺名字是淘宝账号还是呢称)

  • 大疆无人机照片存哪了(大疆无人机照片找不到)

    大疆无人机照片存哪了(大疆无人机照片找不到)

  • iPhone XS Max怎样录屏(iPhone xs max怎样设置充电动画)

    iPhone XS Max怎样录屏(iPhone xs max怎样设置充电动画)

  • 360路由器怎么连接并设置上网(360路由器怎么连接网络)

    360路由器怎么连接并设置上网(360路由器怎么连接网络)

  • python文件的三大访问方式(python文件可分为哪几类)

    python文件的三大访问方式(python文件可分为哪几类)

  • 汽车购置税计算器2019
  • 工程结算时如何确认收入
  • 给离退休人员发的短信
  • 投资性房地产处置的账务处理
  • 专票如何开具
  • 房产税和城镇土地使用税的区别
  • 红字发票重复提交了数据该怎么处理
  • 申报后发现成本算错了
  • 发票后面附清单明细能导出吗
  • 销售过程中客户买的是什么
  • 人力资源服务费发票可以抵扣吗
  • 资产的计量属性主要包括哪些
  • 财务费用利息收入借方表示什么
  • 出口转内销补交关税
  • 股东退股分红怎么拿回
  • 社保基数超过工资
  • 固定资产报废变卖收入缴税账务处理
  • 计提年终奖金的会计分录怎么写
  • 其他账簿印花税减免税优惠政策
  • 分公司如何缴纳公积金
  • 超市购物卡开票可以做账吗
  • 公司为员工交的五险一金到底是怎么回事
  • 公司双方签订协议书范本
  • 域名注册费用的会计分录
  • 银行代扣社保怎么做会计分录
  • 加计抵减申报表填写视频
  • win10怎么启动双系统
  • 华为mate40怎么打开开发者选项
  • 财务红冲是什么意思
  • 软件开发公司账务怎么做
  • Laravel 5.5中为响应请求提供的可响应接口详解
  • 编写守护进程
  • elements table
  • php简单加密
  • 工商年报认缴出资时间填错了,有什么后果
  • php页面跳转实现什么功能
  • 超参数有哪些调优方法
  • nodejs安装及环境配置 centos
  • 微信实现刮刮卡抽奖效果
  • php如何入门
  • 费用类和成本类有哪些
  • 报建费减免
  • mysql优化总结
  • 织梦标签教程
  • 财政部监制的收据没有税号可以入账吗
  • 企业账务处理程序的概念
  • 以前年度损益调整属于哪类科目
  • 职业年金是不是养老保险
  • 固定资产是怎么管理的
  • 纳税人将购买的货物分配给股东,因该货物购买时已缴纳
  • 企业管理理费包括哪些
  • 红冲发票如何做账
  • 企业用支付宝
  • 认缴资金 实缴资金
  • 调整以前年度利息支出
  • 长期股权投资出售时其他权益变动
  • 企业所有者权益在数量上等于
  • 税控盘清卡时间
  • 报销单填写发票第几页交给财务
  • 现金流量的折现值公式
  • 如何找回丢失数据
  • mysql存emoji表情
  • 手把手教你安装实木门
  • win10动态磁贴不更新
  • windows10mobile官网
  • xp系统如何禁止软件联网
  • linux rsyslogd
  • Win RT 8.1 Update 3怎么提前更新安装使用?
  • window10升级不了
  • win7系统开机登录不了怎么修复
  • 在linux系统中
  • div+css网页布局实例
  • vue3官方文档
  • jquery实现移动端
  • shell 1
  • 安卓点赞脚本
  • 平谷大集时间表2022
  • 安徽省税务局发票真伪查询平台
  • 出口之后必须办什么手续
  • 北京朝阳区国税局
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设