位置: IT常识 - 正文

(一)ADE20K数据集(adas数据集)

编辑:rootadmin
(一)ADE20K数据集

推荐整理分享(一)ADE20K数据集(adas数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:adressa数据集,adressa数据集,adfa-ld数据集,asd数据集,dbp15k数据集,adressa数据集,adressa数据集,adfa-ld数据集,内容如对您有帮助,希望把文章链接给更多的朋友!

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录1.背景简介2.ADE20K3.使用ADE20K参考资料1.背景简介

ADE20K数据集是2016年MIT开放的场景理解的数据集,可用于实例分割,语义分割和零部件分割。利用图像信息进行场景理解 scene understanding和 scene parsing。

语义分割 Semantic Segmentation即最常见的任务,将图像的不同像素按对象类别 object category进行分类,实例分割Instance Segmentation不仅要识别不同物体所属的类别,还需识别出同类的不同物体。零部件分割 Part Segmentation是在识别出的物体上分割出不同部分所属的零部件类别,这对于理解场景帮助机器人与环境交互十分重要,如在某个 scene中分割出来 chair或者 cup,为了坐下或者拿起杯⼦需要找到 objects中对应的 parts,如 chair可以坐的部分, cup的杯柄, 以实现机器⼈与知行特定的任务。

已有分割公开数据集的现状:

类别有限, 且有些数据类别在实际⽣活中并不常⻅如 COCO和 PASCAL数据集;包含的场景过少,如 Cityscapes仅包含城市街区的场景数据;Pascal-Context和 SUN还不错, 但 Pascal-Context主要包含其20个对象类的场景, ⽽SUN在对象级别的标注是不准确的。2.ADE20K

1>ADE20K的官网:https://groups.csail.mit.edu/vision/datasets/ADE20K/index.html

2>ECCV 2016举办的Scene Parsing Challenge 2016http://sceneparsing.csail.mit.edu/index_challenge.html

(一)ADE20K数据集(adas数据集)

3>tool kit github repositoryhttps://github.com/CSAILVision/ADE20K

ADE20K由 27000张图像组成,这些图像来自于SUN(2010年普林斯顿大学公开的数据集)和Places(2014年MIT公开的数据集)数据集,ADE20K中由超过3000个物体类别 category,其中很多图像组成物体的零部件的类别,以及组成零部件的零部件的类别,如 汽车的零部件 门,门上面的零部件 窗户。ADE20K中还标注了实例的 id,可用于实例分割。数据中的图像都进行了匿名化处理,做了人脸和车牌号的模糊,去除了隐私信息。

ADE20K的数据分布

训练集 Training set包含 25574张完整标注图像验证集 Validation set包含 2000张完整标注图像测试集 Test set还没有发布

ADE20K的数据组成

共包含 27574张图像3688个类,类名取自WordNet(WordNet是由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护一个词与词之间存在各种关系的英语字典)707868个对象193238个零部件

数据文件目录结构

.└── ADE20K_2021_17_01 └── images └── ADE └── training └── urban └── street ├── ADE_train_00016869 │ ├── instance_000_ADE_train_00016869.png │ ├── instance_001_ADE_train_00016869.png │ ├── instance_..._ADE_train_00016869.png ├── ADE_train_00016869.jpg ├── ADE_train_00016869.json ├── ADE_train_00016869_parts_1.png ├── ADE_train_00016869_parts_2.png ├── ADE_train_00016869_seg.png ├── ADE_train_00016964 │ ├── instance_000_ADE_train_00016964.png │ ├── instance_001_ADE_train_00016964.png │ ├── instance_..._ADE_train_00016964.png ├── ADE_train_00016964.jpg ├── ADE_train_00016964.json ├── ADE_train_00016964_parts_1.png └── ADE_train_00016964_seg.pngimage_name.jpg原始图像,如ADE_train_00016869.jpg{image_name}_seg.png图像 image_name.jpg对应的类别和实例的标注信息,存储在其每个像素的 RGB通道中,借助 toolkit中的代码utils_ade20k.py可以实现标注信息的解析{image_name}_parts_{i}.png图层 i中包含的零部件,如ADE_train_00016869_parts_1.png{image_name},以文件名命名的文件夹,其中的每个图像分别是一个实例标注信息对应原图的掩码,由 0,1组成。如ADE_train_00016869{image_name}.json包含了图像对应的标注信息,如实例和类别标注信息的多边形,标注的时间,标注实例或对象的属性,如ADE_train_00016869.json

数据集相关的统计信息,譬如包括多少个类别,有多少个对象等,保存在一个序列化文件index_ade20k.pkl中,可以参考ade20k_starter.ipynb读取其中的信息。

print("File loaded, description of the attributes:")print('--------------------------------------------')for attribute_name, desc in index_ade20k['description'].items(): print('* {}: {}'.format(attribute_name, desc))print('--------------------------------------------\n')i = 16868 # 16899, 16964nfiles = len(index_ade20k['filename'])file_name = index_ade20k['filename'][i]num_obj = index_ade20k['objectPresence'][:, i].sum()num_parts = index_ade20k['objectIsPart'][:, i].sum()count_obj = index_ade20k['objectPresence'][:, i].max()obj_id = np.where(index_ade20k['objectPresence'][:, i] == count_obj)[0][0]obj_name = index_ade20k['objectnames'][obj_id]full_file_name = '{}/{}'.format(index_ade20k['folder'][i], index_ade20k['filename'][i])print("The dataset has {} images".format(nfiles))print("The image at index {} is {}".format(i, file_name))print("It is located at {}".format(full_file_name))print("It happens in a {}".format(index_ade20k['scene'][i]))print("It has {} objects, of which {} are parts".format(num_obj, num_parts))print("The most common object is object {} ({}), which appears {} times".format(obj_name, obj_id, count_obj))3.使用ADE20K语义分割

语义分割中使用的训练和验证数据集多是ADEchallenge 2016提供的处理好的数据集,包括150个类,不含背景0,在训练时需将background 0 设置成ignore_index。ADEChallengeData2016.zip的下载地址为

http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

最近的一些工作,如swin transformer和segfomer都在ADEChallengeData2016.zip数据集上进行了验证,这两个算法在商汤的框架mmsegmentation中都有实现,感兴趣的同学可以动手验证一下,需要注意的是使用ade20k数据集时,train_pipeline中的参数需要设置,如下

train_pipeline = [ dict(type='LoadImageFromFile'), dict(type='LoadAnnotations', reduce_zero_label=True)]

挖个坑:在实例分割和零部件分割的应用待补充

参考资料1.https://groups.csail.mit.edu/vision/datasets/ADE20K/2.https://github.com/open-mmlab/mmsegmentation

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

本文链接地址:https://www.jiuchutong.com/zhishi/297846.html 转载请保留说明!

上一篇:TDesign小程序组件库体验(小程序navigator组件)

下一篇:一行代码“黑”掉任意网站(一行简单的代码)

  • windows11怎么快速显示桌面(windows11怎么快速打开任务管理器)

    windows11怎么快速显示桌面(windows11怎么快速打开任务管理器)

  • 拼多多极速退款要等卖家同意吗(拼多多极速退款在哪里设置的)

    拼多多极速退款要等卖家同意吗(拼多多极速退款在哪里设置的)

  • 小米儿童手表怎么插卡(小米儿童手表怎么设置闹钟)

    小米儿童手表怎么插卡(小米儿童手表怎么设置闹钟)

  • 淘宝站外推广渠道有哪些(淘宝站外推广渠道有哪些类型)

    淘宝站外推广渠道有哪些(淘宝站外推广渠道有哪些类型)

  • 蓝牙需要网络吗(手机蓝牙需要网络吗)

    蓝牙需要网络吗(手机蓝牙需要网络吗)

  • p40带红外吗(p40带不带红外功能)

    p40带红外吗(p40带不带红外功能)

  • 华为nova7是屏幕指纹解锁吗(华为nova7是屏幕指纹解锁吗?)

    华为nova7是屏幕指纹解锁吗(华为nova7是屏幕指纹解锁吗?)

  • iphonex人脸识别提示手机低一点(iphonex人脸识别怎么设置)

    iphonex人脸识别提示手机低一点(iphonex人脸识别怎么设置)

  • 相机4k是什么意思(相机4k是多少像素)

    相机4k是什么意思(相机4k是多少像素)

  • nova7pro和nova6区别(nova7pro与nova6的区别)

    nova7pro和nova6区别(nova7pro与nova6的区别)

  • 500mbps速度是多少(500mbps是什么概念)

    500mbps速度是多少(500mbps是什么概念)

  • 晶体管的三种工作状态是什么(晶体管的三种工作方式)

    晶体管的三种工作状态是什么(晶体管的三种工作方式)

  • oppor11plus多大屏幕尺寸(oppo r11plus屏幕多大)

    oppor11plus多大屏幕尺寸(oppo r11plus屏幕多大)

  • 中国有光刻机吗(全世界有几台光刻机)

    中国有光刻机吗(全世界有几台光刻机)

  • 固态硬盘怎么看出来(固态硬盘怎么看是不是全新)

    固态硬盘怎么看出来(固态硬盘怎么看是不是全新)

  • ps怎么退出全屏模式(ps怎么退出全屏弄出任务栏)

    ps怎么退出全屏模式(ps怎么退出全屏弄出任务栏)

  • 华为p20在哪插耳机(华为p20在哪插耳机孔)

    华为p20在哪插耳机(华为p20在哪插耳机孔)

  • 微博我的访问记录怎么删除不了(微博我的访问记录仅自己可见什么意思)

    微博我的访问记录怎么删除不了(微博我的访问记录仅自己可见什么意思)

  • 剪映怎么截取音乐(剪映怎么截取音乐中间片段)

    剪映怎么截取音乐(剪映怎么截取音乐中间片段)

  • 抖音退款申请在哪里(抖音退款申请在哪里找)

    抖音退款申请在哪里(抖音退款申请在哪里找)

  • 手机通知栏hd怎么关闭(手机通知栏hd收费吗)

    手机通知栏hd怎么关闭(手机通知栏hd收费吗)

  • 韵达快递怎么用手机号查询(韵达快递怎么用手机号码查询)

    韵达快递怎么用手机号查询(韵达快递怎么用手机号码查询)

  • 苹果手机怎么看像素(苹果手机怎么看自己的手机号码)

    苹果手机怎么看像素(苹果手机怎么看自己的手机号码)

  • 怎么把抖音喜欢的清零(怎么把抖音喜欢的作品删除掉)

    怎么把抖音喜欢的清零(怎么把抖音喜欢的作品删除掉)

  • 小红书如何联系卖家(小红书如何联系薯队长)

    小红书如何联系卖家(小红书如何联系薯队长)

  • 联想笔记本E49系列进不了BIOS(联想笔记本e49系列哪款好)

    联想笔记本E49系列进不了BIOS(联想笔记本e49系列哪款好)

  • 欠条和收条,哪个效力大?(欠条和收条,哪个更真实)

    欠条和收条,哪个效力大?(欠条和收条,哪个更真实)

  • 土地增值税清算管理规程
  • 缴纳城镇土地使用税
  • 月末处理工作主要包括
  • 增值税可以退税嘛
  • 应收款和应付款对抵
  • 资产处置损益是收入还是费用
  • 接受劳务是进项还是销项
  • 2019最新运输发票样本
  • 未分配利润太多说明什么
  • 收到销项负数发票怎么处理
  • 工会经费2020年免征
  • 公司没有发票的做内账,那么支付款从哪里来
  • 第三方软件测评费的取费标准
  • 新成立公司开票能开多少个点的发票
  • 特许权使用费税前扣除标准
  • 一般纳税人购进税控收款机抵扣
  • thinkphp操作数据库
  • 计算企业应纳税所得额时,可以扣除的税种
  • 小程序常见问题
  • 发票抵税是怎么申报的
  • wordpress使用
  • php str_split
  • yolov5源码讲解
  • Vue 3 介绍
  • 前端面试经常被问的问题
  • 中秋快乐的祝福语怎么说
  • php jsondecode
  • python 字典的字典
  • 应纳所得税额等于利润总额减去差异
  • 机动车价外费用发票如何开具
  • 计提怎么理解
  • 个人发票抬头怎么弄
  • python项目开发案例集锦pdf百度网盘
  • 已付款未开票怎么做账
  • 资产减值损失是什么意思
  • centos7.9 防火墙
  • 收集整理数据
  • 什么是指社会保障完全靠当前的收入
  • 填制和审核会计凭证,可以监督各项经济业务的合法
  • sql server 2016使用
  • 增值税零税率与免税谁更优惠
  • 劳务费怎么要的回来
  • 调研费用包括哪些项目
  • 房地产企业成本包括哪些
  • 资本公积 转增
  • 不动产拆除的收入处理
  • 港币转人民币怎么算
  • 土地成本如何分摊
  • 网吧的收入怎么做账
  • 免息分期付款怎么办理
  • 固定资产发票未到可以确认固定资产吗
  • 企业注销时应收帐款如何处理
  • 信托保障基金会返还吗
  • 应收帐款收不回来怎么做会计分录
  • 为什么购入股票是综股
  • 贷款应提准备的资料包括
  • 破产重组还需要还钱吗
  • 小企业会计准则2023电子版
  • 财务成本控制总结
  • 账户记录试算不平衡说明记账肯定有差错对吗
  • 分享sql日期时间格式
  • sql指定字段添加数据
  • 苹果mac怎么下载英雄联盟
  • 使用u盘安装windows10电脑识别不出来
  • Ubuntu上安装anaconda
  • window 启动
  • schupd.exe - schupd是什么进程 有什么用
  • win8.1中文版下载
  • Win7系统如何清除流氓屏保
  • 小郭聊一聊
  • 如何实现js对象和json数据互转
  • css新闻页面制作
  • 创建一个新用户user1,设置其主目录为/home/user1:
  • js取反运算符
  • listview
  • android documents
  • 浙江省工会经费减免最新政策2019年
  • 珠宝加工费骗局
  • 税务局网上缴税
  • 如何查询自己是否被起诉了
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设