位置: IT常识 - 正文

(一)ADE20K数据集(adas数据集)

编辑:rootadmin
(一)ADE20K数据集

推荐整理分享(一)ADE20K数据集(adas数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:adressa数据集,adressa数据集,adfa-ld数据集,asd数据集,dbp15k数据集,adressa数据集,adressa数据集,adfa-ld数据集,内容如对您有帮助,希望把文章链接给更多的朋友!

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录1.背景简介2.ADE20K3.使用ADE20K参考资料1.背景简介

ADE20K数据集是2016年MIT开放的场景理解的数据集,可用于实例分割,语义分割和零部件分割。利用图像信息进行场景理解 scene understanding和 scene parsing。

语义分割 Semantic Segmentation即最常见的任务,将图像的不同像素按对象类别 object category进行分类,实例分割Instance Segmentation不仅要识别不同物体所属的类别,还需识别出同类的不同物体。零部件分割 Part Segmentation是在识别出的物体上分割出不同部分所属的零部件类别,这对于理解场景帮助机器人与环境交互十分重要,如在某个 scene中分割出来 chair或者 cup,为了坐下或者拿起杯⼦需要找到 objects中对应的 parts,如 chair可以坐的部分, cup的杯柄, 以实现机器⼈与知行特定的任务。

已有分割公开数据集的现状:

类别有限, 且有些数据类别在实际⽣活中并不常⻅如 COCO和 PASCAL数据集;包含的场景过少,如 Cityscapes仅包含城市街区的场景数据;Pascal-Context和 SUN还不错, 但 Pascal-Context主要包含其20个对象类的场景, ⽽SUN在对象级别的标注是不准确的。2.ADE20K

1>ADE20K的官网:https://groups.csail.mit.edu/vision/datasets/ADE20K/index.html

2>ECCV 2016举办的Scene Parsing Challenge 2016http://sceneparsing.csail.mit.edu/index_challenge.html

(一)ADE20K数据集(adas数据集)

3>tool kit github repositoryhttps://github.com/CSAILVision/ADE20K

ADE20K由 27000张图像组成,这些图像来自于SUN(2010年普林斯顿大学公开的数据集)和Places(2014年MIT公开的数据集)数据集,ADE20K中由超过3000个物体类别 category,其中很多图像组成物体的零部件的类别,以及组成零部件的零部件的类别,如 汽车的零部件 门,门上面的零部件 窗户。ADE20K中还标注了实例的 id,可用于实例分割。数据中的图像都进行了匿名化处理,做了人脸和车牌号的模糊,去除了隐私信息。

ADE20K的数据分布

训练集 Training set包含 25574张完整标注图像验证集 Validation set包含 2000张完整标注图像测试集 Test set还没有发布

ADE20K的数据组成

共包含 27574张图像3688个类,类名取自WordNet(WordNet是由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护一个词与词之间存在各种关系的英语字典)707868个对象193238个零部件

数据文件目录结构

.└── ADE20K_2021_17_01 └── images └── ADE └── training └── urban └── street ├── ADE_train_00016869 │ ├── instance_000_ADE_train_00016869.png │ ├── instance_001_ADE_train_00016869.png │ ├── instance_..._ADE_train_00016869.png ├── ADE_train_00016869.jpg ├── ADE_train_00016869.json ├── ADE_train_00016869_parts_1.png ├── ADE_train_00016869_parts_2.png ├── ADE_train_00016869_seg.png ├── ADE_train_00016964 │ ├── instance_000_ADE_train_00016964.png │ ├── instance_001_ADE_train_00016964.png │ ├── instance_..._ADE_train_00016964.png ├── ADE_train_00016964.jpg ├── ADE_train_00016964.json ├── ADE_train_00016964_parts_1.png └── ADE_train_00016964_seg.pngimage_name.jpg原始图像,如ADE_train_00016869.jpg{image_name}_seg.png图像 image_name.jpg对应的类别和实例的标注信息,存储在其每个像素的 RGB通道中,借助 toolkit中的代码utils_ade20k.py可以实现标注信息的解析{image_name}_parts_{i}.png图层 i中包含的零部件,如ADE_train_00016869_parts_1.png{image_name},以文件名命名的文件夹,其中的每个图像分别是一个实例标注信息对应原图的掩码,由 0,1组成。如ADE_train_00016869{image_name}.json包含了图像对应的标注信息,如实例和类别标注信息的多边形,标注的时间,标注实例或对象的属性,如ADE_train_00016869.json

数据集相关的统计信息,譬如包括多少个类别,有多少个对象等,保存在一个序列化文件index_ade20k.pkl中,可以参考ade20k_starter.ipynb读取其中的信息。

print("File loaded, description of the attributes:")print('--------------------------------------------')for attribute_name, desc in index_ade20k['description'].items(): print('* {}: {}'.format(attribute_name, desc))print('--------------------------------------------\n')i = 16868 # 16899, 16964nfiles = len(index_ade20k['filename'])file_name = index_ade20k['filename'][i]num_obj = index_ade20k['objectPresence'][:, i].sum()num_parts = index_ade20k['objectIsPart'][:, i].sum()count_obj = index_ade20k['objectPresence'][:, i].max()obj_id = np.where(index_ade20k['objectPresence'][:, i] == count_obj)[0][0]obj_name = index_ade20k['objectnames'][obj_id]full_file_name = '{}/{}'.format(index_ade20k['folder'][i], index_ade20k['filename'][i])print("The dataset has {} images".format(nfiles))print("The image at index {} is {}".format(i, file_name))print("It is located at {}".format(full_file_name))print("It happens in a {}".format(index_ade20k['scene'][i]))print("It has {} objects, of which {} are parts".format(num_obj, num_parts))print("The most common object is object {} ({}), which appears {} times".format(obj_name, obj_id, count_obj))3.使用ADE20K语义分割

语义分割中使用的训练和验证数据集多是ADEchallenge 2016提供的处理好的数据集,包括150个类,不含背景0,在训练时需将background 0 设置成ignore_index。ADEChallengeData2016.zip的下载地址为

http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

最近的一些工作,如swin transformer和segfomer都在ADEChallengeData2016.zip数据集上进行了验证,这两个算法在商汤的框架mmsegmentation中都有实现,感兴趣的同学可以动手验证一下,需要注意的是使用ade20k数据集时,train_pipeline中的参数需要设置,如下

train_pipeline = [ dict(type='LoadImageFromFile'), dict(type='LoadAnnotations', reduce_zero_label=True)]

挖个坑:在实例分割和零部件分割的应用待补充

参考资料1.https://groups.csail.mit.edu/vision/datasets/ADE20K/2.https://github.com/open-mmlab/mmsegmentation

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

本文链接地址:https://www.jiuchutong.com/zhishi/297846.html 转载请保留说明!

上一篇:TDesign小程序组件库体验(小程序navigator组件)

下一篇:一行代码“黑”掉任意网站(一行简单的代码)

  • 苹果将在其设备上用隐形输入区域替换物理按钮(苹果手机显示在您的另一部iphone上继续)

    苹果将在其设备上用隐形输入区域替换物理按钮(苹果手机显示在您的另一部iphone上继续)

  • 腾讯视频青春v卡和vip有啥区别(腾讯视频青春v卡)

    腾讯视频青春v卡和vip有啥区别(腾讯视频青春v卡)

  • 抖音评论顺序怎么调(抖音评论顺序设置)

    抖音评论顺序怎么调(抖音评论顺序设置)

  • 如何更新显卡驱动(如何更新显卡驱动程序win7)

    如何更新显卡驱动(如何更新显卡驱动程序win7)

  • 快手怎么保存别人的视频(快手怎么保存别人禁止下载的视频)

    快手怎么保存别人的视频(快手怎么保存别人禁止下载的视频)

  • 钉钉会议对方说话听不到声音(钉钉会议对方说话没声音)

    钉钉会议对方说话听不到声音(钉钉会议对方说话没声音)

  • jkm-tl00华为什么型号(jkmtl00华为什么型号)

    jkm-tl00华为什么型号(jkmtl00华为什么型号)

  • 微信能存多少个联系人(微信能存多少个聊天框)

    微信能存多少个联系人(微信能存多少个聊天框)

  • 华为荣耀怎么打开语音助手(华为荣耀怎么打设置酷狗音乐在屏幕)

    华为荣耀怎么打开语音助手(华为荣耀怎么打设置酷狗音乐在屏幕)

  • 作业帮可以分屏吗(作业帮分屏老师能看见吗)

    作业帮可以分屏吗(作业帮分屏老师能看见吗)

  • 摄像头内存卡多大合适(摄像头内存卡怎么安装)

    摄像头内存卡多大合适(摄像头内存卡怎么安装)

  • 自动获得ip地址什么意思(自动获取ip地址冲突怎么解决)

    自动获得ip地址什么意思(自动获取ip地址冲突怎么解决)

  • 数据库管理系统可以分哪三类(数据库管理系统通常提供授权功能来控制不同用户)

    数据库管理系统可以分哪三类(数据库管理系统通常提供授权功能来控制不同用户)

  • ppt文档默认扩展名是什么(ppt2007默认扩展名)

    ppt文档默认扩展名是什么(ppt2007默认扩展名)

  • 华为笔记本pin码是什么(华为笔记本pin码忘记了怎么解锁)

    华为笔记本pin码是什么(华为笔记本pin码忘记了怎么解锁)

  • 华为mate30声音键在哪里(华为mate30声音键会无故自己调大)

    华为mate30声音键在哪里(华为mate30声音键会无故自己调大)

  • 苹果11怎么设置闪光灯(苹果11怎么设置铃声)

    苹果11怎么设置闪光灯(苹果11怎么设置铃声)

  • vivou1开售时间(vivou1手机)

    vivou1开售时间(vivou1手机)

  • 文档页面设置(文档页面设置为a4纸)

    文档页面设置(文档页面设置为a4纸)

  • 【VUE3】ElementUI--el-date-picker下拉控件样式修改(高亮显示设置)(vue3 element-plus)

    【VUE3】ElementUI--el-date-picker下拉控件样式修改(高亮显示设置)(vue3 element-plus)

  • YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

    YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

  • 递延所得税资产和所得税费用的关系
  • 服装加工费税收编码
  • 自来水安装增值税税率
  • 个人代开资金占用费,如何计算代扣代缴个税
  • 广交会展务
  • 折旧费计算主要有几种方法?分别有什么特点?
  • 应付账款不需要付怎样做会计分录
  • 小规模开专票附加税要计提吗
  • 返佣账务处理
  • 一次性计提后的固定资产残值
  • 残值要不要做分录
  • 销售息税前利润是什么
  • 向金融企业借款利息支出可以税前扣除吗
  • 以合并方式成立的新企业,新启用
  • 银行承兑个人可以接受吗
  • 收到银行的贷款
  • 建筑企业收到材料发票没有备注能用吗
  • 月度资金计划明细表模板
  • 库存商品盘盈盘亏表
  • 进口关税发票账务处理如何进行?
  • 房产税怎么计算的
  • 季度报没有报怎么办
  • 增值税先征后退属于政府补助吗
  • 购买库存商品收到发票怎样做分录
  • 怎么向个体工商户贷款
  • 房屋租赁发票需要什么资料
  • 差额增值税计算公式
  • linux |bc
  • 王者荣耀中吕布的克星
  • 存货跌价准备会影响利润吗
  • PHP If Else(elsefi) 语句
  • 销售补差是怎么算的
  • 未实缴出资的股权转让后还要承担法律后果吗
  • node.js环境搭建
  • 【机器学习】KNN算法及K值的选取
  • 代理电信业务属于什么行业
  • 折旧提取后资金如何处理
  • 跨年度的利息收入怎么做账
  • MySQL常用命令关键字
  • 帝国cms吧
  • 二手车的范围
  • 营业外收入是指企业确认与企业生产经营活动没有
  • 金融企业应当按照交易或事项的实质和经济现实
  • 养老保险减免退税政策
  • 发出商品 会计科目
  • 如何进行捐款活动
  • 当月红冲上月开具的增值税
  • 企业每月营业额达多少需要交税
  • 检测公司成本科目
  • 自产产品发给职工做福利的会计处理
  • 承兑汇票贴现利息会计分录
  • 银行业务冲正
  • 个税专项扣除住房租金标准
  • 餐饮服务属于什么职业
  • 短期借款利息是多少
  • 流动比率多少合理
  • mysql修改允许远程连接
  • 让Windows Server 2008系统安全更上一层楼
  • linux系统怎么停止ping
  • macbook qq截图存在哪
  • Win7系统怎么打开文件后缀名
  • win8系统如何恢复出厂设置
  • linux强大的网络功能
  • js require()
  • ansi std
  • python中文分词库
  • opengl使用教程
  • 了不起的女孩
  • node.js deno
  • node.js 核心http模块,起一个服务器,返回一个页面的实例
  • node中的ejs
  • python如何获取
  • 《javascript高级程序设计》
  • JAVASCRIPT THIS详解 面向对象
  • 小规模现代服务的税率是多少啊怎么算
  • 总局公告2011年第34号
  • 可以抵扣的消费税项目
  • 个人所得税完税证明怎么开具
  • 县里的附加税
  • 美国汽车进口关税25%
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设