位置: IT常识 - 正文

图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法)

编辑:rootadmin
图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读

推荐整理分享图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像识别芯片,图像识别软件,图像识别芯片,图像识别芯片,图像识别算法,图像识别算法,图像识别芯片,图像识别芯片,内容如对您有帮助,希望把文章链接给更多的朋友!

今天,给大家介绍一个经典的图像分类数据集——CIFAR-10,其广泛用于机器学习领域的计算机视觉算法基准测试。虽然经过10多年的发展,这个数据集的识别问题已经被“解决”,很多模型都能轻松达到80%的分类准确率,深度学习卷积神经网络在测试数据集上的分类正确率也能在90%以上,拥有较好的性能。但它仍然是许多初学者不错的选择,一起来看看。

目录

一、数据集简介

二、数据集详细信息

三、数据集任务定义及介绍

四、数据集文件结构解读

五、数据集下载

一、数据集简介

发布方:University of Toronto Computer Science

发布时间:2009

背景:

CIFAR-10本质是从一个叫做【the 80 million tiny images dataset】(“8000万张小图”数据集)中精炼剥离出来的一部分,是该数据集的子集。因为该数据涉及到了一些争议内容,目前已经被下架。

简介:

CIFAR10是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。CIFAR-10数据集包含60000幅32x32的彩色图像,分为10个类,每类6000幅图像。

二、数据集详细信息

1. 标注数据量

训练集:50000张图像

测试集:10000张图像

2. 标注类别

数据集共有10个类别。具体分类见图1。

3. 可视化

(图1)

三、数据集任务定义及介绍1. 图像分类

● 任务定义

图像分类是计算机视觉领域中,基于语义信息对不同图像进行分类的一种模式识别方法。

● 评价指标

Accuracy:

n_correct / n_total,标签预测正确的样本占所有样本的比例。

某个类别的Precision:

TP/(TP+FP),被预测为该类别的样本中,有多少样本是预测正确的。

图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法)

某个类别的Recall:

TP/(TP+FN),在该类别的样本中,有多少样本是预测正确的。

注:在上面的评价指标中,TP代表True Positive,FP代表False Positive,FN代表False Negative,n_correct代表所有预测正确的样本数量,n_total代表所有的样本数量。

四、数据集文件结构解读

1. 数据集目录结构

dataset_root/├── batches.meta #记录分类信息的元文件├── data_batch_1 #训练集1├── data_batch_2 #训练集2├── data_batch_3 #训练集3├── data_batch_4 #训练集4├── data_batch_5 #训练集5├── readme.html #README文件└── test_batch #测试集文件

2. 标注文件格式

由于数据集中的每一副图片均为32X32的RGB图片,数据集并没有直接储存图片文件,而是将每一个数据集的所有图片通过numpy二维数组储存下来,并且记录对应的文件名。 

利用官网提供的unload代码,可以将data_batch_1等文件中的数据进行解析。

python3:

def unpickle(file):import picklewithopen(file, 'rb') as fo:dict = pickle.load(fo, encoding='bytes')return dict

python2:

def unpickle(file):import cPicklewithopen(file, 'rb') as fo:dict = cPickle.load(fo)return dict

经过解析后,得到的字典分为四部分内容,一是训练集的编号,二是每一张图片的分类编号、三是所有图片组成的numpy数组,四是文件名的列表。

在label列表中,每一个值对应的分类类别:

在data列表中,存放了这个batch所有图片的信息。Array是一个10000X3072的二维numpy数组,每一行储存一张图片的RGB信息。在每一行的一维数组中前1024个数据记录该图片的R通道信息,中间1024个数据记录该图片的G通道信息,最后1024个数据记录B通道信息。

在每一个通道信息的1024个数据中,以32个为一组,每一组记录图片每一行的32个像素点取值。第一组32个值记录图片第一行的像素取值,第二组32个值记录图片第二行的像素取值,以此类推。

3. 元信息格式

batches.meta文件记录了分类变量取值和对应类别的对照信息,经过提供的代码解析后,得到的字典结果为:

五、数据集下载

OpenDataLab平台为大家提供了CIFAR-10数据集完整的数据集信息、直观的数据分布统计、流畅的下载速度、便捷的可视化脚本,欢迎体验。点击原文链接可查看。

https://opendatalab.org.cn/CIFAR-10

参考资料

[1] 官网:http://www.cs.toronto.edu/~kriz/cifar.html

[2] 数据集下载:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

作者丨杜坤明

有智者,万事兴

- End -

以上就是本次分享,更多精彩的数据集干货,不容错过。还有哪些想看的内容,快来告诉小助手吧。更多数据集上架动态、更全面的数据集内容解读、最牛大佬在线答疑、最活跃的同行圈子……欢迎添加微信opendatalab_yunying加入OpenDataLab官方交流群。

本文链接地址:https://www.jiuchutong.com/zhishi/298660.html 转载请保留说明!

上一篇:Javaweb实验:静态网页制作(javaweb实例教程)

下一篇:【Vue 路由(vue—router)二】路由传参(params的类型 、Query参数的类型、路由name)(vue里面的路由)

  • 微信消息不同步到电脑上的原因是什么(为什么手机和电脑微信消息不同步)

    微信消息不同步到电脑上的原因是什么(为什么手机和电脑微信消息不同步)

  • OPPO Ace2手机的重量是多少(oppo ace 多重)

    OPPO Ace2手机的重量是多少(oppo ace 多重)

  • 4g与5g的区别(4g和5g手机有什么区别)

    4g与5g的区别(4g和5g手机有什么区别)

  • 快手作品分享失败是什么原因(快手显示分享失败是什么意思)

    快手作品分享失败是什么原因(快手显示分享失败是什么意思)

  • usbc接口是什么(usbc接口是什么能插到电脑上吗)

    usbc接口是什么(usbc接口是什么能插到电脑上吗)

  • 苹果xsmax有没有来电闪光灯(苹果xsmax有没有广角)

    苹果xsmax有没有来电闪光灯(苹果xsmax有没有广角)

  • ddr3和ddr4性能差别(ddr3和ddr4性能差别多大)

    ddr3和ddr4性能差别(ddr3和ddr4性能差别多大)

  • 微信删除群聊天记录就是退群了吗(微信删除群聊天记录能存占用会减少吗)

    微信删除群聊天记录就是退群了吗(微信删除群聊天记录能存占用会减少吗)

  • 支付宝怎么设置不让别人看真实姓名(支付宝怎么设置拒绝别人转账给我)

    支付宝怎么设置不让别人看真实姓名(支付宝怎么设置拒绝别人转账给我)

  • 苹果8plus支持电信卡吗(苹果7为什么充不了电)

    苹果8plus支持电信卡吗(苹果7为什么充不了电)

  • 秒懂百科的视频怎么下载(秒懂百科的视频怎么做)

    秒懂百科的视频怎么下载(秒懂百科的视频怎么做)

  • 在哪看淘宝几颗心(怎样看淘宝几颗心)

    在哪看淘宝几颗心(怎样看淘宝几颗心)

  • 乐视手机怎么录制(乐视手机怎么录视频)

    乐视手机怎么录制(乐视手机怎么录视频)

  • iphonex相机ar怎么开(苹果ar照相)

    iphonex相机ar怎么开(苹果ar照相)

  • 只读光盘的简称是什么(只读光盘的简称是mo吗)

    只读光盘的简称是什么(只读光盘的简称是mo吗)

  • ipad下载的东西保存在哪里(ipad上下载的软件不能用怎么办)

    ipad下载的东西保存在哪里(ipad上下载的软件不能用怎么办)

  • 苹果xsmax美版支持双卡双待吗(苹果xsmax美版支持nfc吗)

    苹果xsmax美版支持双卡双待吗(苹果xsmax美版支持nfc吗)

  • 小米8se是双卡双待吗(小米8se双4g)

    小米8se是双卡双待吗(小米8se双4g)

  • 微信警告对方疑似被盗号怎么解除(微信警告对方疑似被拉黑)

    微信警告对方疑似被盗号怎么解除(微信警告对方疑似被拉黑)

  • 华为tlttl00报价(华为tl00最新报价)

    华为tlttl00报价(华为tl00最新报价)

  • 锤子手机开机键在哪(锤子手机开机键失灵修复小技巧)

    锤子手机开机键在哪(锤子手机开机键失灵修复小技巧)

  • 华为荣耀20i怎么返回上一页(华为荣耀20i怎么刷机)

    华为荣耀20i怎么返回上一页(华为荣耀20i怎么刷机)

  • 微信通讯录怎么分组(微信通讯录怎么分组管理)

    微信通讯录怎么分组(微信通讯录怎么分组管理)

  • 黑苹果是什么(黑苹果是什么游戏)

    黑苹果是什么(黑苹果是什么游戏)

  • 欠条和收条,哪个效力大?(欠条和收条,哪个更真实)

    欠条和收条,哪个效力大?(欠条和收条,哪个更真实)

  • 购买办公用品合同模板免费
  • 金税四期怎么监控银行流水
  • 现金流量表财务净现值怎么算
  • 对公账户是不是实时到账
  • 冲红发票怎么写备注
  • 向个人账户汇款选项
  • 自行研发无形资产暂时性差异
  • 退回多打货款分录
  • 建筑行业简易计税账务处理
  • 增值税专票逾期抵扣怎么操作
  • 预付款保函履约保函
  • 进项税转出申报表能填负数吗
  • 承兑多付了退现金网银备注什么
  • 路桥年费税额抵扣账务处理怎么做?
  • 本月采购下月付款怎么记账
  • 开出转账支票的摘要怎么写
  • 公司为什么要员工提供房产证
  • 代扣代缴的增值税可以作为进项税抵扣吗
  • 小规模纳税人开专票税率是1%还是3%
  • 没收入就没附加税么?
  • 3万免税是指什么
  • 企业职工补助
  • 主营业务收入和产值
  • 车间改造用的材料有哪些
  • 固定资产折旧年限的最新规定2023
  • 个人所得税由公司承担的账务处理
  • 研发费用领用材料
  • 用友加密狗可以拔下来么
  • 城市维护建设税属于什么税种
  • 零售行业折扣如何做账?
  • 先计提社保还是先计提工资
  • 去年多计提的个税如何处理
  • 电子承兑汇票怎么用
  • 年底会计结账
  • element ui el-table
  • 宣泄不能消除不健康的情绪
  • 找潜水员
  • 老生常谈的常是什么意思
  • mlp是啥啊
  • 织梦cms怎么样
  • 哪一款macbook
  • 增值税进项税额计算公式
  • 债券发行费用包括
  • 建筑施工企业增值税老项目过度期成本票
  • 购进固定资产的进项税计入成本吗
  • 发票无法收回会计分录
  • 应付职工薪酬的
  • 处置子公司如何纳税
  • win2008iis安装
  • 合伙制律师事务所和个人律师事务所
  • 非营利组织的一般战略是
  • 小微企业享受免税吗
  • 房地产开发公司注册资金要求
  • 质量不合格怎么说
  • 金税盘年服务费账务处理
  • 进项发票认证多了留抵多久
  • 银行利息收入的会计分录怎么写
  • 认证后的进项税额留抵退税
  • mysql(master/slave)主从复制原理及配置图文详解
  • centos rpc
  • sqlserver数据库恢复挂起状态
  • 全国县市区最多的省
  • ie8-ie11
  • windows允许多用户登录
  • win8关机一直转圈
  • windows8快速启动设置
  • starting windows
  • win10开机黑屏进入不了系统界面
  • win8系统优化
  • 你需要windows7sp1才能安装ie11
  • js闭包的用处
  • django命令行
  • 湖南省电子税务局登录
  • 江苏国家税务局电子税务局
  • 银行开业送什么花
  • 代收工会经费标准规定
  • 网上报个人所得税
  • 成都那些地方属于正东方向
  • 河北税务登录密码是多少
  • 广东省外经贸厅官网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设