位置: IT常识 - 正文

图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法)

编辑:rootadmin
图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读

推荐整理分享图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像识别芯片,图像识别软件,图像识别芯片,图像识别芯片,图像识别算法,图像识别算法,图像识别芯片,图像识别芯片,内容如对您有帮助,希望把文章链接给更多的朋友!

今天,给大家介绍一个经典的图像分类数据集——CIFAR-10,其广泛用于机器学习领域的计算机视觉算法基准测试。虽然经过10多年的发展,这个数据集的识别问题已经被“解决”,很多模型都能轻松达到80%的分类准确率,深度学习卷积神经网络在测试数据集上的分类正确率也能在90%以上,拥有较好的性能。但它仍然是许多初学者不错的选择,一起来看看。

目录

一、数据集简介

二、数据集详细信息

三、数据集任务定义及介绍

四、数据集文件结构解读

五、数据集下载

一、数据集简介

发布方:University of Toronto Computer Science

发布时间:2009

背景:

CIFAR-10本质是从一个叫做【the 80 million tiny images dataset】(“8000万张小图”数据集)中精炼剥离出来的一部分,是该数据集的子集。因为该数据涉及到了一些争议内容,目前已经被下架。

简介:

CIFAR10是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。CIFAR-10数据集包含60000幅32x32的彩色图像,分为10个类,每类6000幅图像。

二、数据集详细信息

1. 标注数据量

训练集:50000张图像

测试集:10000张图像

2. 标注类别

数据集共有10个类别。具体分类见图1。

3. 可视化

(图1)

三、数据集任务定义及介绍1. 图像分类

● 任务定义

图像分类是计算机视觉领域中,基于语义信息对不同图像进行分类的一种模式识别方法。

● 评价指标

Accuracy:

n_correct / n_total,标签预测正确的样本占所有样本的比例。

某个类别的Precision:

TP/(TP+FP),被预测为该类别的样本中,有多少样本是预测正确的。

图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法)

某个类别的Recall:

TP/(TP+FN),在该类别的样本中,有多少样本是预测正确的。

注:在上面的评价指标中,TP代表True Positive,FP代表False Positive,FN代表False Negative,n_correct代表所有预测正确的样本数量,n_total代表所有的样本数量。

四、数据集文件结构解读

1. 数据集目录结构

dataset_root/├── batches.meta #记录分类信息的元文件├── data_batch_1 #训练集1├── data_batch_2 #训练集2├── data_batch_3 #训练集3├── data_batch_4 #训练集4├── data_batch_5 #训练集5├── readme.html #README文件└── test_batch #测试集文件

2. 标注文件格式

由于数据集中的每一副图片均为32X32的RGB图片,数据集并没有直接储存图片文件,而是将每一个数据集的所有图片通过numpy二维数组储存下来,并且记录对应的文件名。 

利用官网提供的unload代码,可以将data_batch_1等文件中的数据进行解析。

python3:

def unpickle(file):import picklewithopen(file, 'rb') as fo:dict = pickle.load(fo, encoding='bytes')return dict

python2:

def unpickle(file):import cPicklewithopen(file, 'rb') as fo:dict = cPickle.load(fo)return dict

经过解析后,得到的字典分为四部分内容,一是训练集的编号,二是每一张图片的分类编号、三是所有图片组成的numpy数组,四是文件名的列表。

在label列表中,每一个值对应的分类类别:

在data列表中,存放了这个batch所有图片的信息。Array是一个10000X3072的二维numpy数组,每一行储存一张图片的RGB信息。在每一行的一维数组中前1024个数据记录该图片的R通道信息,中间1024个数据记录该图片的G通道信息,最后1024个数据记录B通道信息。

在每一个通道信息的1024个数据中,以32个为一组,每一组记录图片每一行的32个像素点取值。第一组32个值记录图片第一行的像素取值,第二组32个值记录图片第二行的像素取值,以此类推。

3. 元信息格式

batches.meta文件记录了分类变量取值和对应类别的对照信息,经过提供的代码解析后,得到的字典结果为:

五、数据集下载

OpenDataLab平台为大家提供了CIFAR-10数据集完整的数据集信息、直观的数据分布统计、流畅的下载速度、便捷的可视化脚本,欢迎体验。点击原文链接可查看。

https://opendatalab.org.cn/CIFAR-10

参考资料

[1] 官网:http://www.cs.toronto.edu/~kriz/cifar.html

[2] 数据集下载:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

作者丨杜坤明

有智者,万事兴

- End -

以上就是本次分享,更多精彩的数据集干货,不容错过。还有哪些想看的内容,快来告诉小助手吧。更多数据集上架动态、更全面的数据集内容解读、最牛大佬在线答疑、最活跃的同行圈子……欢迎添加微信opendatalab_yunying加入OpenDataLab官方交流群。

本文链接地址:https://www.jiuchutong.com/zhishi/298660.html 转载请保留说明!

上一篇:Javaweb实验:静态网页制作(javaweb实例教程)

下一篇:【Vue 路由(vue—router)二】路由传参(params的类型 、Query参数的类型、路由name)(vue里面的路由)

  • 小米civi是屏幕指纹吗(小米civi屏幕参数)

    小米civi是屏幕指纹吗(小米civi屏幕参数)

  • vivox70pro+怎么设置省电模式(vivox70pro+怎么设置门禁卡)

    vivox70pro+怎么设置省电模式(vivox70pro+怎么设置门禁卡)

  • ip地址是什么意思(怎样改ip地址)

    ip地址是什么意思(怎样改ip地址)

  • 华为nova4用什么系统(华为nova4用什么芯片)

    华为nova4用什么系统(华为nova4用什么芯片)

  • 骁龙730g和855区别(骁龙730g跟骁龙855有啥区别)

    骁龙730g和855区别(骁龙730g跟骁龙855有啥区别)

  • 电脑息屏之后很久才能唤醒(电脑息屏之后很卡怎么办)

    电脑息屏之后很久才能唤醒(电脑息屏之后很卡怎么办)

  • 三星什么时候可以更新安卓10(三星什么时候可以换卡)

    三星什么时候可以更新安卓10(三星什么时候可以换卡)

  • 优酷怎么赠送好友电影(优酷怎么赠送好友会员体验卡)

    优酷怎么赠送好友电影(优酷怎么赠送好友会员体验卡)

  • 电话拉黑后能看到对方打电话记录吗(电话拉黑后能看见记录吗)

    电话拉黑后能看到对方打电话记录吗(电话拉黑后能看见记录吗)

  • 打电话显示未在手机上注册(打电话显示未在手机上注册是什么意思)

    打电话显示未在手机上注册(打电话显示未在手机上注册是什么意思)

  • 手机上显示nfc是什么功能(手机上显示nfc是什么意思OPPO)

    手机上显示nfc是什么功能(手机上显示nfc是什么意思OPPO)

  • 开了权限qq没有声音(开了权限qq没有了怎么办)

    开了权限qq没有声音(开了权限qq没有了怎么办)

  • 苹果11听筒防水吗(苹果11听筒防水能修复吗)

    苹果11听筒防水吗(苹果11听筒防水能修复吗)

  • 路由器wifi5与wifi6区别(家用路由器wifi5和wifi6)

    路由器wifi5与wifi6区别(家用路由器wifi5和wifi6)

  • smn9600是什么型号

    smn9600是什么型号

  • 苹果7home键坏了能修吗(苹果7home键坏了可以换吗)

    苹果7home键坏了能修吗(苹果7home键坏了可以换吗)

  • 怎样清除c盘中不需要的文件(怎样清除c盘中的垃圾文件)

    怎样清除c盘中不需要的文件(怎样清除c盘中的垃圾文件)

  • 手机信号格旁边的hd是什么意思(手机信号格旁边有个爱心符号)

    手机信号格旁边的hd是什么意思(手机信号格旁边有个爱心符号)

  • 华为手环4具体上市时间(华为手环具体功能)

    华为手环4具体上市时间(华为手环具体功能)

  • 抖音怎么找回之前看过(抖音怎么找回之前的聊天记录)

    抖音怎么找回之前看过(抖音怎么找回之前的聊天记录)

  • 备忘录怎么设置时间提醒(备忘录怎么设置闹钟)

    备忘录怎么设置时间提醒(备忘录怎么设置闹钟)

  • 苹果备忘录怎么录音(苹果备忘录怎么看字数)

    苹果备忘录怎么录音(苹果备忘录怎么看字数)

  • 拼多多个人会员名是啥(拼多多平台会员)

    拼多多个人会员名是啥(拼多多平台会员)

  • 苹果x有快充功能吗(苹果x有快充功能吗?)

    苹果x有快充功能吗(苹果x有快充功能吗?)

  • 微信表情怎么添加文字(微信表情怎么添加文字上去)

    微信表情怎么添加文字(微信表情怎么添加文字上去)

  • ipad mini5屏幕刷新率(ipad mini5刷机模式)

    ipad mini5屏幕刷新率(ipad mini5刷机模式)

  • 小米8屏幕时间怎么调(小米屏幕时间管理为什么不显示)

    小米8屏幕时间怎么调(小米屏幕时间管理为什么不显示)

  • 快手怎么ktv模式直播(快手ktv怎么唱歌)

    快手怎么ktv模式直播(快手ktv怎么唱歌)

  • 苹果处理器怎么看(苹果处理器怎么那么强)

    苹果处理器怎么看(苹果处理器怎么那么强)

  • 苹果x手机面容识别不了了怎么办(苹果X手机面容id不可用是怎么回事)

    苹果x手机面容识别不了了怎么办(苹果X手机面容id不可用是怎么回事)

  • 快手的快贝有什么用(快手里的快贝是如何得到的)

    快手的快贝有什么用(快手里的快贝是如何得到的)

  • pr特效控制台在哪里(pr2019特效控制台)

    pr特效控制台在哪里(pr2019特效控制台)

  • Win10升级后必须要做的基本设置一览(win10要更新系统)

    Win10升级后必须要做的基本设置一览(win10要更新系统)

  • dedecms织梦短信接口插件代码(微米短信平台)(织梦cms不更新了吗)

    dedecms织梦短信接口插件代码(微米短信平台)(织梦cms不更新了吗)

  • 社保与个税有关系么
  • 什么是本期应纳税所得额
  • 分公司撤销跨区域转固定资产到总公司
  • 社保年检申报错误怎么办
  • 坏账准备应计入
  • 保理利息计算公式
  • 工会经费需要计税吗
  • 设计、制造
  • 贸易公司委托加工买进和卖出东西不一样
  • 小规模纳税人可以开数电专票吗
  • 已认证未入账的分录
  • 支付资金占用费怎么记账进项税
  • 车的违章处理
  • 房地产企业老项目增值税
  • 收回的材料赔偿款怎么处理?
  • 企业安装监控费用怎么做账
  • 非独立核算的公司怎么报税
  • 建筑业增值税税率11变为10
  • 自然灾害造成的存货净损失计入什么科目
  • 增值税纳税义务人
  • 收到个税手续费返还现金流量表
  • 支付青苗补偿费怎么做账
  • 高新技术企业的研发费用比例
  • 免税农产品进项抵扣计算
  • 增值税留抵税额在借方还是贷方
  • 工资属于劳务收入吗
  • 固定资产转入清理记账凭证
  • macbook sierra
  • 开机默认开启数字键
  • 交割单会出错吗
  • 个人劳动供给曲线图
  • 去年的季度所得税额怎么做账
  • 出口转内销发票抵扣
  • 选择简易征收
  • 租金收入缴纳个税
  • linux mint 20.1安装
  • php文件怎么打开运行
  • PHP:finfo_file()的用法_fileinfo函数
  • thinkphp获取get传值
  • 浏览器你
  • 网页视频不显示画面
  • 学会这两种方式英语
  • python3.4 numpy
  • 销售折扣购物卡怎么做账
  • 开办费的主要账户是什么
  • 接受捐赠收入要缴纳企业所得税吗
  • 财务费用在贷方,怎么结转到本年利润?
  • 单位结算卡和对公账户号码不一样
  • 车船税发票可以抵扣吗
  • 预缴增值税怎么计提
  • 销售费用专票能抵扣吗
  • 公司的房租发票怎么记账
  • 企业收到加盟费怎么开发票
  • 装修属于营业费用还是管理费用
  • 09年前的固定资产
  • 增值税年末必须要交吗
  • sql server本地服务器地址如何查看
  • xp系统 控制面板
  • freebsd11.3安装教程
  • xp系统删除用户账户怎么没有删除键
  • xp系统还原系统
  • WIN7系统如何恢复出厂系统
  • win8正版系统自带
  • 电脑安装win8
  • js时间倒计时定时器怎么弄
  • es6数组函数
  • python根据ip获取主机名
  • nodejs怎么使用
  • jquery中如何获取元素?
  • div.remove
  • unity开发平台
  • 手机关卡类游戏
  • 安卓多线程有几种实现方法
  • 税务总局电子申报软件39
  • 新疆12366电子税务局官网手机版
  • 开电子发票流程步骤
  • 内蒙古国家税务总局官网
  • 沈阳特慢病待遇
  • 海南购房税费最新2019规定
  • 政府对国税局的支持
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设