位置: IT常识 - 正文

图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法)

编辑:rootadmin
图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读

推荐整理分享图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像识别芯片,图像识别软件,图像识别芯片,图像识别芯片,图像识别算法,图像识别算法,图像识别芯片,图像识别芯片,内容如对您有帮助,希望把文章链接给更多的朋友!

今天,给大家介绍一个经典的图像分类数据集——CIFAR-10,其广泛用于机器学习领域的计算机视觉算法基准测试。虽然经过10多年的发展,这个数据集的识别问题已经被“解决”,很多模型都能轻松达到80%的分类准确率,深度学习卷积神经网络在测试数据集上的分类正确率也能在90%以上,拥有较好的性能。但它仍然是许多初学者不错的选择,一起来看看。

目录

一、数据集简介

二、数据集详细信息

三、数据集任务定义及介绍

四、数据集文件结构解读

五、数据集下载

一、数据集简介

发布方:University of Toronto Computer Science

发布时间:2009

背景:

CIFAR-10本质是从一个叫做【the 80 million tiny images dataset】(“8000万张小图”数据集)中精炼剥离出来的一部分,是该数据集的子集。因为该数据涉及到了一些争议内容,目前已经被下架。

简介:

CIFAR10是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。CIFAR-10数据集包含60000幅32x32的彩色图像,分为10个类,每类6000幅图像。

二、数据集详细信息

1. 标注数据量

训练集:50000张图像

测试集:10000张图像

2. 标注类别

数据集共有10个类别。具体分类见图1。

3. 可视化

(图1)

三、数据集任务定义及介绍1. 图像分类

● 任务定义

图像分类是计算机视觉领域中,基于语义信息对不同图像进行分类的一种模式识别方法。

● 评价指标

Accuracy:

n_correct / n_total,标签预测正确的样本占所有样本的比例。

某个类别的Precision:

TP/(TP+FP),被预测为该类别的样本中,有多少样本是预测正确的。

图像识别 so easy 丨经典图像分类数据集数据集CIFAR-10解读(图像识别算法)

某个类别的Recall:

TP/(TP+FN),在该类别的样本中,有多少样本是预测正确的。

注:在上面的评价指标中,TP代表True Positive,FP代表False Positive,FN代表False Negative,n_correct代表所有预测正确的样本数量,n_total代表所有的样本数量。

四、数据集文件结构解读

1. 数据集目录结构

dataset_root/├── batches.meta #记录分类信息的元文件├── data_batch_1 #训练集1├── data_batch_2 #训练集2├── data_batch_3 #训练集3├── data_batch_4 #训练集4├── data_batch_5 #训练集5├── readme.html #README文件└── test_batch #测试集文件

2. 标注文件格式

由于数据集中的每一副图片均为32X32的RGB图片,数据集并没有直接储存图片文件,而是将每一个数据集的所有图片通过numpy二维数组储存下来,并且记录对应的文件名。 

利用官网提供的unload代码,可以将data_batch_1等文件中的数据进行解析。

python3:

def unpickle(file):import picklewithopen(file, 'rb') as fo:dict = pickle.load(fo, encoding='bytes')return dict

python2:

def unpickle(file):import cPicklewithopen(file, 'rb') as fo:dict = cPickle.load(fo)return dict

经过解析后,得到的字典分为四部分内容,一是训练集的编号,二是每一张图片的分类编号、三是所有图片组成的numpy数组,四是文件名的列表。

在label列表中,每一个值对应的分类类别:

在data列表中,存放了这个batch所有图片的信息。Array是一个10000X3072的二维numpy数组,每一行储存一张图片的RGB信息。在每一行的一维数组中前1024个数据记录该图片的R通道信息,中间1024个数据记录该图片的G通道信息,最后1024个数据记录B通道信息。

在每一个通道信息的1024个数据中,以32个为一组,每一组记录图片每一行的32个像素点取值。第一组32个值记录图片第一行的像素取值,第二组32个值记录图片第二行的像素取值,以此类推。

3. 元信息格式

batches.meta文件记录了分类变量取值和对应类别的对照信息,经过提供的代码解析后,得到的字典结果为:

五、数据集下载

OpenDataLab平台为大家提供了CIFAR-10数据集完整的数据集信息、直观的数据分布统计、流畅的下载速度、便捷的可视化脚本,欢迎体验。点击原文链接可查看。

https://opendatalab.org.cn/CIFAR-10

参考资料

[1] 官网:http://www.cs.toronto.edu/~kriz/cifar.html

[2] 数据集下载:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

作者丨杜坤明

有智者,万事兴

- End -

以上就是本次分享,更多精彩的数据集干货,不容错过。还有哪些想看的内容,快来告诉小助手吧。更多数据集上架动态、更全面的数据集内容解读、最牛大佬在线答疑、最活跃的同行圈子……欢迎添加微信opendatalab_yunying加入OpenDataLab官方交流群。

本文链接地址:https://www.jiuchutong.com/zhishi/298660.html 转载请保留说明!

上一篇:Javaweb实验:静态网页制作(javaweb实例教程)

下一篇:【Vue 路由(vue—router)二】路由传参(params的类型 、Query参数的类型、路由name)(vue里面的路由)

  • 华为手表怎么自定义表盘(华为手表怎么自动更新天气)

    华为手表怎么自定义表盘(华为手表怎么自动更新天气)

  • 快手本地作品集不见了(快手本地作品集在哪里)

    快手本地作品集不见了(快手本地作品集在哪里)

  • 相机s是什么(相机s是什么参数)

    相机s是什么(相机s是什么参数)

  • 华为耳机用什么app(华为耳机用什么充电头)

    华为耳机用什么app(华为耳机用什么充电头)

  • 苹果手机视频声音突然变小(苹果手机视频声音断断续续怎么回事)

    苹果手机视频声音突然变小(苹果手机视频声音断断续续怎么回事)

  • 微信密码泄露后会有什么后果(微信密码泄露后会有什么后果自己微信支付用不了)

    微信密码泄露后会有什么后果(微信密码泄露后会有什么后果自己微信支付用不了)

  • 无线网络是不是wifi(无线网络是不是与电视有关)

    无线网络是不是wifi(无线网络是不是与电视有关)

  • 苹果x来电闪光灯怎么不亮(苹果X来电闪光灯)

    苹果x来电闪光灯怎么不亮(苹果X来电闪光灯)

  • 删除的照片怎么找回(删除的照片怎么找回最近删除也删了)

    删除的照片怎么找回(删除的照片怎么找回最近删除也删了)

  • 抖音加入工会的作用(抖音加入工会的账号注销后工会还在吗)

    抖音加入工会的作用(抖音加入工会的账号注销后工会还在吗)

  • 耳机皮破了怎么办(耳机皮破了怎么修)

    耳机皮破了怎么办(耳机皮破了怎么修)

  • 表格填充颜色取消不了(表格填充颜色取消不了,格式刷可以)

    表格填充颜色取消不了(表格填充颜色取消不了,格式刷可以)

  • 华为手机换小米手机数据怎么导入(华为手机换小米手机微信数据怎么导入)

    华为手机换小米手机数据怎么导入(华为手机换小米手机微信数据怎么导入)

  • vivox21plus是什么处理器(vivox21plus参数配置)

    vivox21plus是什么处理器(vivox21plus参数配置)

  • 完全放电什么意思(完全放电什么意思呀)

    完全放电什么意思(完全放电什么意思呀)

  • word里怎么删除整页(word里怎么删除表格)

    word里怎么删除整页(word里怎么删除表格)

  • 华为rioal00是麦芒4吗(rioal00华为麦芒)

    华为rioal00是麦芒4吗(rioal00华为麦芒)

  • word图片怎么弄成嵌入式(word图片怎么弄在一页)

    word图片怎么弄成嵌入式(word图片怎么弄在一页)

  • 苹果a2104是什么型号(苹果型号a2104是国行吗)

    苹果a2104是什么型号(苹果型号a2104是国行吗)

  • 什么叫苹果合约机(什么叫苹果合约账户)

    什么叫苹果合约机(什么叫苹果合约账户)

  • 华为mate30pro5g参数(华为Mate30pro5g参数配置详情价格)

    华为mate30pro5g参数(华为Mate30pro5g参数配置详情价格)

  • iphone 测距仪准确吗(iphone的测距仪不准)

    iphone 测距仪准确吗(iphone的测距仪不准)

  • 苹果x面部识别难修吗(苹果x面部识别坏了修多少钱)

    苹果x面部识别难修吗(苹果x面部识别坏了修多少钱)

  • 华为荣耀手环4如何刷公交卡(华为荣耀手环4和5有什么区别)

    华为荣耀手环4如何刷公交卡(华为荣耀手环4和5有什么区别)

  • 快影如何去水印(快影如何去水印图片)

    快影如何去水印(快影如何去水印图片)

  • 如何查看或者修改本机电脑的IP地址?(查看修改)

    如何查看或者修改本机电脑的IP地址?(查看修改)

  • 操作系统的安全性(操作系统的安全目标主要包括哪些?)

    操作系统的安全性(操作系统的安全目标主要包括哪些?)

  • 企业出租房产增值税率
  • 电信没有基站为什么信号也很好
  • 原材料加工成产品的会计分录
  • 发票的规格和型号有哪些
  • 国有企业驻外人员待遇
  • 预售款计入收入吗
  • 净利润为负数还要交所得税吗
  • 外购材料费用可能计入
  • 公司长期应付账款怎么算
  • 公司给员工发的工资要交税吗
  • 财产租赁合同印花税计税依据及税率
  • 企业开普票和专票的税率一样吗
  • 离婚房屋权属变动怎么办
  • 小规模升一般纳税人开票超过500万
  • 土地税返还的会计分录
  • 全年实现利润总额为6035
  • 海关专用缴款书怎么认证?
  • 期初数据科目期初余额怎么录入?
  • 车辆购置税完税证明电子版二维码怎么扫
  • 行程单的金额怎么算
  • u盘启动器安装系统
  • linux系统中的文件访问权限包括几种
  • player.exe是什么意思
  • php生成二维码源码
  • 期间损益包括
  • 固定资产多少可以费用化
  • 购货方退货并已签收
  • vue设置图片
  • jquery 滚动条
  • yii框架安装
  • 富文本编辑器和markdown编辑器的区别
  • 创造未来这首歌是谁
  • 外币报表折算差额会计分录
  • 个人取得的劳务报酬所得,如何缴纳个税
  • 企业补助怎么做会计分录
  • vue如何实现路由跳转缓存
  • dedecms插件
  • 年末关账注意事项
  • 财务会计制度及核算软件备案有效期
  • 固定资产与固定资产净值的区别
  • 固定资产对外投资
  • 会计期末业务有哪些?
  • sql2005安装步骤
  • 冲销上年多计提费用
  • 工程施工的保险费的账务处理
  • 自产产品用于不动产
  • 会计已入账是什么意思
  • 填制费用报销单怎么填写
  • 食品发票可以报销吗怎么报销
  • 公司与公司之间的函怎么写
  • 哪种飞机票可以抵扣进项税
  • 出差包干费包括什么
  • 接受非货币性资产捐赠入账价值
  • 新办企业必须经过什么核准登记
  • mysql数据库隐藏指定内容
  • ubuntu16lts
  • linux中的rpm
  • 挂载光驱的命令
  • xp系统怎么删除应用程序
  • xpcpu占用100
  • 怎么做win8系统
  • linux使用shell脚本创建文件
  • react父组件触发子组件方法
  • 用jQuery实现可输入多选下拉组合框实例代码
  • 教你在heroku云平台上部署Node.js应用
  • perl use vars pragma使用技巧
  • [置顶]bilinovel
  • angularjs4
  • unity如何成一组
  • 安卓手机管家是什么
  • jQuery版AJAX简易封装代码
  • 简单Python代码
  • js过滤html代码
  • 财税专家刘杨简历
  • 种花需要
  • 山东省地方税务局关于个人所得税
  • 在发票软件里开出发票第二天打印可以么?
  • 党风监督员监督和反应情况怎么写
  • 青岛市地方税务局关于发票
  • 土地增值税发票加计扣除5%年限
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设