位置: IT常识 - 正文

MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】(mnist数据集下载码)

发布时间:2024-01-15
MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】 前言

推荐整理分享MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】(mnist数据集下载码),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mnist数据集下载卡住了怎么办,mnist数据集下载导入,mnist数据集下载卡住了怎么办,mnist数据集下载官网,mnist数据集下载码,MNIST数据集下载,mnist数据集下载400张,MNIST数据集下载,内容如对您有帮助,希望把文章链接给更多的朋友!

训练模型的时候经常会使用MNIST数据集来训练模型,那么如何获取到MNIST数据集呢?博主经过实践后,总结了经验,希望能帮助到屏幕前的你使用MNIST数据集。

目录

前言

1 下载MNIST数据集文件

2 解析idx3-ubyte文件

2.1 解析训练集

2.2解析测试集

3.运行py文件


1 下载MNIST数据集文件

由于MNIST数据集是在外网发布,下载比较慢,博主把MNIST放在了百度网盘中

链接:https://pan.baidu.com/s/1V-4FOePbTyBG7qZ7ge_TqQ?pwd=dw2i  提取码:dw2i

下载到本地后,把gz后缀压缩包进行解压缩

其中包含4个文件,详细介绍如下表所示:

 

 图表来源转自:MNIST数据集_保持理智802的博客-CSDN博客_mnist数据集

2 解析idx3-ubyte文件

接下来我们要把idx3-ubyte文件转换成图片形式

MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】(mnist数据集下载码)

分别转换训练集和测试集,博主使用的是pycharm

2.1 解析训练集

train-images.idx3-ubyte和train-labels.idx1-ubyte分别是训练集的图片和标签,其中数据/标签文件位置需要进行修改成你本地训练集保存的位置。

import numpy as npimport structfrom PIL import Imageimport osdata_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\train-images.idx3-ubyte'# It's 47040016B, but we should set to 47040000Bdata_file_size = 47040016data_file_size = str(data_file_size - 16) + 'B'data_buf = open(data_file, 'rb').read()magic, numImages, numRows, numColumns = struct.unpack_from( '>IIII', data_buf, 0)datas = struct.unpack_from( '>' + data_file_size, data_buf, struct.calcsize('>IIII'))datas = np.array(datas).astype(np.uint8).reshape( numImages, 1, numRows, numColumns)label_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\train-labels.idx1-ubyte'# It's 60008B, but we should set to 60000Blabel_file_size = 60008label_file_size = str(label_file_size - 8) + 'B'label_buf = open(label_file, 'rb').read()magic, numLabels = struct.unpack_from('>II', label_buf, 0)labels = struct.unpack_from( '>' + label_file_size, label_buf, struct.calcsize('>II'))labels = np.array(labels).astype(np.int64)datas_root = 'mnist_train'if not os.path.exists(datas_root): os.mkdir(datas_root)for i in range(10): file_name = datas_root + os.sep + str(i) if not os.path.exists(file_name): os.mkdir(file_name)for ii in range(numLabels): img = Image.fromarray(datas[ii, 0, 0:28, 0:28]) label = labels[ii] file_name = datas_root + os.sep + str(label) + os.sep + \ 'mnist_train_' + str(ii) + '.png' img.save(file_name)2.2解析测试集

t10k-labels.idx3-ubyte和t10k-labels.idx1-ubyte分别是测试集的图片和标签,其中数据/标签文件位置需要进行修改成你本地测试集保存的位置。

import numpy as npimport structfrom PIL import Imageimport osdata_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\t10k-images.idx3-ubyte'# It's 7840016B, but we should set to 7840000Bdata_file_size = 7840016data_file_size = str(data_file_size - 16) + 'B'data_buf = open(data_file, 'rb').read()magic, numImages, numRows, numColumns = struct.unpack_from( '>IIII', data_buf, 0)datas = struct.unpack_from( '>' + data_file_size, data_buf, struct.calcsize('>IIII'))datas = np.array(datas).astype(np.uint8).reshape( numImages, 1, numRows, numColumns)label_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\t10k-labels.idx1-ubyte'# It's 10008B, but we should set to 10000Blabel_file_size = 10008label_file_size = str(label_file_size - 8) + 'B'label_buf = open(label_file, 'rb').read()magic, numLabels = struct.unpack_from('>II', label_buf, 0)labels = struct.unpack_from( '>' + label_file_size, label_buf, struct.calcsize('>II'))labels = np.array(labels).astype(np.int64)datas_root = 'mnist_test'if not os.path.exists(datas_root): os.mkdir(datas_root)for i in range(10): file_name = datas_root + os.sep + str(i) if not os.path.exists(file_name): os.mkdir(file_name)for ii in range(numLabels): img = Image.fromarray(datas[ii, 0, 0:28, 0:28]) label = labels[ii] file_name = datas_root + os.sep + str(label) + os.sep + \ 'mnist_test_' + str(ii) + '.png' img.save(file_name)3.运行py文件

运行上述两个py文件后,会在项目的根目录下分别生成两个文件夹:

 

其中,mnist_train有6w个图片,minst_test有1w个图片。

大功告成,接下来就可以开始训练模型啦!!!

本文链接地址:https://www.jiuchutong.com/zhishi/296174.html 转载请保留说明!

上一篇:Auto.js的介绍(auto.js 教程)

下一篇:目标检测算法——YOLOv5/v7/v8改进结合涨点Trick之Wise-IoU(超越CIOU/SIOU)(运动目标检测算法)

  • 苹果手机来电声音小怎么调(苹果手机来电声音没有了怎么弄)

    苹果手机来电声音小怎么调(苹果手机来电声音没有了怎么弄)

  • ctrl+h是什么快捷键 PS

    ctrl+h是什么快捷键 PS

  • 苹果11怎么突然没有振动了(苹果11怎么突然变成黑白的了)

    苹果11怎么突然没有振动了(苹果11怎么突然变成黑白的了)

  • 怎么取消qq铃声分组(怎么取消qq铃声设置)

    怎么取消qq铃声分组(怎么取消qq铃声设置)

  • 如何查询网络被多人使用(如何查询网络被限速)

    如何查询网络被多人使用(如何查询网络被限速)

  • hls协议由哪几部分组成(hl7协议是指)

    hls协议由哪几部分组成(hl7协议是指)

  • 硬盘是什么的一种(硬盘是什么以及作用是什么)

    硬盘是什么的一种(硬盘是什么以及作用是什么)

  • excel名字两个字和三个字对齐(excel名字两个字中间加空格)

    excel名字两个字和三个字对齐(excel名字两个字中间加空格)

  • 存在不兼容无法同时安装怎么解决(存在不兼容驱动360netmon.sys)

    存在不兼容无法同时安装怎么解决(存在不兼容驱动360netmon.sys)

  • word正常页面怎么恢复(word页面怎么能弄成正常的)

    word正常页面怎么恢复(word页面怎么能弄成正常的)

  • 手机老是黑屏怎么办(手机老是黑屏怎么解决小米)

    手机老是黑屏怎么办(手机老是黑屏怎么解决小米)

  • 荣耀20s的文件管理在哪(荣耀20i的文件管理在哪里)

    荣耀20s的文件管理在哪(荣耀20i的文件管理在哪里)

  • vivo手机怎么调画质(vivo手机怎么调时间)

    vivo手机怎么调画质(vivo手机怎么调时间)

  • 华为mate30的插卡的地方(华为mate30的插卡口在哪)

    华为mate30的插卡的地方(华为mate30的插卡口在哪)

  • qq提醒好友周年是双方都有吗(qq提醒好友周年在哪里)

    qq提醒好友周年是双方都有吗(qq提醒好友周年在哪里)

  • 抖音视频设置不了私密(抖音视频设置不给谁看会影响流量吗)

    抖音视频设置不了私密(抖音视频设置不给谁看会影响流量吗)

  • 小爱同学没有wifi能用吗(小爱同学没有wifi怎么用蓝牙)

    小爱同学没有wifi能用吗(小爱同学没有wifi怎么用蓝牙)

  • 背光照片PS如何把人物变亮(背光照片ps如何调整)

    背光照片PS如何把人物变亮(背光照片ps如何调整)

  • 苹果手机为什么下载不了soul(苹果手机为什么连不上wifi)

    苹果手机为什么下载不了soul(苹果手机为什么连不上wifi)

  • 小米8青春版多少克(小米8青春版多少瓦快充)

    小米8青春版多少克(小米8青春版多少瓦快充)

  • 查找我的iphone显示旧位置(查找我的iphone显示几天前的位置怎么回事)

    查找我的iphone显示旧位置(查找我的iphone显示几天前的位置怎么回事)

  • 小米8otg功能怎么开启

    小米8otg功能怎么开启

  • 第一次尝试制作一个钓鱼网站,小白教程,超细!(我初次尝试制作的英文怎么写)

    第一次尝试制作一个钓鱼网站,小白教程,超细!(我初次尝试制作的英文怎么写)

  • 资源税的计税依据为应税产品的开采量
  • 自来水安装增值税税率
  • 所得税费用税前扣除项目
  • 未开票收入以后必须开票吗
  • 个人代开普票需要交个人所得税吗
  • 服装业增值税专用发票税率
  • 视同销售销售额的确定方法
  • 房地产开发商转型
  • 运保佣是什么
  • 预提职工福利怎么记账
  • 购买座机计入哪个科目?
  • 企业生产成本核算的一般程序为
  • 收到差额纳税的发票进项税能抵扣吗
  • 蔬菜批发公司销售蔬菜是否免税
  • 从免税到征税企业应该怎么做
  • 小微企业减免所得税
  • 酒店自开农副产品收购发票需要缴税吗
  • 上海中级会计报名入口
  • 事业单位是否需要章程
  • 电子税务局如何查进项发票
  • 利润表适用执行小企业
  • 买卖交什么税
  • 社保刚办理可以用吗
  • 广告公司结转收入应交税费分录?
  • 电脑无损音乐播放软件哪个最好
  • 安全处罚管理规定
  • 影响资金等值的三个因素
  • win10好几个操作系统
  • 线上网速测试
  • 银行退回手续费的账务处理
  • 存入保证金账户分录怎么写
  • 摊余成本计量的金融资产
  • 如何防范增值税的税收风险
  • 供热企业的税收分类编码
  • php怎么传递参数
  • 两借两贷属于复合会计分录吗
  • 多申报缴纳的企业年金
  • 工资一定要对公发吗
  • laravel实战教程
  • php弹出提示框
  • 小规模纳税人年收入超过500万必须转为一般纳税人吗
  • 不确认收款退款对方还能收到钱么?
  • 企业和银行对账多久对一次
  • 残疾人保证金怎么报税
  • 英文好书推荐
  • 反射怎么解释
  • SqlServer 2005/2008数据库被标记为“可疑”的解决办法
  • 内部审计主要目的
  • 固定资产进项税率
  • 财政拨款公司的资金来源
  • 买两个能退一个吗
  • 车辆罚款单可作为费用报销吗
  • 计提折旧,生成折旧分摊凭证步骤
  • 企业会计准则季度利润表本期数
  • 固定资产需要具备的条件
  • 当期应纳税额是什么意思
  • 房地产开发企业土地增值税怎么计算
  • Centos7.3下mysql5.7.18安装并修改初始密码的方法
  • 域怎么改名
  • win8.1重置电脑
  • vmwarevmx进程是干嘛的
  • win10系统怎么设置开机密码
  • xp 控制面板
  • mac 鼠标调整
  • windows开始按钮点了没用
  • ubuntu查cpu信息
  • shell下同时读取多个文件的方法
  • win7蓝屏0x000000d1
  • 升级win10后悔了
  • win7系统无法删除打印机驱动
  • 微信小程序选择地址
  • 浅析科学发展观的核心立场
  • 噩梦原版
  • c# unity 教程
  • javascript基础
  • 置顶是怎么弄的
  • asoul抽象
  • 山东国地税合并6月挂牌
  • 贵州税务举报
  • 辽宁省国家税务局官网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号