位置: IT常识 - 正文

MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】(mnist数据集下载码)

编辑:rootadmin
MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】 前言

推荐整理分享MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】(mnist数据集下载码),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mnist数据集下载卡住了怎么办,mnist数据集下载导入,mnist数据集下载卡住了怎么办,mnist数据集下载官网,mnist数据集下载码,MNIST数据集下载,mnist数据集下载400张,MNIST数据集下载,内容如对您有帮助,希望把文章链接给更多的朋友!

训练模型的时候经常会使用MNIST数据集来训练模型,那么如何获取到MNIST数据集呢?博主经过实践后,总结了经验,希望能帮助到屏幕前的你使用MNIST数据集。

目录

前言

1 下载MNIST数据集文件

2 解析idx3-ubyte文件

2.1 解析训练集

2.2解析测试集

3.运行py文件


1 下载MNIST数据集文件

由于MNIST数据集是在外网发布,下载比较慢,博主把MNIST放在了百度网盘中

链接:https://pan.baidu.com/s/1V-4FOePbTyBG7qZ7ge_TqQ?pwd=dw2i  提取码:dw2i

下载到本地后,把gz后缀压缩包进行解压缩

其中包含4个文件,详细介绍如下表所示:

 

 图表来源转自:MNIST数据集_保持理智802的博客-CSDN博客_mnist数据集

2 解析idx3-ubyte文件

接下来我们要把idx3-ubyte文件转换成图片形式

MNIST数据集下载+idx3-ubyte解析【超详细+上手简单】(mnist数据集下载码)

分别转换训练集和测试集,博主使用的是pycharm

2.1 解析训练集

train-images.idx3-ubyte和train-labels.idx1-ubyte分别是训练集的图片和标签,其中数据/标签文件位置需要进行修改成你本地训练集保存的位置。

import numpy as npimport structfrom PIL import Imageimport osdata_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\train-images.idx3-ubyte'# It's 47040016B, but we should set to 47040000Bdata_file_size = 47040016data_file_size = str(data_file_size - 16) + 'B'data_buf = open(data_file, 'rb').read()magic, numImages, numRows, numColumns = struct.unpack_from( '>IIII', data_buf, 0)datas = struct.unpack_from( '>' + data_file_size, data_buf, struct.calcsize('>IIII'))datas = np.array(datas).astype(np.uint8).reshape( numImages, 1, numRows, numColumns)label_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\train-labels.idx1-ubyte'# It's 60008B, but we should set to 60000Blabel_file_size = 60008label_file_size = str(label_file_size - 8) + 'B'label_buf = open(label_file, 'rb').read()magic, numLabels = struct.unpack_from('>II', label_buf, 0)labels = struct.unpack_from( '>' + label_file_size, label_buf, struct.calcsize('>II'))labels = np.array(labels).astype(np.int64)datas_root = 'mnist_train'if not os.path.exists(datas_root): os.mkdir(datas_root)for i in range(10): file_name = datas_root + os.sep + str(i) if not os.path.exists(file_name): os.mkdir(file_name)for ii in range(numLabels): img = Image.fromarray(datas[ii, 0, 0:28, 0:28]) label = labels[ii] file_name = datas_root + os.sep + str(label) + os.sep + \ 'mnist_train_' + str(ii) + '.png' img.save(file_name)2.2解析测试集

t10k-labels.idx3-ubyte和t10k-labels.idx1-ubyte分别是测试集的图片和标签,其中数据/标签文件位置需要进行修改成你本地测试集保存的位置。

import numpy as npimport structfrom PIL import Imageimport osdata_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\t10k-images.idx3-ubyte'# It's 7840016B, but we should set to 7840000Bdata_file_size = 7840016data_file_size = str(data_file_size - 16) + 'B'data_buf = open(data_file, 'rb').read()magic, numImages, numRows, numColumns = struct.unpack_from( '>IIII', data_buf, 0)datas = struct.unpack_from( '>' + data_file_size, data_buf, struct.calcsize('>IIII'))datas = np.array(datas).astype(np.uint8).reshape( numImages, 1, numRows, numColumns)label_file = r'D:\postgraduate\DUT\tpds\malicious_node\MNIST_data\t10k-labels.idx1-ubyte'# It's 10008B, but we should set to 10000Blabel_file_size = 10008label_file_size = str(label_file_size - 8) + 'B'label_buf = open(label_file, 'rb').read()magic, numLabels = struct.unpack_from('>II', label_buf, 0)labels = struct.unpack_from( '>' + label_file_size, label_buf, struct.calcsize('>II'))labels = np.array(labels).astype(np.int64)datas_root = 'mnist_test'if not os.path.exists(datas_root): os.mkdir(datas_root)for i in range(10): file_name = datas_root + os.sep + str(i) if not os.path.exists(file_name): os.mkdir(file_name)for ii in range(numLabels): img = Image.fromarray(datas[ii, 0, 0:28, 0:28]) label = labels[ii] file_name = datas_root + os.sep + str(label) + os.sep + \ 'mnist_test_' + str(ii) + '.png' img.save(file_name)3.运行py文件

运行上述两个py文件后,会在项目的根目录下分别生成两个文件夹:

 

其中,mnist_train有6w个图片,minst_test有1w个图片。

大功告成,接下来就可以开始训练模型啦!!!

本文链接地址:https://www.jiuchutong.com/zhishi/296174.html 转载请保留说明!

上一篇:Auto.js的介绍(auto.js 教程)

下一篇:目标检测算法——YOLOv5/v7/v8改进结合涨点Trick之Wise-IoU(超越CIOU/SIOU)(运动目标检测算法)

  • 抖音行程轨迹小汽车怎么弄(抖音行程轨迹小程序在哪)

    抖音行程轨迹小汽车怎么弄(抖音行程轨迹小程序在哪)

  • 腾讯会议直播可以回放吗(腾讯会议直播可以看到观看时长吗)

    腾讯会议直播可以回放吗(腾讯会议直播可以看到观看时长吗)

  • 华为授权体验店可以修手机吗(华为授权体验店是不是官方的)

    华为授权体验店可以修手机吗(华为授权体验店是不是官方的)

  • 早期电脑交互的方式是(交互方式最早出现于哪个国家)

    早期电脑交互的方式是(交互方式最早出现于哪个国家)

  • 手机保护后膜是贴哪的(手机保护膜是什么材质做的)

    手机保护后膜是贴哪的(手机保护膜是什么材质做的)

  • 知道抖音号怎么搜不到(知道抖音号怎么能找到这个人)

    知道抖音号怎么搜不到(知道抖音号怎么能找到这个人)

  • 来电提醒有几种可能(来电提醒是干什么用的)

    来电提醒有几种可能(来电提醒是干什么用的)

  • tl-wdr5600是不是千兆(tlwdr5600)

    tl-wdr5600是不是千兆(tlwdr5600)

  • cad粘贴不显示图形(cad粘贴没有东西出来)

    cad粘贴不显示图形(cad粘贴没有东西出来)

  • excel怎么下载到电脑上

    excel怎么下载到电脑上

  • 红米note8和note8pro的区别(红米note8和note8pro外观区别)

    红米note8和note8pro的区别(红米note8和note8pro外观区别)

  • mate30pro有耳机孔吗(mate30pro3.5耳机孔)

    mate30pro有耳机孔吗(mate30pro3.5耳机孔)

  • 淘宝领取会员卡在哪(淘宝会员卡片)

    淘宝领取会员卡在哪(淘宝会员卡片)

  • 电脑开始菜单不见了(电脑开始菜单不见了没法关机)

    电脑开始菜单不见了(电脑开始菜单不见了没法关机)

  • 老款车没蓝牙怎么听歌(老款车上没蓝牙怎么办)

    老款车没蓝牙怎么听歌(老款车上没蓝牙怎么办)

  • 滴滴出行拼车什么意思(滴滴拼车拼车规则)

    滴滴出行拼车什么意思(滴滴拼车拼车规则)

  • ipad和投影机怎么连接(ipad连投影仪怎么连接)

    ipad和投影机怎么连接(ipad连投影仪怎么连接)

  • catalina正式版什么时候发布(catalina最高版本)

    catalina正式版什么时候发布(catalina最高版本)

  • pr视频导不出来怎么办(pr视频导不出来是什么原因)

    pr视频导不出来怎么办(pr视频导不出来是什么原因)

  • 抖音里怎么弄逗拍(抖音上是怎么逗siri的)

    抖音里怎么弄逗拍(抖音上是怎么逗siri的)

  • prcc字幕怎么逐字出现(prcc2017字幕怎么逐字出现)

    prcc字幕怎么逐字出现(prcc2017字幕怎么逐字出现)

  • 以前用的手机号现在是空号能补吗(怎么查以前用的手机号)

    以前用的手机号现在是空号能补吗(怎么查以前用的手机号)

  • 【计算机网络】网络层IP协议(计算机网络拓扑结构有哪些)

    【计算机网络】网络层IP协议(计算机网络拓扑结构有哪些)

  • 合宙AIR32F103CBT6刷回CMSIS-DAP固件和DAP升级固件以及刷ST-LINK V2-1固件方法(合宙air32f103 stlink)

    合宙AIR32F103CBT6刷回CMSIS-DAP固件和DAP升级固件以及刷ST-LINK V2-1固件方法(合宙air32f103 stlink)

  • 法人转钱入公户怎么做会计分录
  • 医疗垃圾处理费标准2020
  • 工程用车折旧年限
  • 零余额账户出纳做什么
  • 不验旧可以领新车吗
  • 财务报表中负债率怎么算
  • 银行贷款印花税是什么意思
  • 投资款返还案例
  • 存货报废需要进项转出吗
  • 有期末留抵税额增值税和附税还用计提和缴纳吗
  • 计提折旧不考虑所得税吗
  • 将自产产品用于投资
  • 通行费抵扣入账会计分录?
  • 快递公司结算员工作量大不大
  • 存货的坏账准备转回吗
  • 12月份费用可以计提吗
  • 工厂产品的人工怎么算
  • 今年补缴去年的税汇算清缴吗
  • 企业增值税留抵退税新闻稿范文
  • 价税合计是什么会计科目
  • 申请一般纳税人需要多长时间
  • 纳税调整增加额和纳税调整减少额
  • 关于水利工程
  • 销售方收到红字信息表
  • 企业计提的工资薪金支出可以在税前扣除
  • 收支利息税务如何处理
  • 拆迁补偿款需要交企业所得税吗
  • 销项增值税普通发票
  • macbookzen
  • 信息化生产力是指什么
  • 预提费用新会计准则叫什么科目
  • 销售商品包装材料怎么做
  • Win11怎么设置开机跳过密码
  • 如何找回windows密钥
  • bios设置图文详解
  • 如何设置谷歌浏览器语言为中文
  • 期货公司保证金怎么算的
  • php替换字符串中的某个字符
  • 什么样的发票可以报销
  • php中数据库怎么设计
  • php 后期静态绑定
  • cmd more命令
  • python进行统计分析
  • 用于应酬用的烟有哪些
  • 接待客人的场合
  • 在私立医院就诊能报销吗
  • 差旅费具体包括哪些
  • 上级拨付的债券怎么做账
  • 餐饮行业的个体工商户怎么交税
  • 食堂采购原材料怎么在赣溯源备案
  • 股权转让如何进行资产评估的
  • 长期待摊费用属于利润表项目吗
  • 印花税怎么申报缴纳
  • 分配现金股利的顺序
  • 会计成本核算方法有几种类型
  • 资产负债表怎么算
  • mysql新手视频教学
  • win7系统环境变量无法编辑怎么办
  • linux搭建socks代理
  • win7如何查看图片的rgb
  • os x yosemite wifi断线怎么办?yosemite wifi掉线解决详细步骤
  • linux uzip
  • 移动硬盘中安装系统
  • imac 2010 cpu
  • pvlsvr.exe - pvlsvr是什么进程 有什么用
  • xp系统不能正常启动怎么修复
  • 联想电脑win7系统开机修改开机密码
  • 升级win10系统后电脑变卡处理方法
  • 自动备份文件并发送到Gmail (适用G级数据的备份)
  • 一个字符串中某个字符串出现的次数
  • iframe内容自适应缩放
  • nodejs xhr
  • 段正淳算正面人物吗
  • 使用筷子就餐会不会传染乙肝病毒
  • 税务行政部门有哪些
  • 中国宗教协会如何注册?
  • 江西医保缴费怎么交
  • 煤矸石征收资源税吗
  • 盐城国税电话
  • 接受虚开增值税普票如何补救
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设