位置: IT常识 - 正文

【tensorflow】制作自己的数据集(tensorflow gui)

编辑:rootadmin
【tensorflow】制作自己的数据集

推荐整理分享【tensorflow】制作自己的数据集(tensorflow gui),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:tensorflow教程,tensorflow jit,tensorflow jit,tensorflow1,tensorflow教程,tensorflow1 教程,tensorflow1 教程,tensorflows,内容如对您有帮助,希望把文章链接给更多的朋友!

  🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝

🥰 博客首页:knighthood2001

😗 欢迎点赞👍评论🗨️

❤️ 热爱python,期待与大家一同进步成长!!❤️

目录

数据集的基本介绍

tensorflow中的数据集

什么是TFDS

安装TFDS

用TFDS加载数据集

实例:将模拟数据制作成内存对象数据集

①生成模拟数据

②定义占位符

③建立session会话,获取并显示模拟数据。

④模拟数据可视化

运行结果

改进:创建带有迭代值并支持乱序功能的模拟数据集 


数据集的基本介绍

        数据集是样本的集合,在深度学习中,数据集用于模型训练。再用tensorflow框架开发深度学习模型之前,需要为模型准备好数据集。在训练模型环节,程序需要从数据集中不断地将数据输入模型,模型通过对注入数据的计算来学习特征。

tensorflow中的数据集

tensorflow中有4种数据集格式

        内存对象数据集:直接用字典变量feed_dict,通过注入模式向模型中输入数据。该数据集适用于少量的数据集输入。

        TFRecord数据集:用队列式管道(tfrecord)向模型输入数据。该数据集适用大量的数据集输入。

        Dataset数据集:通过性能更高的输入管道(tf.data)向模型输入数据。该数据集适用于tensorflow1.4之后的版本。

        tf.keras接口数据集:支持tf.keras语法的数据集接口。该数据集适用于tensorflow1.4之后的版本。

什么是TFDS

        TFDS是tensorflow中的数据集集合模块,该模块将常用的数据及封装起来,实现自动下载与统一的调用接口,为开发模型提供了便利。

安装TFDS

要求:tensorflow版本在1.12及以上。安装命令如下:

pip install tensorflow-datasets用TFDS加载数据集

这里以minst数据集为例

import tensorflow_datasets as tfdsprint(tfds.list_builders())ds_train, ds_test = tfds.load(name='mnist', split=["train", "test"])ds_train = ds_train.shuffle(1000).batch(128).prefetch(10)for features in ds_train.take(1): image, label = features["image"], ["label"]

重要结果如下:

Downloading and preparing dataset Unknown size (download: Unknown size, generated: Unknown size, total: Unknown size) to ~\tensorflow_datasets\mnist\3.0.1...Dataset mnist downloaded and prepared to ~\tensorflow_datasets\mnist\3.0.1. Subsequent calls will reuse this data.实例:将模拟数据制作成内存对象数据集

        本实例将用内存中的模拟数据来制作成数据集,生成的数据集被直接存放在python内存对象中,这样做的好处--数据集的制作可以独立于任何框架。

        本实例将生成一个模拟y≈2x的数据集,并通过静态图的方式显示出来。

步骤如下:

①生成模拟数据

②定义占位符

【tensorflow】制作自己的数据集(tensorflow gui)

③建立session会话,获取并显示模拟数据。

④模拟数据可视化

①生成模拟数据

        在样本制作过程中,最忌讳的是一次性将数据都放入内存中,如果数据量很大,这样容易造成内存用尽,即使是模拟数据,也不建议将数据全部生成以后一次性放入内存中,一般做法是:

Ⅰ创建一个模拟数据生成器,

Ⅱ每次只生成指定批次的样本

这样就在迭代过程中,就可以用“随用随制作”的方法来获取样本数据。

        下面定义GenerateData函数来生成模拟数据,并将GenerateData函数的返回值设为以生成器方式返回。这种做法使内存被占用的最少。

import tensorflow as tfimport numpy as npimport matplotlib.pyplot as plttf.compat.v1.disable_v2_behavior()#在内存中生成模拟数据def GenerateData(batchsize = 100): train_X = np.linspace(-1, 1, batchsize) #train_X为-1到1之间连续的100个浮点数 train_Y = 2 * train_X + np.random.randn(*train_X.shape) * 0.3 # y=2x,但是加入了噪声 yield train_X, train_Y #以生成器的方式返回

        函数使用yield,使得函数以生成器的方式返回数据。生成器对象只生成一次,过后便会自动销毁,可以省略大量的内存。

②定义占位符#定义网络模型结构部分,这里只有占位符张量Xinput = tf.compat.v1.placeholder("float", (None))Yinput = tf.compat.v1.placeholder("float", (None))

注意:在正常的模型开发中,这个环节应该是定义占位符和网络结构,在训练模型时,系统会将数据集的输入数据用占位符来代替,并使用静态图的注入机制,将输入数据传入模型进行迭代训练。因为本实例只需要从数据集中获取数据,所以只定义占位符,不需要定义其他网络节点。

③建立session会话,获取并显示模拟数据。

        首先定义数据集的迭代次数,接着建立会话,在会话中使用两层for循环;第一层是按照迭代次数来循环,第二层是对GenerateData函数返回的生成器对象进行循环,并将数据打印出来。

        因为GenerateData函数返回的生成器对象只有一个元素,所以第二层循环也只运行一次。

#建立会话,获取并输出数据training_epochs = 20 # 定义需要迭代的次数with tf.compat.v1.Session() as sess: # 建立会话(session) for epoch in range(training_epochs): #迭代数据集20遍 for x, y in GenerateData(): #通过for循环打印所有的点 xv,yv = sess.run([Xinput,Yinput],feed_dict={Xinput: x, Yinput: y}) #通过静态图注入的方式,传入数据 print(epoch,"| x.shape:",np.shape(xv),"| x[:3]:",xv[:3]) print(epoch,"| y.shape:",np.shape(yv),"| y[:3]:",yv[:3])

代码开始定义了数据集的迭代次数,这个参数在训练模型中才会用到。

④模拟数据可视化#显示模拟数据点train_data = list(GenerateData())[0]plt.plot(train_data[0], train_data[1], 'ro', label='Original data')plt.legend()plt.show()运行结果...17 |x.shape: (100,) |x[:3]: [-1. -0.97979796 -0.959596 ]17 |y.shape: (100,) |y[:3]: [-2.0945473 -2.1236315 -1.6280223]18 |x.shape: (100,) |x[:3]: [-1. -0.97979796 -0.959596 ]18 |y.shape: (100,) |y[:3]: [-2.022675 -2.118289 -1.8735064]19 |x.shape: (100,) |x[:3]: [-1. -0.97979796 -0.959596 ]19 |y.shape: (100,) |y[:3]: [-2.0080116 -2.5169287 -1.6713679]

每行数据被|符号划分为3块区域,分别为:迭代次数、数据的形状、前三个元素的值。

可视化结果如下

改进:创建带有迭代值并支持乱序功能的模拟数据集 

优化如下:

①将数据集与 迭代功能绑定在一起,让代码变得更简洁。

②对数据集进行乱序排序,让生成的x数据无规则 。

通过对数据集的乱序,可以消除样本中无用的特征,从而大大提升模型的泛化能力。

注意:

在乱序操作部分使用的是sklearn.utils库中的shuffle()方法。要使用,首先需要安装,命令如下:

pip install sklearn

改进后全部代码如下: 

import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.utils import shuffletf.compat.v1.disable_v2_behavior()def GenerateData(training_epochs,batchsize=100): for i in range(training_epochs): train_X=np.linspace(-1,1,batchsize) train_Y=2*train_X+np.random.randn(*train_X.shape)*0.3 yield shuffle(train_X,train_Y),iXinput=tf.compat.v1.placeholder("float",(None))Yinput=tf.compat.v1.placeholder("float",(None))training_epochs=20with tf.compat.v1.Session() as sess: for (x,y),ii in GenerateData(training_epochs): xv,yv=sess.run([Xinput,Yinput],feed_dict={Xinput:x,Yinput:y}) print(ii,"|x.shape:",np.shape(xv),"|x[:3]:",xv[:3]) print(ii,"|y.shape:",np.shape(yv),"|y[:3]:",yv[:3])train_data=list(GenerateData(1))[0]plt.plot(train_data[0][0],train_data[0][1],'ro',label='Original data')plt.legend()plt.show()

可视化结果图片如下:

本文链接地址:https://www.jiuchutong.com/zhishi/299692.html 转载请保留说明!

上一篇:vue2.x与vue3.x中自定义指令详解(vue2vue3的区别)

下一篇:NLP与ChatGPT的碰撞:大模型和小模型联合发力(nlp track)

  • 怎样经营微信营销才能消除消费者被压迫感觉(微信经营四步走)

    怎样经营微信营销才能消除消费者被压迫感觉(微信经营四步走)

  • 小米笔记本怎么恢复出厂设置(小米笔记本怎么设置u盘启动)

    小米笔记本怎么恢复出厂设置(小米笔记本怎么设置u盘启动)

  • 华为音箱怎么连接无线网络(华为音箱怎么连接电脑)

    华为音箱怎么连接无线网络(华为音箱怎么连接电脑)

  • 手机hd是什么意思(手机上方hd是什么意思)

    手机hd是什么意思(手机上方hd是什么意思)

  • x触屏失灵如何关机(x触摸不灵敏)

    x触屏失灵如何关机(x触摸不灵敏)

  • 搜索引擎如何区分转载页面和原页面(各类搜索引擎有何区别)

    搜索引擎如何区分转载页面和原页面(各类搜索引擎有何区别)

  • 怎么看情侣空间被挡访客记录(怎么看情侣空间历史记录)

    怎么看情侣空间被挡访客记录(怎么看情侣空间历史记录)

  • 电信卡无法接收验证码(电信卡无法接收发送短信)

    电信卡无法接收验证码(电信卡无法接收发送短信)

  • 闲鱼删除订单还显示评价吗(闲鱼删除订单还能恢复吗)

    闲鱼删除订单还显示评价吗(闲鱼删除订单还能恢复吗)

  • 微信能同时登录两个账号吗

    微信能同时登录两个账号吗

  • iphone x怎么贴膜(iphone x 贴膜)

    iphone x怎么贴膜(iphone x 贴膜)

  • 被挡访客怎么解除(被挡访客怎么解除在哪设置)

    被挡访客怎么解除(被挡访客怎么解除在哪设置)

  • 查找我的iphone抹掉后会怎样(查找我的iPhone抹掉)

    查找我的iphone抹掉后会怎样(查找我的iPhone抹掉)

  • airpods二代和三代区别(airpods二代和三代佩戴舒适度)

    airpods二代和三代区别(airpods二代和三代佩戴舒适度)

  • 3dtouch安卓手机有吗(3dtouch安卓机有吗)

    3dtouch安卓手机有吗(3dtouch安卓机有吗)

  • iphonex突然显示未激活(iphonex一直显示苹果标志怎么办)

    iphonex突然显示未激活(iphonex一直显示苹果标志怎么办)

  • ios10.3.3录屏功能在哪(ios10.3.3 录屏)

    ios10.3.3录屏功能在哪(ios10.3.3 录屏)

  • 菜鸟裹裹如何取消被别人关联(菜鸟裹裹如何取消实名认证)

    菜鸟裹裹如何取消被别人关联(菜鸟裹裹如何取消实名认证)

  • 苹果11支持18w快充吗(苹果11支持十八瓦快充吗)

    苹果11支持18w快充吗(苹果11支持十八瓦快充吗)

  • 嗨来电这个软件安全吗(嗨来电下载安装)

    嗨来电这个软件安全吗(嗨来电下载安装)

  • led显示屏乱码(led显示屏乱码 自动回复正常)

    led显示屏乱码(led显示屏乱码 自动回复正常)

  • iphone7移动4g网络很慢(苹果7显示4g但是不能上网是怎么回事)

    iphone7移动4g网络很慢(苹果7显示4g但是不能上网是怎么回事)

  • Win10下修复Wi-Fi没有有效的IP配置(windows修复网络)

    Win10下修复Wi-Fi没有有效的IP配置(windows修复网络)

  • 在Linux上如何管理加密密钥?管理加密密钥的最佳体验(linux如何管理进程)

    在Linux上如何管理加密密钥?管理加密密钥的最佳体验(linux如何管理进程)

  • CSDN独家原创《芒果YOLO改进高阶指南》适用YOLOv5、YOLOv7、YOLOv8等改进专栏,来自人工智能专家老师联袂推荐(csdn创作激励)

    CSDN独家原创《芒果YOLO改进高阶指南》适用YOLOv5、YOLOv7、YOLOv8等改进专栏,来自人工智能专家老师联袂推荐(csdn创作激励)

  • 前一年度进项税少记了怎么办
  • 财务软件购买税点多少钱
  • 公益事业捐赠的范围是什么
  • 社保缴费基数怎么算出来的啊
  • 投资款要不要交企业所得税
  • 过路费定额发票还能入账吗
  • 过路费纸质发票怎么生成电子发票
  • 公司产品的打样费入什么会计科目
  • 应付账款暂估余额
  • 房企预收账款什么时候结转
  • 公司账外现金
  • 工程预收账款的会计分录
  • 第三方协议补贴
  • 销售礼盒增值税税率
  • 税务登记时要财务确认吗
  • 个人代开普通发票需要出税费吗?
  • 水利建设专项收入税
  • 汽车维修单位提成比例
  • 手撕发票流程
  • 出口样品可以申请专票吗
  • 收到退以前年度所得税
  • 付款方付款的发票税金能入账吗?
  • 季度申报利润表怎么填
  • 社保滞纳利息所得税前扣除
  • 企业处置固定资产怎么纳税
  • 企业销售应如何做
  • 高新企业研发费用占销售收入的比例
  • 餐饮发票可以计入什么费用
  • linux系统已经得到了广泛的应用
  • 进程核心栈
  • 看望员工生病的家属支付现金如何入账
  • 生产员工福利计什么科目
  • 企业需要税务登记吗
  • 上季度的亏损可以弥补下季度的企业所得税
  • lunux删除命令
  • 织梦怎么调用当前栏目下的文章
  • Php数组转json 参数不带引号
  • Python IDE之Thonny的介绍
  • mongodb认证
  • 应收账款余额百分比法与账龄分析法有何异同
  • 保险公司的奖励制度
  • 加计扣除的增值税怎么做账
  • 管理费用结转本年利润
  • 资本公积 转增
  • 初级会计实务重点内容
  • 固定资产一次计提折旧
  • 湖南残保金优惠政策
  • 公司的钱转入余额账户
  • 母公司设立子公司协议
  • 个体工商户的纳税标准
  • 开办费没发票如何做账?
  • 私人贴现利息如何交税
  • 去年的凭证今年未入账
  • 财务报表是否合法公允
  • Windows 8.1下MySQL5.7 忘记root 密码的解决方法
  • 应用商店升级版
  • page文档的排版技巧
  • mac怎么修改图片格式jpg
  • 进入注册表的快捷键
  • win10右键菜单管理在哪打开
  • win10 打开文件
  • windowsxp的设置在哪
  • jusched.exe是什么进程
  • windows 10 build 21354
  • android canvas rotate
  • opengl mfc
  • html中的td
  • 不同页面之间传递数据
  • jqueryanimate动画
  • nodejs 爬虫
  • python迭代器的作用
  • unity strangeioc
  • 点击按钮显示
  • 拨号器怎么用
  • Javascript valueOf 使用方法
  • python批量删除行
  • 油品贸易公司资质
  • 别墅与普通住宅的优缺点
  • 平安银行股份有限公司临沂分行
  • 财政部国家税务总局2021年40号
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设