TensorFlow:数据集加载

2023-11-02

TensorFlow:数据集加载

数据集加载

数据集加载

1.keas.datasets
tensoflow.keras提供了keras.datasets的接口

常见的数据集：
Boston housing price regerssion dataset
MNIST/Fashion-MNIST dataset
sentiment classification dataset(imdb)
small images classidication dataset(CIFAR10/100)

数据集加载步骤
Step0: 准备要加载的numpy数据
Step1: 使用 tf.data.Dataset.from_tensor_slices() 函数进行加载
Step2: 使用 shuffle() 打乱数据
Step3: 使用 map() 函数进行预处理
Step4: 使用 batch() 函数设置 batch size 值
Step5: 根据需要使用 repeat() 设置是否循环迭代数据集

MNIST

keras.datasets.mnist.load_data()
将MNIST数据集加载并处理成Numpy格式。
（x，y）是60000张训练数据集，
（x_test，y_test）是10000张测试数据集
其中y和y_test存储的是0~9的数字，代表每张图片的值。
y[:4]=[5,0,4,1]表示前四张图片的值分别为5，0，4，1。
tf.one_hot( )将y的数据转换成one_hot类型。
在这里插入图片描述

CIFAR10/100
10和100表示数据的类别，一共10个大类，每一个大类分成10个小类，共有100类。
图片的size=[32，32，3]数据很小。

共有60000张图片，其中50000张是训练数据集，10000张是测试数据集。
在这里插入图片描述

tf.data.Dataset.from_tensor_slices（）
切分传入的 Tensor 的第一个维度，生成相应的 dataset
使用迭代器进行迭代
在这里插入图片描述
.shuffle
将数据集打散

.map
数据预处理
在这里插入图片描述

.batch
设置batch_size，下图的db2.batch(32)，batch_size=32，以32张图片分为一组。
在这里插入图片描述
.repeat
设置数据集的迭代次数，空着则一致循环。

For Example:

def preparer_mnist_featues_and_lables(x, y):
	x = tf.cast(x, tf.float32) / 255. #缩放到0~1范围
	y = tf.cast(y, tf.int64)
	retu x,y

def mnist_dataset():
	(x, y), (x_val, y_val) = datasets.fanshion_muist.load_data() #加载数据集
	# x:60k   y:10k  x_val:60k    y_val:10k
	y = tf.one_hot(y, depth = 10)   #y:[10k,10]
	y_val =  tf.one_hot(y_val, depth = 10)  #y_val:[10k,10]

	ds = tf.data.Dataset.from_tenso_slices((x, y))
	ds = ds.map(repae_mnist_featues_and_lables)  #预处理
	ds = ds.shuffle(60000).batch(100)  #打散在batch
	ds_val = tf.data.Dataset.from_tenso_slices((x_val, y_val))
	ds_val = ds_val.map(repae_mnist_featues_and_lables)
	ds_val = ds_val.shuffle(10000).batch(100)
	return ds, ds_val

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow:数据集加载的相关文章

pg_dump 命令

pg数据库安装目录 bin 下面有 pg dump exe cmd切换到安装目录 bin 下使用pg dump 命令 pg dump help 查看命令详情导出sql语句如下将 10 20 25 224 主机的数据库fdb11
[深度学习]更好地理解正则化：可视化模型权重分布

在机器学习中经常需要对模型进行正则化以降低模型对数据的过拟合程度那么究竟如何理解正则化的影响本文尝试从可视化的角度来解释其影响首先正则化通常分为三种都是在loss函数的基础上外加一项 L0 即不等于0的元素个数 L1 即所有元
剪映电脑版_剪映如何剪视频？详细图文教程+更多进阶高级玩法，新手必看！...

短视频的火爆平台上出现了各式各样酷炫的视频因此许多人也想做出高逼格的视频但相信大部分的人都会遇到这么一个难题那就是从未接触过剪辑不知道视频要怎么优化处理今天这篇文章就带着小伙伴们了解一款非常适合新手的手机剪辑软件一一剪映AP
Qt5教程: (4) 带参数信号与槽

在subwidget h中声明一个signal 和之前的信号函数重名但是有参数 void backSignal QString 之后在subwidget cpp的槽函数sendSignal 中也发送该信号 emit backSignal 子
Java 爬虫遇到需要登录的网站，该怎么办？

这是 Java 网络爬虫系列博文的第二篇在上一篇 Java 网络爬虫就是这么的简单中我们简单的学习了一下如何利用 Java 进行网络爬虫在这一篇中我们将简单的聊一聊在网络爬虫时遇到需要登录的网站我们该怎么办在做爬虫时遇到需
为什么uzi排到古手羽就秒_Uzi排到古手羽秒退，网友争相发表看法，直播间弹幕疑似给出答案...

英雄联盟职业选手Uzi是一位热门人物他在自己的职业生涯当中也取得过很多令人羡慕的职场比赛成就因为自己征战的时间较久多年来也累积了大批量的粉丝因为他的努力与执着如今也凝聚了不少喜欢他的真爱粉丝甚至有不少黑他的粉丝都因此得出了感情
C语言面试高频问题：自己代码实现字符串相关的常用API

参考 C语言面试高频问题自己代码实现字符串相关的常用API 作者图触靓发布时间 2020 08 08 13 31 33 网址 https blog csdn net bhbhhyg article details 107878102
学习《Linux从入门到精通》day-4

1 cal指令作用用来操作日历语法1 cal 等价于 cal 1 直接输出当前月份的日历语法2 cal 3 表示输出上一个月本月下个月的日历语法3 cal y 年份表示输出某一年的日历语法4 cal m 以周一开头 2 c
自定义windows登录认证（微软 Credential Providers 详解一《调用原理》）

windows登录认证在不同的windows版本中有不同的方式在xp中使用gina dll 而在win7及以上版本使用Credential Providers 在win8及以上版本也是使用Credential Providers但是与wi
深度学习（二）（loss、BP、正则化、激活函数）

神经网络基础目录神经网络基础 5 得分函数 6 损失函数 7 前向传播整体流程 8 反向传播计算方法 9 神经网络整体架构 10 神经网络架构细节 11 神经元的个数对结果的影响 12 正则化与激活函数 13 神经网络过拟合解决办法 5
企业级DevOps全链路自动化流水线综合解决方案详解

一 Pipeline流水线 1 Pipeline 简介 Pipeline 简单来说就是一套运行在 Jenkins 上的工作流框架将原来独立运行于单个或者多个节点的任务连接起来实现单个任务难以完成的复杂流程编排和可视化的工作 Pipel
Android开发——项目实例（一）迷你背单词软件

本文是第一版第二版与第一版排版与功能不同第二版地址迷你背单词软件软件效果图源码及APK 链接 https pan baidu com s 1Eak3XDf6 R 7IWEGatNnBQ 提取码 pcqa 如有想修改但不会的欢迎私
如何让 Mybatis 自动生成代码，提高开发效率

出处 https www cnblogs com homejim p 9782403 html 在使用 mybatis 过程中当手写 JavaBean和XML 写的越来越多的时候就越来越同意出错这种重复性的工作我们当然不希望做那么多
Flutter中设置 Column 和 Row 布局组件自适应宽高

mainAxisSize MainAxisSize min
throw new exception后程序不停止_Java_异常Exception

异常指的是程序在执行过程中出现非正常的情况会导致JVM非正常停止在Java等编程语言中异常的本身是一个类 Java处理异常的方式是中断处理异常不是语法上的错误异常的根类 Throwable 存在于lang包下 Throwable
springMVC 定时器配置
如何让ElementUI的Dialog弹窗可以拖拽移动

实现原理利用vue创造一个自定义指令绑定到需要拖拽移动的el dialog组件上在自定义指令中处理弹窗拖拽步骤1 创建自定义指令 v dialogDrag 弹窗拖拽 import Vue from vue let draging f
安全测试-范围&内容

一常规安全测试范围测试范围测试内容测试方法工具主机漏洞扫描根据Nessus漏洞数据库对主机的端口程序和配置进行扫描商业版Nessus 逻辑漏洞测试包含横向越权纵向越权交叉越权随机数安全加密算法误用敏感信息泄露
最简单、实用的cudnn安装教程！！！（nvidia官方渠道下载）

进入cudnn下载页面需注册并登录选择cuDNN Library for Linux x86 64 一定要选这个哦这个安装最简单无需在乎系统版本只需关注cuda版本然后复制下载链接下载到服务器 wget c 链接或者下载到w
C#中对sqlserver进行增删改查

1 添加引用 using System Data using System Data SqlData 建立于数据库的连接 string sqlconnection data source 注解1 database 注解2 uid 注解3 p

随机推荐

2021美赛 MCM\ICM D题

自古以来音乐就已成为人类社会的一部分已成为文化遗产的重要组成部分为了理解音乐在人类集体经验中所扮演的角色我们被要求开发一种量化音乐发展的方法在创作新音乐时有许多因素会影响艺术家包括其天赋的创造力当前的社会或政治事件使用新乐
UE4/UE5 虚幻引擎，DDC(DerivedDataCache)派生数据缓存

1 编辑器偏好设置 gt 全局 gt 共享派生数据缓存作用同一个项目编译结束之后会把缓存数据存储到共享文件夹中后续其他团队成员打开项目的时候就不需要再次编译了
原生wx小程序用vant组件自定义底部导航

1 在根目录中创建custom tab bar 新建page index 2 在app json或index json中引入vant组件 usingComponents van tabbar vant weapp tabbar index
Mybatis配置找不到resources错误的解决

问题导入Mybatis框架和进行基础的查询操作在网上找了教程配置后运行总会有找不到resources错误找不到mybatis下的解决方案反复查询配置文件发现是地址标红不能导入在setting DTDS中添加 http myb
Fiddler抓取https如何设置

来源 http t istester com 3000 istester 21Day src master Fiddler V1 0 21Day Fiddler 05 md
matlibplot之条形图

文本以及后续的系列文章中均会使用到numpy这个库 numpy是Python的一种开源的数值计算扩展主要用来生产一些随机数作为绘图的原始数据具体和安装matplotlib类似可以参考安装Matplotlib这篇文章文章目录条形图
【threejs加载器】加载gltf模型及压缩模型

加载obj过程请参考如下两篇 threejs基础使用OBJLoader 加载obj模型 threejs基础使用MTLLoader 加载材质OBj模型 1 加载gltf模型效果如下第一步引入GLTFLoader import GLT
Pandas日期数据处理函数 to_datetime()

to datetime函数可以用来批量处理日期数据转换可以将日期数据转换成你需要的各种格式如 13 oct 18 10 13 18 2018 10 13 2018 10 13 20181013 转换成 2018 10 13 to dat
MySQL事务基础知识

前言学习导流小林coding 事务篇学习意义理解MySQL如何去处理并发问题借鉴其思想存储作为应用的关键能力而事务作为关系型数据库的关键概念掌握很必要也为分布式事务学习做奠基相关说明该篇博文是个人阅读的重要梳理仅做
git 回滚某个文件

git checkout 可以丢弃工作区的修改但是不能丢弃暂存区的修改注意要加否则就变成切换分支命令 git reset HEAD 可以丢弃暂存区的修改 unstage 但是不会自动同步撤销工作区的修改如果希望彻底丢弃暂存区以及
【C++】哈希算法

目录 1 哈希映射 1 1哈希的概念 1 2哈希冲突 1 3哈希函数 1 31直接定值法 1 32除留余数法 2 解决哈希冲突 2 1闭散列法 2 11线性探测 2 12二次探测 3代码实现 3 1状态 3 2创建哈希节点类 3 21哈希表
旅游攻略APP外包开发功能

旅游攻略APP是帮助旅行者计划和享受旅行的工具下面列出了一些常见的旅游攻略APP功能以及在上线这类应用时需要注意的问题希望对大家有所帮助北京木奇移动技术有限公司专业的软件外包开发公司欢迎交流合作常见功能目的地信息提供有关各
表维护视图的F4增强

利用SE11创建表维护视图后我们可以通过SE51修改自动生成的屏幕来编写自定义F4以及其它事件首先需要找到相应的FUNCTION GROUP SE80进入FUNCTION GROUP的编辑页面修改屏幕的PBO PAI事件出了MDL开
FairMOT论文阅读笔记

Abstract 近些年目标检测和Re ID有很大的发展但是没有人在单个网络中联合这两个任务由于re ID任务没有公平的学习这导致了大量id的转换不公平之处在于两个方面 1 他们将重新身份识别视为次要任务其准确性在很大程度上取决于
ubuntu ip地址修改

图形界面化修改新版本的修改方式 vim etc netplan 00 installer config yaml This is the network config written by subiquity network ethern
常用 c++ github 项目汇总

GitHub fmtlib fmt A modern formatting library GitHub gabime spdlog Fast C logging library
PS色彩原理

色彩六大色调的构成纯色调优点刺激直接活力促销缺点廉价缺少品质感明色调优点年轻阳光活力明朗干净缺点缺少档次淡色调优点天真女性纤细轻快高档女性专属色缺点单薄软弱女性专属色白色调优点
mac os 10.12安全性与隐私没有任何来源的解决办法

到mac os10 12后有很多签名不对的软件安装会装不了比如解决办法如下在命令行中输入 sudo spctl master disable 这样就可以在系统偏好设置安全性与隐私中看到任何来源了这样像很多本来安装不了的软件又可以
ValidPalindrome（回文字符串的判断）

author LemonLin Description StringValidPalindrome date 2019 5 9 16 40 Given a string determine if it is a palindrome con
TensorFlow:数据集加载

TensorFlow 数据集加载数据集加载数据集加载 1 keas datasets tensoflow keras提供了keras datasets的接口常见的数据集 Boston housing price regerssion

热门标签