如何分割 Tensorflow 数据集？

2023-12-07

我有一个基于一个 .tfrecord 文件的张量流数据集。如何将数据集拆分为测试数据集和训练数据集？例如。 70% 训练，30% 测试？

Edit:

我的张量流版本：1.8 我已经检查过，没有可能的重复项中提到的“split_v”函数。我也在使用 tfrecord 文件。

您可以使用Dataset.take() and Dataset.skip():

train_size = int(0.7 * DATASET_SIZE)
val_size = int(0.15 * DATASET_SIZE)
test_size = int(0.15 * DATASET_SIZE)

full_dataset = tf.data.TFRecordDataset(FLAGS.input_file)
full_dataset = full_dataset.shuffle()
train_dataset = full_dataset.take(train_size)
test_dataset = full_dataset.skip(train_size)
val_dataset = test_dataset.skip(test_size)
test_dataset = test_dataset.take(test_size)

为了更通用，我给出了一个使用 70/15/15 训练/验证/测试分割的示例，但如果您不需要测试或验证集，只需忽略最后两行。

Take:

创建一个数据集，其中最多包含此数据集中的 count 个元素。

Skip:

创建一个数据集，跳过该数据集中的 count 元素。

您可能还想了解一下Dataset.shard():

创建一个仅包含此数据集的 1/num_shards 的数据集。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowdatasets

如何分割 Tensorflow 数据集？的相关文章

在NN中指定连接（在keras中）

我正在使用 keras 和tensorflow 1 4 我想明确指定哪些神经元在两层之间连接因此每当第一层中的神经元 i 连接到第二层中的神经元 j 且其他地方为零时我就有一个矩阵 A 其中包含 1 我的第一次尝试是创建一个带有内核的
“Dense”对象没有属性“op”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试使用tensorflow keras制作一个完全连接的模型这是我的代码 from tensorflow keras m
使用 Mac M1 在 Docker 容器内的 pip 安装中找不到 Tensorflow

我正在尝试使用新的 Mac M1 运行一些项目这些项目已经在英特尔处理器上运行并被使用英特尔的其他开发人员使用我无法构建这个简单的 Dockerfile FROM python 3 9 RUN python m pip install
如何清除 tf.flags？

如果我运行此代码两次 tf flags DEFINE integer batch size 2 batch size for training 我会得到这个错误 DuplicateFlagError The flag batch size
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
如何将 std::vector 转换为张量而不在 C++ 中的张量流中进行复制？

在c 中多维矩阵存储在std vector
跨多个 GPU/机器的 TF-Slim 的配置/标志

我很好奇是否有关于如何使用部署 model deploy py 在多台机器上的多个 GPU 上运行 TF Slim models slim 的示例该文档非常好但我缺少一些内容具体来说需要为worker device和ps devic
如何在nodejs（tensorflow.js）中训练模型？

我想做一个图像分类器但我不会python Tensorflow js 使用我熟悉的 javascript 可以用它来训练模型吗训练步骤是什么坦白说我不知道从哪里开始我唯一想到的是如何加载 mobilenet 它显然是一组预先训练的
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
导入tensorflow时，出现以下错误：没有名为“numpy.core._multiarray_umath”的模块

我已经安装了 Ancaconda3 和 Tensorflow 当我尝试在 python shell 中导入 Tensorflow 时收到以下错误 ModuleNotFoundError 没有名为 numpy core multiarray
Tensorboard 和 Dropout 层

我有一个非常基本的查询我制作了 4 个几乎相同差异在于输入形状的 CNN 并在连接到全连接层的前馈网络时合并了它们几乎相同的 CNN 的代码 model3 Sequential model3 add Convolution2D 32
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
conv1D 中形状的尺寸

我尝试过构建一个只有一层的 CNN 但遇到了一些问题事实上编译器告诉我 ValueError 检查模型输入时出错预期的 conv1d 1 input 具有 3 个维度但得到形状为 569 30 的数组这是代码 import num
无需安装 Tensorflow 即可服务 Tensorflow 模型

我有一个经过训练的模型想在 python 应用程序中使用但我看不到任何在不安装 TensorFlow 或创建 gRPC 服务的情况下部署到生产环境的示例有可能吗在这种情况下正确的做法是什么如果不使用 TensorFlow 本身或
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
需要 TensorFlow 依赖项。如何在 Windows 上运行 TensorFlow

我有兴趣让 TensorFlow 在 Windows 上运行但目前我意识到这是不可能的因为某些依赖项无法在 Windows 上使用例如巴泽尔之所以出现这种需求是因为据我目前了解从 TensorFlow 访问 GPU 的唯一方法是
如何解释tf.map_fn的结果？

看代码 import tensorflow as tf import numpy as np elems tf ones 1 2 3 dtype tf int64 alternates tf map fn lambda x x x x el

随机推荐

-Djava.library.path=... 相当于 System.setProperty("java.library.path", ...)

我加载一个外部库该库位于 lib 这两种设置 java library path 的解决方案是否等效执行jar时在控制台设置路径 java Djava library path lib jar myApplication jar 在加载
动态与对象相同

在 CLR via C 一书中提到 FCL类型对应的dynamic关键字是System Object 请澄清这一点 It s not从 C 的角度来看这完全是一样的但是在编译的代码中声明为类型的变量dynamic通常可能总是与 C
没有互联网连接的同步适配器

我有一个工作正常的同步适配器它不需要互联网连接因为它需要将地址簿与另一个本地存储我的应用程序同步当 Wifi 关闭并且设备没有任何互联网连接时 Android 会在帐户和同步设置活动中禁用同步即使连接关闭有没有办法让同步适
从列表中删除重复项和原始项

给定一个字符串列表我想删除重复项和原始单词例如 lst a b c c c d e e 输出应该删除重复项所以像这样 a b d 我不需要保留订单 Use a collections Counter object 然后仅保留那些计数为
关闭交互式 python 会话时结束非守护线程

请考虑下面的代码 usr bin env python3 import threading import time class MyThread threading Thread def init self super init self
在 Swift 中将 UIView 转换为 .png

如何将 UIView 转换为图像我找到了这个将 uiview 转换为 png 图像但我对 Objective C 不太熟悉我尝试将其翻译成 Swift 但进展不太顺利有什么帮助吗 UIGraphicsBeginImageContext
如何将自定义数据加载到 keras Cyclegan 示例的 tfds 中？

按照中的示例https keras io examples generative cyclegan 已加载预先存在的数据集以供实施我正在尝试添加我的数据集 import tensorflow datasets as tfds data t
PyQt6：如何在 QImageReader 中设置分配限制？

我正在将应用程序从 PyQt5 更新到 PyQt6 该应用程序使用非常大的图像文件我已经更新了代码以使用 PyQt6 但是当我运行 Python 脚本时我现在收到错误 QImageIOHandler 拒绝图像因为它超出了当前分配限
如何在laravel中使用createMany方法插入多条记录

我想使用 createMany 创建多记录如何在没有数据复制的情况下将数组插入到此方法 public function update Request request Question question options request gt
将嵌入引号的 csv 文件读取到 R 中

我必须使用如下所示的 csv 文件 IDEA ID IDEA TITLE VOTE VALUE 56144 Net Present Value PLUS NPV 1 56144 Net Present Value PLUS NPV 1 如果
cakephp 表单验证

有谁知道 cakePHP 中的表单是否有 VALIDATE 函数并查看错误数组我检查了文档但我发现的唯一东西是 SAVE 功能我只需要知道我发送的数据是否有效并手动检查错误 Try this this gt ModelName gt
在函数调用的同一行获取哈希键/值

这是重现问题的代码 sub hello return h gt 1 n gt 1 print join values hello 我收到错误 arg 1 到值的类型必须是散列不是子程序入口在第 4 行靠近执行由于中止到编译错误
MVVM：绑定一个 ViewModel，它将构造函数参数传递给 UserControl

我的 WPF 应用程序有一个 MainWindow 其中包含一个名为 Tvshow GridView 的用户控件主窗口
多维 std::array [重复]

这个问题在这里已经有答案了在C 中如何创建多维std array 我试过这个 std array
如何创建“动态”WHERE 子句？

第一谢谢我完成了我的另一个项目并得到了很大的惊喜现在一切都按预期进行感谢一些有帮助的思想家所以我开始下一个项目我想要得到这样的东西 SELECT FROM tablename WHERE field1 content AND
通过传递输出迭代器从函数填充 std::[container]

我想通过传递输出迭代器从函数内部填充容器因为据我所知这是最有效的方法例如 template
SDL 事件处理不起作用

我目前正在通过阅读 Lazy foo 教程来学习 SDL 我在 Linux 上使用代码块 13 12 我无法使事件处理正常工作我基本上是在尝试显示图像效果很好但无论我单击关闭按钮多少次它都不会关闭 Code include
比较向量值：1 个元素与所有其他元素

我想知道如何将向量的 1 个元素与另一个向量中的所有元素进行比较举个例子假设 x lt c 1 10 y lt c 10 11 12 13 14 1 7 现在我可以逐个比较元素 x y 1 FALSE FALSE FALSE FALSE
计算集合列表中所有组合的交集

我有一套集合我想找到仅在每个集合组合的交集中找到的项目数我基本上想做与在维恩图中创建数字相同的事情一个基本的例子可能会更清楚 a set 1 2 5 10 12 b set 1 2 6 9 12 15 c set 1 2 7 8 15
如何分割 Tensorflow 数据集？

我有一个基于一个 tfrecord 文件的张量流数据集如何将数据集拆分为测试数据集和训练数据集例如 70 训练 30 测试 Edit 我的张量流版本 1 8 我已经检查过没有可能的重复项中提到的 split v 函数我也在使用 tf

如何分割 Tensorflow 数据集？

如何分割 Tensorflow 数据集？ 的相关文章

随机推荐

热门标签

如何分割 Tensorflow 数据集？的相关文章