将形状不等的数组列表转换为 Tensorflow 2 数据集：ValueError：无法将非矩形 Python 序列转换为 Tensor

2023-12-12

我以列表的形式标记了数据形状不均 arrays:

array([array([1179,    6,  208,    2, 1625,   92,    9, 3870,    3, 2136,  435,
          5, 2453, 2180,   44,    1,  226,  166,    3, 4409,   49, 6728,
         ...
         10,   17, 1396,  106, 8002, 7968,  111,   33, 1130,   60,  181,
       7988, 7974, 7970])], dtype=object)

以及各自的目标：

Out[74]: array([0, 0, 0, ..., 0, 0, 1], dtype=object)

我正在尝试将它们改造成有衬垫的tf.data.Dataset()，但它不允许我将不等的形状转换为张量。我会得到这个错误：

ValueError: Can't convert non-rectangular Python sequence to Tensor.

完整的代码在这里。假设我的起点是之后y = ...:

import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'
import tensorflow as tf
import tensorflow_datasets as tfds
import numpy as np

(train_data, test_data) = tfds.load('imdb_reviews/subwords8k',
                                    split=(tfds.Split.TRAIN, tfds.Split.TEST),
                                    as_supervised=True)

x = np.array(list(train_data.as_numpy_iterator()))[:, 0]
y = np.array(list(train_data.as_numpy_iterator()))[:, 1]


train_tensor = tf.data.Dataset.from_tensor_slices((x.tolist(), y))\
    .padded_batch(batch_size=8, padded_shapes=([None], ()))

我有哪些选择可以将其变成填充批次 tensor?

如果您的数据存储在 Numpy 数组或 Python 列表中，那么您可以使用tf.data.Dataset.from_generator创建数据集然后填充批次的方法：

train_batches = tf.data.Dataset.from_generator(
    lambda: iter(zip(x, y)), 
    output_types=(tf.int64, tf.int64)
).padded_batch(
    batch_size=32,
    padded_shapes=([None], ())
)

但是，如果您正在使用tensorflow_datasets.load函数，那么就不需要使用as_numpy_iterator将数据和标签分开，然后将它们重新放在数据集中！这是多余且低效的。返回的对象tensorflow_datasets.load已经是一个实例tf.data.Dataset。所以，你只需要使用padded_batch在他们：

train_batches = train_data.padded_batch(batch_size=32, padded_shapes=([None], []))
test_batches = test_data.padded_batch(batch_size=32, padded_shapes=([None], []))

请注意，在 TensorFlow 2.2 及更高版本中，您不再需要提供padded_shapes参数，如果您只想将所有轴填充到批次中最长的轴（即默认行为）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

tensorflow20

tensorflowdatasets

将形状不等的数组列表转换为 Tensorflow 2 数据集：ValueError：无法将非矩形 Python 序列转换为 Tensor 的相关文章

如何替换 Pandas Dataframe 中不在列表中的所有值？ [复制]

这个问题在这里已经有答案了我有一个值列表如何替换 Dataframe 列中不在给定值列表中的所有值例如 gt gt gt df pd DataFrame D ND D garbage columns S gt gt gt df S 0
类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
嵌套作用域和 Lambda

def funct x 4 action lambda n x n return action x funct print x 2 prints 16 我不太明白为什么2会自动分配给n n是返回的匿名函数的参数funct 完全等价的定义fu
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
在virtualenv中下载sqlite3

我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

如何在 3D 空间中围绕 x 轴旋转正方形

所以我一直在尝试学习 3D 渲染是如何工作的我尝试编写一个脚本目标是在 3D 空间中旋转平面 2D 正方形我首先在标准化空间 1 1 中定义一个正方形请注意只有 x 和 y 被标准化 class Vec3 3D VECTOR de
为什么在尝试从列表中删除元素时会收到 UnsupportedOperationException？

我有这个代码 public static String SelectRandomFromTemplate String template int count String split template split List
Python Selenium onclick 抛出 ElementNotInteractableException

在我想使用 Selenium 进行交互的网站上有以下 html 代码部分 a href img src img rename png 1 alt change name title change name a 这显示了一个小图像单击该图
根据单元格值更改 Excel 中的弧长

我想根据单元格值动态更改 Excel 中的弧长例如如果单元格值 100 则拱形应成为完整的圆形如果该值 0 它应该消失我发现下面的代码可以更改形状的大小但我不知道如何修改它来更改长度 Example 非常感谢您的帮助 Privat
通过变量之一的值设置堆积条形图的顺序

我被要求制作一个堆叠条形图其中的条形和值以精确的方式堆叠和排序在本例中 A3 在左侧 A2 在中间 A1 在右侧我已经解决了我没有注意到的是我还被要求按 A1 的值降序排列条形在这种情况下这意味着值 11 出现在顶部按降序
Runtime.exec() 的安全问题

我正在使用 Runtime exec 来运行可执行文件我一直在研究并发现在应用程序中使用它时可能存在安全问题使用 Runtime exec 运行可执行文件时是否存在安全问题 Jeanne Boyarsky 显然你不能按照你提到的方式注入
本地主机上的目录名(__FILE__)

我正在使用 WAMP 并且在 www 目录中有一个开发站点我想用dirname FILE 定义服务器根目录的路径目前我正在使用一个配置文件其中包含 define PATH dirname FILE 我将配置文件包含在我的header
Android Studio：错误文件名、目录名或卷标语法不正确

我使用的是 Windows 7 64 位并切换到最新的 Android Studio 但收到此错误错误配置项目 myproject 时出现问题无法标准化文件 C Users me Apps Android android myproj
将 8 个布尔值转换为 1 个字节的最佳方法？

我想将 8 个布尔值保存到一个字节然后将其保存到一个文件中这项工作必须针对非常大的数据完成我使用了以下代码但我不确定它是最好的代码就术语而言速度和空间 int bits 1 0 0 0 0 1 1 1 char a 0 for
UnicodeDecodeError：“ascii”编解码器无法解码位置 47 中的字节 0x92：序号不在范围内（128）

我正在尝试使用 Python 在 StringIO 对象中写入数据然后最终使用 psycopg2 的 copy from 函数将此数据加载到 postgres 数据库中首先当我这样做时 copy from 抛出错误错误编码 UTF
d3.js 中的转义字符

我需要在图表的刻度格式中显示微摩尔每升 mol L 但是当我传入 mol L 时它会显示字符而不是 mu 的符号我如何让它渲染符号在这种情况下您不应使用 HTML 实体一旦你处理 SVG 请使用 u00B5 检查这个片段 var
计算混淆矩阵的更快方法？

我正在计算图像语义分割的混淆矩阵如下所示这是一种非常冗长的方法 def confusion matrix preds labels conf m sample size preds normalize preds 0 9 returns
如何动态更改 UIStoryboard 中使用的颜色

我想知道是否可以在故事板中分配动态颜色从iOS7开始您可以使用tintColor并通过keyWindow的tintColor以编程方式更改它但我找不到一种方法来影响按钮背景的色调颜色这可以让我轻松地找到一种方法来主题我的应用程
处理多种类型的 Cosmos DB 容器的读取？

我想在单个 Cosmos DB 容器中存储几种不同的对象类型因为它们都按逻辑分组并且可以按时间戳一起读取以避免额外的 HTTP 调用但是 Cosmos DB 客户端 API 似乎没有提供一种简单的方法来执行多种类型的读取到目前为止
tsql 字符串与 select 和 order by 的连接不能与 order by 子句中的函数一起使用？

考虑下面的sql create function dbo wtfunc s varchar 50 returns varchar 10 begin return left s 2 end GO select t into test from
解释 C 预处理器代码

Given define LOG OBJECT object NSLog object d object description NSString stringWithUTF8String FILE lastPathComponent LI
用户目前在哪个国家？

我在 stackoverflow 和 Google Groups 上浏览了一下但还没有真正找到这个确切问题的答案我只是想知道什么countryAndroid 手机的用户当前处于我假设如果用户仅使用 wifi TelephonyMana
代理不适用于生产中的 create-react-app

我正在使用reactjs 创建反应应用程序创建仪表板应用程序在我的应用程序中我正在调用多个主机为此我在 package json 中配置了多个代理以避免 CORS ex www app demo1 com www app demo
Xslt - 以块的形式迭代节点

我有一个现有的 xslt 脚本它使用 FOP 创建 PDF 问题是当节点计数超过一定限制时在特定节点类型上执行 apply template 时内存不足为了解决内存问题我需要将从该模板调用得出的结果分解为几个
将形状不等的数组列表转换为 Tensorflow 2 数据集：ValueError：无法将非矩形 Python 序列转换为 Tensor

我以列表的形式标记了数据形状不均 arrays array array 1179 6 208 2 1625 92 9 3870 3 2136 435 5 2453 2180 44 1 226 166 3 4409 49 6728 10 17

将形状不等的数组列表转换为 Tensorflow 2 数据集：ValueError：无法将非矩形 Python 序列转换为 Tensor

将形状不等的数组列表转换为 Tensorflow 2 数据集：ValueError：无法将非矩形 Python 序列转换为 Tensor 的相关文章

随机推荐

热门标签