InvalidArgumentError:输入必须是向量,形状为:[]

2023-12-05

我正在尝试使用保存文本数据的嵌入universal sentence encoder在 pandas dataframe 新列中但出现错误。

这就是我正在尝试做的事情。

module_url = "https://tfhub.dev/google/universal-sentence-encoder/4" #@param ["https://tfhub.dev/google/universal-sentence-encoder/4", "https://tfhub.dev/google/universal-sentence-encoder-large/5"]
model = thub.load(module_url)
print ("module %s loaded" % module_url)
def embed(input):
    return model(input)

then

for t in list(df['title'].str.strip().iteritems()):
     df['new'] = np.array(embed(t[1]))

这是为了最终转换 df['title'] 列值,这些值是此处的文本,并嵌入到字典中。 {'how are you?':embedding但两者都无法做到。

出现如标题所示的错误。

InvalidArgumentError                      Traceback (most recent call last)
<ipython-input-26-79969d6e031c> in <module>
      1 for t in list(df['title'].str.strip().iteritems()):
----> 2      df['new'] = np.array(embed(t[1]))
      3 

<ipython-input-7-c4fca4bebab0> in embed(input)
      3 print ("module %s loaded" % module_url)
      4 def embed(input):
----> 5     return model(input)

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\saved_model\load.py in _call_attribute(instance, *args, **kwargs)
    436 
    437 def _call_attribute(instance, *args, **kwargs):
--> 438   return instance.__call__(*args, **kwargs)
    439 
    440 

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\def_function.py in __call__(self, *args, **kwds)
    566         xla_context.Exit()
    567     else:
--> 568       result = self._call(*args, **kwds)
    569 
    570     if tracing_count == self._get_tracing_count():

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\def_function.py in _call(self, *args, **kwds)
    604       # In this case we have not created variables on the first call. So we can
    605       # run the first trace but we should fail if variables are created.
--> 606       results = self._stateful_fn(*args, **kwds)
    607       if self._created_variables:
    608         raise ValueError("Creating variables on a non-first call to a function"

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\function.py in __call__(self, *args, **kwargs)
   2361     with self._lock:
   2362       graph_function, args, kwargs = self._maybe_define_function(args, kwargs)
-> 2363     return graph_function._filtered_call(args, kwargs)  # pylint: disable=protected-access
   2364 
   2365   @property

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\function.py in _filtered_call(self, args, kwargs)
   1609          if isinstance(t, (ops.Tensor,
   1610                            resource_variable_ops.BaseResourceVariable))),
-> 1611         self.captured_inputs)
   1612 
   1613   def _call_flat(self, args, captured_inputs, cancellation_manager=None):

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\function.py in _call_flat(self, args, captured_inputs, cancellation_manager)
   1690       # No tape is watching; skip to running the function.
   1691       return self._build_call_outputs(self._inference_function.call(
-> 1692           ctx, args, cancellation_manager=cancellation_manager))
   1693     forward_backward = self._select_forward_and_backward_functions(
   1694         args,

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\function.py in call(self, ctx, args, cancellation_manager)
    543               inputs=args,
    544               attrs=("executor_type", executor_type, "config_proto", config),
--> 545               ctx=ctx)
    546         else:
    547           outputs = execute.execute_with_cancellation(

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\tensorflow_core\python\eager\execute.py in quick_execute(op_name, num_outputs, inputs, attrs, ctx, name)
     65     else:
     66       message = e.message
---> 67     six.raise_from(core._status_to_exception(e.code, message), None)
     68   except TypeError as e:
     69     keras_symbolic_tensors = [

c:\users\sujee\desktop\environments\projectnlp\lib\site-packages\six.py in raise_from(value, from_value)

InvalidArgumentError:  input must be a vector, got shape: []
     [[{{node StatefulPartitionedCall/StatefulPartitionedCall/text_preprocessor/tokenize/StringSplit/StringSplit}}]] [Op:__inference_restored_function_body_5286]

Function call stack:
restored_function_body

张量流新手,所以不知道如何解决这个问题。

这是一些 numpy 数组值(embeddings) 打印时生成print(np.array(embed(t[1]))).

https://paste.pythondiscord.com/pigaqumuha.py


保存的代码embeddings文本数据使用universal sentence encoder in pandas dataframe New列以及输出如下所示:

import tensorflow_hub as hub
import tensorflow as tf

embed = hub.load("https://tfhub.dev/google/universal-sentence-encoder-large/5")
embeddings = embed([ "The quick brown fox jumps over the lazy dog.", "I am a sentence for which I would like to get its embedding"])
print(embeddings)

import pandas as pd

data = [ ["The quick brown fox jumps over the lazy dog."], ["I am a sentence for which I would like to get its embedding"]]

df = pd.DataFrame(data, columns = ['Title'])
print(df)

df['New'] = list(tf.keras.backend.eval(embeddings))
print(df)

输出如下所示:

tf.Tensor(
[[ 0.01305107  0.02235125 -0.03263275 ... -0.00565093 -0.0479303
  -0.11492757]
 [ 0.05833393 -0.0818501   0.06890941 ... -0.00923877 -0.08695354
  -0.01415738]], shape=(2, 512), dtype=float32)

enter image description here

enter image description here

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

InvalidArgumentError:输入必须是向量,形状为:[] 的相关文章

  • python 2.7模块pandas未安装“无法导入名称哈希表”

    我尝试在论坛 谷歌上寻找这个问题的答案 但我找不到任何东西 我的问题是这样的 来自 python 控制台 gt gt gt import pandas cannot import name hashtable Traceback most
  • 当时间为 00:00 时,Pandas 读取 excel 返回类型对象

    在更新版本的 Pandas 中 我使用的是 1 2 3 当从 Excel 文件读取时间时 时间为 00 00 00 时会出现问题 下面的脚本 其中 filepath 是我的 Excel 文件的路径 其中包含一个标题名为 Time 的列 im
  • 如何使用 python 从嵌套表结构中识别最终父级?

    我有下表 我的问题是 我如何以编程方式识别最终父级 以下是通过示例解释的规则 the id 5 0的父母是51 0 身份证号51 0没有父母 因此 id5 0的最终父级是51 0 the id 6 0的父母是1 0 身份证号1 0的父母是1
  • 如何使用 Python Pandas 制作 DataFrame 切片并在特定切片中“fillna”?

    问题 让我们从 Kaggle 获取泰坦尼克号数据集 我有包含 Pclass 性别 和 年龄 列的数据框 我需要用特定组的中位数填充 年龄 列中的 NaN 如果是来自一等的女性 我想用一等女性的中位数填写她的年龄 而不是整个年龄列的中位数 问
  • 有人可以简单解释一下自然语言处理的要素吗?

    我是自然语言处理的新手 对所使用的术语感到困惑 什么是代币化 POS 标签 实体识别 标记化只是将文本分割成可以有意义的部分或为这些部分赋予含义 以及含义 当我确定某物是名词 动词或形容词时 它的名字是什么 如果我想分为日期 姓名 货币呢
  • 如何在Python中获取声音级别?

    对于我正在进行的项目 我需要获取麦克风的实时分贝级别 我见过阴谋家 Print out realtime audio volume as ascii bars import sounddevice as sd import numpy as
  • 对多索引进行排序,同时尊重其索引结构

    如何在尊重级别组织的同时对多索引数据框进行排序 例如 鉴于以下df 假设我们根据C 例如按降序排列 C D E A B bar one 0 346528 1 528538 1 three 0 136710 0 147842 1 flux s
  • 对于多列,将当前行和上一行的差异附加到新列

    对于 df 中的每一列 我想从前一行 row n 1 row n 中减去当前行 但我遇到了困难 我的代码如下 usr bin python3 from pandas datareader import data import pandas
  • Python 类型提示:typing.Mapping 与typing.Dict

    我正在开发一个 python 项目 我们使用typing整个模块类型提示 看来我们用的是typing Dict and typing Mapping几乎可以互换 有理由选择其中一种而不是另一种吗 我自己设法回答了这个问题 typing Di
  • pandas 替换多个值

    以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
  • 为 pandas 数据透视表中的每个值列定义 aggfunc

    试图生成具有多个 值 列的数据透视表 我知道我可以使用 aggfunc 按照我想要的方式聚合值 但是如果我不想对两列求和或求平均值 而是想要一列的总和 同时求另一列的平均值 该怎么办 那么使用 pandas 可以做到这一点吗 df pd D
  • 从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

    我有一个清单 things A1 B2 C3 我有一个 pandas 数据框 其中有一列包含用分号分隔的值 某些行将包含与上面列表中的一项的匹配 它不会是完美的匹配 因为它在其中包含字符串的其他部分 该列 例如 该列中的一行可能有 哇 这里
  • 交换keras中的张量轴

    我想将图像批次的张量轴从 batch size row col ch 交换为 批次大小 通道 行 列 在 numpy 中 这可以通过以下方式完成 X batch np moveaxis X batch 3 1 我该如何在 Keras 中做到
  • python pandas 中的双端队列

    我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
  • 如何将交互式 matplotlib 图形插入 tkinter 画布

    我正在尝试将交互式 matplotlib 图形 具有滑块 重置按钮和单选按钮的图形 放入 tkinter Canvas 中 我已成功添加非交互式图表 但当它变为交互式时找不到问题 我尝试将所有内容更改为使用 matplotlib Figur
  • 在tensorflow.js中对张量进行分区、屏蔽或过滤

    我有 2 个相同长度的张量 data and groupIds 我想分开data通过相应的值分成几组groupId 例如 const data tf tensor 1 2 3 4 5 const groupIds tf tensor 0 1
  • Python 3 中“map”类型的对象没有 len()

    我在使用 Python 3 时遇到问题 我得到了 Python 2 7 代码 目前我正在尝试更新它 我收到错误 类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
  • VSCode:调试配置中的 Python 路径无效

    对 Python 和 VSCode 以及 stackoverflow 非常陌生 直到最近 我已经使用了大约 3 个月 一切都很好 当尝试在调试器中运行任何基本的 Python 程序时 弹出窗口The Python path in your
  • 对输入求 Keras 模型的导数返回全零

    所以我有一个 Keras 模型 我想将模型的梯度应用于其输入 这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
  • 使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

    我有一个 Pandas 数据框 它有两列 一列 进程参数 列 包含字符串 另一列 值 列 包含相应的浮点值 我需要过滤出部分匹配列 过程参数 中的一组键的子数据帧 并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce

随机推荐

  • 使用 Polymer 扩展原生 HTML 元素

    您好 我想使用 Polymer 从本机 HTML 元素进行扩展 以创建自定义 Web 组件 当我不延伸时 我的聚合物就绪回调被调用 一旦我延长 就不再有人打电话了 虽然正在创建元素的影子 DOM 这是我的用法代码
  • 使用 JDBC 的 NLS_DATE_FORMAT

    我尝试在jdbc中设置NLS DATE FORMAT 但似乎没有任何效果 我的代码 Connection conn ods getConnection Statement stat conn createStatement stat exe
  • 尝试创建多个 JLabel,但只出现一个

    我正在尝试创建多个相同形式的 JLabel 然后尝试将它们添加到同一个 JPanel 中 然而 只出现了一个 JLabels 我不明白为什么 这是我写的代码 final JPanel labelPanel new JPanel new Bo
  • API 响应显示带有 PUT/PATCH 请求的过时数据

    我正在使用 Django REST 框架开发 API 就我而言 我使用嵌套序列化器 所以我需要覆盖 update method 这是所需的描述 序列化器 配置串行器 class DeviceConfigSerializer serializ
  • 在 Linux 中的 jvm 中查找硬和软打开文件限制(ulimit -n 和 ulimit -Hn)

    我有一个问题 我需要从 java groovy 程序中找出 Linux 中进程的硬打开和软打开文件限制 当我从终端执行 ulimit 时 它会给出硬打开文件限制和软打开文件限制的单独值 ulimit n 1024 ulimit Hn 409
  • Firebase 云消息传递:FCM 令牌过期

    据我所知 如果发生以下情况之一 FCM 令牌会自行更新 应用程序删除实例ID 该应用程序已在新设备上恢复 用户卸载 重新安装应用程序 用户清除应用程序数据 App端可以使用以下方法来监控Token更新 监控代币生成 每当生成新令牌时都会触发
  • 有没有什么不显眼的方法来挂钩 jQuery 方法的触发器?

    我想知道是否有任何不显眼的方法来挂钩 attr data css 等方法并调用自定义触发器 理想情况下 我可以做这样的事情 friend a bind attr changed changed data function e alert T
  • Android:图像按钮或按钮在按下时突出显示效果

    当我按下这些时left and right arrow button当时我想在按钮上看到这些类型的效果 同样的事情发生在Iphone IOS默认情况下 我可以做出这种效果吗 在这里我提到了我想要的图片 在这里我使用了这个 xml 文件但没有
  • 加载 Google LineChart 动画

    我正在尝试通过添加行和刷新图表来使用过渡动画来实现图表的加载动画 但它的表现与我的预期完全不同 这是小提琴http jsfiddle net jATUX 一些代码 google load visualization 1 packages c
  • 连接/组合 MX1 numpy 数组与 MXN numpy 数组

    required time stamps包含 5911 个时间戳 time based mfcc feature包含 5911 个样本 每个样本具有 20 个 mfcc 特征 所以如果你要看看time based mfcc feature它
  • Mysql 存储过程中循环内的 Select 语句

    我们可以在 Mysql 存储过程的循环中使用 Select 语句吗 为什么代码错误 create procedure AbsentReportproc INOUT fromdate DATETIME INOUT todate DATETIM
  • 如何阻止仅针对 favicon 的 HTTP 请求? [复制]

    这个问题在这里已经有答案了 每个人都知道如何在 HTML 中设置 favicon ico 链接 但愚蠢的是 我们只需要一个几个字节的小图标另一个可能影响速度的 HTTP 请求 所以我想知道 如何使该图标成为可用精灵的一部分 例如 backg
  • MVC4中基于模型值的控件创建

    在我的数据库中 我有一个名为 control id 的列 其中包含 1 2 3 4 等值 基于这个值 我必须生成文本框 下拉列表和复选框等控件 例如 如果我的 control id 为 1 则必须生成文本框 如果为 2 则必须生成下拉列表等
  • 有没有一种简单的方法可以按值删除列表元素?

    我想从列表中删除一个值 如果它存在于列表中 也可能不存在 a 1 2 3 4 b a index 6 del a b print a 上面给出了错误 ValueError list index x x not in list 所以我必须这样
  • 从 SOAP 安全标头获取 X 509 证书

    大家好 我有一个用于 cxf Web 服务 spring 应用程序 的简单存根客户端 它使用 WSS4JOutInterceptor 与action Signature 因此 soap 请求消息是 标头 Content Type text
  • AttributeError:“NoneType”对象没有属性“grid_remove”

    我只用 Tkinter 做了一点工作 我喜欢使用它 但与任何类型编程一样 它需要时间来学习 我正在尝试创建一个简单的待办事项列表 最终将保存在文件中 但我无法删除第 17 行中的按钮并将下一行的按钮替换到不同的位置 from tkinter
  • 在特定列中使用范围查找方法

    我已经对此进行了一段时间的修改 我有下面的代码可以工作 但它的搜索量超出了我的预期 我希望它只搜索 C 列而不是整个工作表 我尝试过改变Cells Find to Range C1 C10000 Find但它不返回任何匹配项 真的被这个难住
  • 如何使用 ksoap 2 对 Web 服务调用强制执行超时?

    我需要向使用 ksoap 2 连接到 Web 服务的 J2ME 应用程序添加超时 我已经尝试过描述为可能的伪超时的方法http ksoap2 sourceforge net doc api org ksoap2 transport Http
  • 从子窗体访问父窗体上的控件

    我想从子表单更改父表单文本框中的文本 我设置了文本框 修饰符 公共 我在父窗体中额外编写了一个函数 public TextBox txtbox get return mybox set mybox value 以儿童形式书写 this Pa
  • InvalidArgumentError:输入必须是向量,形状为:[]

    我正在尝试使用保存文本数据的嵌入universal sentence encoder在 pandas dataframe 新列中但出现错误 这就是我正在尝试做的事情 module url https tfhub dev google uni