使用替代语言代码的异步语音识别响应没有语言代码

2024-01-02

我正在尝试使用新的测试版替代语言功能 https://cloud.google.com/speech-to-text/docs/multiple-languages允许在创建转录作业时提供一组语言，并返回检测到的语言以及该语言的转录结果。

当我从文档页面（同步）运行代码示例时，一切运行正常，并且检测到的语言代码在结果中返回：

from google.cloud import speech_v1p1beta1 as speech
client = speech.SpeechClient()

speech_file = 'resources/multi.wav'
first_lang = 'en-US'
second_lang = 'es'

with open(speech_file, 'rb') as audio_file:
    content = audio_file.read()

audio = speech.types.RecognitionAudio(content=content)

config = speech.types.RecognitionConfig(
    encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=44100,
    audio_channel_count=2,
    language_code=first_lang,
    alternative_language_codes=[second_lang])

print('Waiting for operation to complete...')
response = client.recognize(config, audio)

for i, result in enumerate(response.results):
    alternative = result.alternatives[0]
    print(result.language_code)  # this prints 'en-US'
    print('-' * 20)
    print('First alternative of result {}: {}'.format(i, alternative))
    print(u'Transcript: {}'.format(alternative.transcript))

但是当我尝试异步模式时，语言代码不会随结果一起返回：

from google.cloud import speech_v1p1beta1 as speech
client = speech.SpeechClient()

gs_url = 'gs://my-bucket-name/multi.wav'
first_lang = 'en-US'
second_lang = 'es'

audio = speech.types.RecognitionAudio(uri=gs_url)

config = speech.types.RecognitionConfig(
    encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=44100,
    audio_channel_count=2,
    language_code=first_lang,
    alternative_language_codes=[second_lang])

print('Waiting for operation to complete...')
operation = client.long_running_recognize(config, audio)
response = operation.result(timeout=40)

for i, result in enumerate(response.results):
    alternative = result.alternatives[0]
    print(result.language_code)  # this prints nothing! result.language_code is empty string 
    print('-' * 20)
    print('First alternative of result {}: {}'.format(i, alternative))
    print(u'Transcript: {}'.format(alternative.transcript))

尽管出现这种行为文档明确说明 https://cloud.google.com/speech-to-text/docs/multiple-languages#enabling_language_recognition_in_audio_transcription_requests:

Speech-to-Text 支持所有语音识别方法的替代语言代码：speech:recognize、speech:longrunningrecognize 和 Streaming。

关于如何为异步转录请求获取检测到的语言代码有什么想法吗？

这是我的谷歌图书馆版本 https://i.stack.imgur.com/M3Fs4.png

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

googlecloudspeech

使用替代语言代码的异步语音识别响应没有语言代码的相关文章

无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
Python 中的 Lanczos 插值与 2D 图像

我尝试重新缩放 2D 图像灰度图像大小为 256x256 所需输出为 224x224 像素值范围从 0 到 1300 我尝试了两种使用 Lanczos 插值来重新调整它们的方法首先使用PIL图像 import numpy as np
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某

随机推荐

使用 SimpleXMLElement 的大型 PHP for 循环非常慢：内存问题？

我目前有一些 PHP 代码基本上从 xml 文件中提取数据并使用创建简单的 xml 对象 products new SimpleXMLElement xmlString 然后我使用 for 循环遍历此代码在其中设置 XML 文档中每个
尝试删除 Apple 隔离区会出现错误“xattr：[Errno 2] 没有此类文件或目录”

我正在尝试从 osx 上的文件权限中删除隔离类似的起点this https superuser com questions 526920 how to remove quarantine from file permissions in
使父级 div webkit-filter 不影响子级

我正在使用一个非常奇特的 webkit 过滤器来使背景图像变成灰度并将鼠标悬停在图像上变成彩色这是过滤器 filter none webkit filter grayscale 0 transition opacity 3s ease
由于 ɵɵFactoryTarget 未定义，在 Angular 中出现错误

我最近尝试将 Angular 10 升级到 Angular 12 但是当我在浏览器中运行该项目时我在控制台中收到此错误 vendor js 55447 Uncaught TypeError Cannot read property Di
UITableView 仅反弹底部边缘

是否可以弹跳UITableView在底部但不在顶部如果是这样请告诉我代码而不是改变bounces属性我将其添加到UIScrollViewDelgate method void scrollViewDidScroll UIScrol
Leaflet.js 带有非真实世界地图！坐标

我正在用传单 JS 创建 Day Z 游戏的地图并且想要能够使用游戏中的坐标系在地图上绘制项目请参见http dayz ollieb net http dayz ollieb net 在游戏中左上角的坐标是 000 000 然后是
使用android webview在浏览器中打开外部链接

我有这段代码但不是因为它有效它一直在网络视图中打开我想要的是这些链接不属于我在默认浏览器中打开的网站任何想法谢谢 private class CustomWebViewClient extends WebViewClient Ov
如何使用NSComparator？

我想知道以下问题是否可以使用NSComparator or not 我有两个数组两者都保存数据模型我在数据模型中有一个名为Rank的属性现在我想比较两个数组并想知道其中一个是否拥有排名较高的数据模型如果是的话我想得到NSCompa
Haskell 相当于 C 的 __LINE__

有没有办法在 Haskell 中获取行号回溯信息就像C的 LINE 宏或Python的traceback extract stack 这对我编写生成 C 代码的 Haskell 程序很有用该程序将用注释来表示告诉哪个 Haskell
使用 PyUSB 通过 USB 发送数据

我需要使用 Python 通过 USB 发送数据我正在使用 PyUSB http sourceforge net apps trac pyusb 我寻找任何可用的 USB 端口并尝试发送一条消息 devList usb core fin
单击 puppeteer 中的元素后如何等待网络空闲？

单击 puppeteer 中的元素后如何等待网络空闲 const browser await puppeteer launch headless false await page goto url waitUntil networkidle
推荐一个可以处理日期和时间的 JS 日历小部件？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在开发一个网络应用程序用户需要输入日期和时间我以前用过这个日历小部件它工作得很好 http www dynarch com pr
可观察的行为和未定义的行为——如果我不调用析构函数会发生什么？

Note 我见过类似的问题但没有一个答案足够精确所以我自己问这个这是一个非常挑剔的语言律师问题我正在寻找权威的答案 C 标准说程序可以通过重用对象占用的存储空间或通过使用非平凡析构函数显式调用类类型的对象的析构函数来结束任何对
无论如何，要让（包装）NSTextField 在按回车键时写入回车符？

我想在我的应用程序中使用可能包含回车符的换行文本字段有没有什么方法可以强制 NSTextField 对象在文本区域中写入回车符而不是在按下 Return 键时将其操作发送到目标这涵盖在技术问答 QA1454 http develope
如果小于则 MIPS 汇编分支

我一直在开发一个非常基本的 MIPS 程序用于计算门票销售的一些内容我已经实现了所有功能但是当我执行 IF 语句 blt gt 如果小于则分支时我遇到了一些错误我将以下数据存储在临时寄存器中 t0 of VIP tickets
如何禁用 ion-datetime 中的特定日期？

我在用离子日期时间 https ionicframework com docs api components datetime DateTime 用于选择我的特定日期Ionic3 Angular应用我想禁用某些特定日期ion dateti
可以有多个“:root”选择器吗？

在 TWBS 4 中 bootstrap css 有一个 root带有颜色变量的选择器 Can my 子样式表还有有一个 root选择器用于我自己的变量我正在猜测 root 可以像任何其他选择器一样被覆盖和添加但我还没有找到任何讨论或
动态创建方法中的 Ruby 动态参数

我有以下类型的方法定义 method name foo method arguments bar baz method mandatory arguments quux gt true method body gt quux bar baz
JavaFX 8，带有复选框的列表视图

我想创建一个简单的ListView 我发现我可以使用 setCellFactory 方法但我不明白如何正确使用它们到目前为止我有 myListView setCellFactory CheckBoxListCell forListVie
使用替代语言代码的异步语音识别响应没有语言代码

我正在尝试使用新的测试版替代语言功能 https cloud google com speech to text docs multiple languages允许在创建转录作业时提供一组语言并返回检测到的语言以及该语言的转录结果当我从

使用替代语言代码的异步语音识别响应没有语言代码

使用替代语言代码的异步语音识别响应没有语言代码 的相关文章

随机推荐

热门标签

使用替代语言代码的异步语音识别响应没有语言代码的相关文章