在谷歌云语音API中使用增强模型

2024-03-31

我正在尝试使用 Google Speech API 上的增强模型，例如：

gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()

audio = types.RecognitionAudio(uri=gcs_uri)
config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
        language_code='en-US',
        sample_rate_hertz=48000,
        use_enhanced=True,
        model='phone_call',
        enable_word_time_offsets=True,
        enable_automatic_punctuation=True)

operation = client.long_running_recognize(config, audio)

我已在项目的“Cloud Speech API”设置中启用数据记录，以便能够使用增强模型

当我运行它时，它会抛出以下错误：

Traceback (most recent call last):   File "./transcribe.py", line 126, in <module>
    enable_automatic_punctuation=True) ValueError: Protocol message RecognitionConfig has no "use_enhanced" field.

有什么建议么？

您可以在 RecognitionConfig 类型中使用“use_enhanced”v1p1beta1包 http://google-cloud-python.readthedocs.io/en/latest/speech/gapic/v1p1beta1/types.html?highlight=use_enhanced#google.cloud.speech_v1p1beta1.types.RecognitionConfig.

为了能够运行您的示例，您只需将您的导入修改为如下所示：

import google.cloud.speech_v1p1beta1 as speech
gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()
audio = speech.types.RecognitionAudio(uri=gcs_uri)
config = speech.types.RecognitionConfig(
        encoding=speech.enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
        language_code='en-US',
        sample_rate_hertz=48000,
        use_enhanced=True,
        model='phone_call',
        enable_word_time_offsets=True,
        enable_automatic_punctuation=True)
operation = client.long_running_recognize(config, audio)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

googlecloudspeech

在谷歌云语音API中使用增强模型的相关文章

在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

如何在application.ini中设置数据库时区

我在 Zend Framework 中有一个应用程序它必须在与服务器不同的时区运行 application ini 中是否有设置数据库服务器本例中为 MySQL 时区的选项我当前的选择是 resources db adapter Pd
python的shutil.copyfile()是原子的吗？

我正在编写一个 python 脚本它使用以下命令复制文件Shutil copyfile http docs python org 2 library shutil html shutil copyfile在 Linux 上在复制过程中
在具有可变参数的函数中使用默认参数。这可能吗？

我有以下代码在这里我想利用赋予 a 的可选参数即 5 而不是 1 如何使元组数字包含的第一个元素为 1 而不是 2 def fun varargs a 5 numbers dict print Value of a is a fo
有什么理由不引用变量吗？

有没有valid为什么不将 shell 脚本中的所有变量放在引号中我认为不知道更好并不是一个有效的理由一般来说引用变量可以确保它们被视为一个变量如果它们包含空格或其他特殊字符那么为什么有人会选择不安全的方式而不引用变量呢
开玩笑：为什么它会失败并出现 TypeError: Path Must be a string。收到未定义

我编写了一个 React 应用程序并使用 jest 编写单元测试当我通过 jest config jest config json watch 运行它时出现以下错误测试套件运行失败 TypeError Path must be a s
如何检索具有一个值的所有对象数组？

这个问题是来自的后续问题this https stackoverflow com questions 17112360 php multi dimension array 17112404 noredirect 1 comment24760
Laravel 5.5 权限 - 用户没有正确的角色

我试图在管理员用户没有分配的角色的用例中找到解决方案在仪表板视图中它不会为用户呈现 url 而如果我直接访问仪表板用户我会得到 Spatie Permission Exceptions UnauthorizedException u
程序类型已存在：Ionic 上的 android.support.v4.os.ResultReceiver$MyResultReceiver

我正在用 ionic 构建应用程序我添加了 firebase 云消息一切正常但今天当我构建时显示错误离子科尔多瓦平台 rm android 删除插件清除和清理缓存删除 package lock js 尼普我 6 ionic c
渲染 PDF 不适用于产品环境

我有一个非常奇怪的问题渲染 PDF 在任何地方都可以工作但在产品上却不行开发人员和测试环境运行没有问题但生产环境却无法处理现在产品上唯一的变化比上次战争更高的 Grails 版本 2 1 0 gt 2 3 8 但是这个更改已经在
带有确认电子邮件的 ASP.NET 会员提供商

是否有任何框架库可以使用带有确认电子邮件的 ASP NET 会员提供程序可供使用几乎所有公共网站都使用标准功能找到了很好的例子 4来自 Rolla 的家伙检查 ASP NET 2 0 的成员资格角色和配置文件 https web
为什么手动重复 QuotaService.RecordEvent 时我的 Google 地图使用量显着增加

我刚刚为我的 Google 地图 API 密钥配置了 HTTP 引荐来源网址限制我在我的网站上使用地图问题是当我使用 Chrome 打开它并使用 Chrome DevTool 监视网络时我发现了一个有趣的请求 https maps g
未捕获错误：模块“AppModule”声明了意外的模块“FormsModule”。请添加@Pipe/@Directive/@Component 注解

我是 Angular 的新手我开始了英雄之旅来学习它所以我被创建了一个app component with two way捆绑 import Component from angular core export class Her
Windows 上的 Fiddler 4 证书错误

我正在使用 Fiddler 来监控我们的私人项目的 HTTPS 流量升级到 Windows 10 并安装 Fiddler 后我无法创建根证书我尝试使用 CertEnroll 和 MakeCert 但都返回无法创建根证书 09 53 5
访问 PowerPoint 加载项中的幻灯片对象

我正在构建 PowerPoint 加载项需要访问幻灯片或幻灯片对象甚至整个演示文稿唉我能看到的唯一方法就是打开一个newppt 文件现在我不得不求助于保存当前演示文稿并使用打包重新打开它来操作任何内容的黑客方法更具体地说我必
如何从 powershell 调用带有参数的 exe？

我需要在 powershell 脚本中调用可执行文件并希望等待其结果对于这个exe 我需要提供一些包含在我的变量中的参数但这不起作用 gs currentPath gs gs8 70 bin gswin32c exe outPdf ca
为什么 Scipy 的 ndimage.map_coordinates 对于某些数组没有返回任何值或返回错误的结果？

代码返回正确的值但并不总是返回值在下面的代码中 python 返回正确的插值arr b但不是为了arr a 不过我已经研究这个问题大约一天了我真的不确定发生了什么由于某种原因对于 arr a twoD interpolate 不断
Python：有没有办法将一串数字分成每第三个数字？

例如如果我有一个字符串 a 123456789876567543 我可以有一个类似的列表 123 第456章第789章第876章第567章第543章 gt gt gt a 123456789 gt gt gt int a i i
Service Worker 创建的缓存存储在下线刷新页面后消失

我正在尝试为我的网络应用程序实现离线功能但离线时我遇到了一些奇怪的行为这可能是我所缺少的因为它在 Chrome 和 Firefox 中都可以重现我将在下面描述什么示例应用程序 https github com mzenz vanis
使用node.js crypto来验证签名

我正在尝试使用 AWS lambda 来验证在 swift 中使用 sec256r1 创建的签名消息一些要签署的文本也已使用 sha256 进行哈希处理签名将采用 base64 格式 encoding MEYCIQCPfWhpzxM
在谷歌云语音API中使用增强模型

我正在尝试使用 Google Speech API 上的增强模型例如 gcs uri gs mybucket averylongaudiofile ogg client speech SpeechClient audio types Re

在谷歌云语音API中使用增强模型

在谷歌云语音API中使用增强模型 的相关文章

随机推荐

热门标签

在谷歌云语音API中使用增强模型的相关文章