使用 Google Speech 时从 Google Cloud Storage 访问音频文件

2024-05-10

我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 .wav 文件，并将其转换为文本。

但我想访问另一个 .wav 文件，该文件已放置在 Google Cloud Storage（公开）上，而不是本地硬盘上。为什么不简单地改变

speech_file = 'my/local/system/sample.wav'

to
speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'

工作可以接受吗？

这是我的代码：

speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'

DISCOVERY_URL = ('https://{api}.googleapis.com/$discovery/rest?'
                 'version={apiVersion}')


def get_speech_service():
    credentials = GoogleCredentials.get_application_default().create_scoped(
        ['https://www.googleapis.com/auth/cloud-platform'])
    http = htt|plib2.Http()
    credentials.authorize(http)

    return discovery.build(
        'speech', 'v1beta1', http=http, discoveryServiceUrl=DISCOVERY_URL)

def main(speech_file):
    """Transcribe the given audio file.

    Args:
        speech_file: the name of the audio file.
    """
    with open(speech_file, 'rb') as speech:
        speech_content = base64.b64encode(speech.read())

    service = get_speech_service()
    service_request = service.speech().syncrecognize(
        body={
            'config': {
                'encoding': 'LINEAR16',  # raw 16-bit signed LE samples
                'sampleRate': 44100,  # 16 khz
                'languageCode': 'en-US',  # a BCP-47 language tag
            },
            'audio': {
                'content': speech_content.decode('UTF-8')
                }
            })
    response = service_request.execute()
    return response

我不确定为什么你的方法不起作用，但我想提供一个快速建议。

Google Cloud Speech API 本身支持 Google Cloud Storage 对象。不必下载整个对象然后将其上传回 Cloud Speech API，只需通过交换此行来指定对象即可：

        'audio': {
            # Remove this: 'content': speech_content.decode('UTF-8')
            'uri': 'gs://speech_proj_files/sample.wav'  # Do this!
            }

另一项建议。您可能会发现谷歌云 https://googlecloudplatform.github.io/google-cloud-python/Python 库更易于使用。尝试这个：

from google.cloud import speech
speech_client = speech.Client()

audio_sample = speech_client.sample(
    content=None,
    source_uri='gs://speech_proj_files/sample.wav',
    encoding='LINEAR16',
    sample_rate_hertz= 44100)
results_list = audio_sample.sync_recognize(language_code='en-US')

这里有一些很好的例子：https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Audio

googlecloudstorage

googlespeechapi

使用 Google Speech 时从 Google Cloud Storage 访问音频文件的相关文章

将声音图形化地表示为波

我创建了一个记录和播放声音的应用程序我正在寻找一种显示简单波形的方法记录声音的表示不需要动画只需一个简单的图表如果可以选择波的子集也很好当然更好也播放该部分总而言之我正在寻找什么一种以图形方式将录制的声音表示为波的方法
播放选定的音频，同时暂停/重置其他音频

我有两个通过按钮的单击事件播放的音频元素如果选择了另一个元素我已成功地暂停其中一个元素但还需要将暂停元素设置回 0 0 秒即暂停和重置我知道 Javascript 目前没有stop 导致的方法假设这将通过设置其来完成current
Google Cloud Storage (GCS) 中的文件数量有限制吗？

我相信不应该有任何限制但只是想确认一下官方文档中没有提及 Google Cloud Storage GCS 中的文件数量有限制吗如果 GCS 中有大量文件是否会对性能访问和写入操作产生影响文件名长度是否有限制因为我可以使用文
使用 Android 播放任意音调

有没有办法让Android发出任意频率的声音意思是我不想预先录制声音文件我环顾四周音调发生器 http developer android com reference android media ToneGenerator html
Android SoundPool 堆限制

我正在使用 SoundPool 加载多个声音剪辑并播放它们据我所知它的功能 100 正确但在 load 调用期间我的日志中充斥着以下内容 06 09 11 30 26 110 ERROR AudioCache 23363 Heap
在我的Android中，当其他应用程序想要录制音频时如何停止录音？

在我的应用程序中服务通过 AudioRecord 持续录制音频当我的应用程序运行时其他与音频记录相关的应用程序例如 Google 搜索无法工作如何知道何时有其他应用想要录制音频以便我可以停止录制以释放资源答案是MediaRe
使用到达时间差对信号进行三边测量

我在寻找或实现寻找信号源的算法时遇到一些麻烦我的工作目标是找到声音发射器的位置为了实现这一点我使用了三个麦克风我正在使用的技术是多点定位这是基于到达时间差 The 到达时间差使用发现每个麦克风之间互相关接收到的信号我已经实现了算法
Java - 无缝改变循环剪辑的音量？

我有一个循环剪辑我像这样改变音量 clip stop clip flush FloatControl fc FloatControl clip getControl FloatControl Type MASTER GAIN fc set
如何通过 HTML 按钮播放声音

我目前通过网站播放音乐的方法是通过 HTML 音频标签不过我希望能够通过 HTML 按钮来播放它该按钮应该能够在播放和停止之间切换音乐我在 JSFiddle 创建了一个示例但不知道如何实现它有人可以告诉我如何使用我的 JSFidd
如何让 JavaScript 发出蜂鸣声？

我希望我的网页在用户超出我的最大字符限制时发出蜂鸣声
html 可嵌入 flash wav 播放器

我需要一个可在 IE FF 和 Chrome 中播放 wav 文件的嵌入式音频播放器目前无法转换为 mp3 或任何其他格式该播放器应该非常简单只有一个播放暂停按钮也许还有一个时间轴栏用户可以单击该时间轴栏来转到音频的特定部分还
如何更改Firebase默认存储桶？

我有2个存储桶一个来自Google云存储一个由firebase创建 firebase创建的存储桶是默认的我想更改默认存储桶并删除firebase创建的存储桶您无法从 Firebase 控制台执行此操作您需要转到 Google Cl
使用 VBScript 切换当前活动声音设备？

我想在连接到我的计算机 Windows 7 32 位的两个音频设备之间切换我看了一下question https stackoverflow com questions 35709 change active sound card on
如何让位置音频在 SceneKit 中工作？

我在使位置音频在 SceneKit 中工作时遇到问题从 Xcode 生成的 SceneKit 游戏模板开始我将以下代码添加到handleTap 方法的末尾 let ship scnView scene rootNode childNod
使用react-native测量音频的响度

我正在创建一个应用程序 Android 来使用本机反应录制手机中的语音一项要求是实时测量声音的响度并基于它制作动画我尝试使用react native audio库但问题是响度监控仅在IOS中支持我检查了世博会音频库但找不到方法有
网络音频 API 和多输入麦克风设备

我有一个带有 4 个输入麦克风的音频设备有谁知道我是否可以通过 Web 音频 API 使用所有这些输入截至 2023 年 6 月 17 日这在基于 chromium 的浏览器中是不可能的这是一个问题 453876 https bug
如何用Java捕获音频数据

我想访问我的麦克风用 Java 录制的音频数据我该怎么做呢我的目标是保存录制的音频数据并同时向用户播放如果您不需要 JMF 中的任何附加功能我会避免使用它因为开发已经停止最后一个版本是 2004 年它与 Java 6 存在兼容
使用 Javascript/Web Audio API 访问/处理系统音频

是否可以使用 Web Audio API 访问系统音频以便对其进行可视化或应用均衡器看起来可以将系统音频连接到 Web Audio API 可以访问的输入设备即Web Audio API 获取声卡的输出 https stackover
如何禁用 WebBrowser 控件中的点击声音

我使用 Javascript 单击网络浏览器控件中的链接但我不想听到IE的咔哒声有什么办法可以做到这一点吗 P S 我不想更改系统设置我见过这个如何仅在您的应用程序中禁用网络浏览器点击声音 https stackoverflo
使用javascript上传到谷歌云存储签名的url

使用以下代码我可以上传到谷歌云存储中的公共可写存储桶 allUsers有写权限但是如果存储桶不可公开写入则会收到 401 未经授权的错误我不希望存储桶可公开写入 var file scope myFile var fileData

随机推荐

使用 Financial Modeling Prep (Python) 访问指定时间间隔的所有历史加密数据

Financial Modeling Prep 是一个免费的 API 可用于访问各种财务指标例如股票价格和加密货币数据 API 文档概述了如何通过 Python 等编程语言访问数据特别是对于加密货币数据 https financialm
如何在操作表中添加日期选择器？

IBAction showCatPicker if self catList nil self catList nil catList release self catList NSMutableArray alloc init self
在 solr 8 中的 fl 中使用父过滤器时获取“当架构嵌套时不应发送父过滤器”

我正在尝试使用子文档获取父文档但得到当模式嵌套时不应发送父过滤器 error 附上下面我尝试过但无法得到解决方案的查询 q parent which content type person fl child parentFilter c
在源代码管理中管理我的数据库

由于我正在处理一个新的数据库项目在 VS2008 中而且我从未从头开始开发数据库因此我立即开始研究如何在源代码管理在本例中为 Subversion 中管理数据库我找到了一些关于SO的信息包括这篇文章保持多个环境中的开发数据库同
在 jinja2 模板中转义 jinja2 语法

我在 Flask 中提供来自 Jinja2 模板的动态页面现在我在脚本标记内定义客户端模板比如 Jinja2 clone Nunjucks 问题是客户端模板的语法如下 that Flask sJinja2 解释器可以解释而不是渲染v
同一 Kinesis 流的多个不同消费者

我有一个 Kinesis 生产者它将单一类型的消息写入流我想在多个完全不同的消费者应用程序中处理这个流因此对于给定的主题流具有单个发布者的发布订阅我还想利用检查点来确保每个消费者处理写入流的每条消息最初我为所有消费者和生
嵌套 ng 网格？

我们可以制作一个嵌套的 ng grid 像这样的事情有可能吗这是笨蛋 http plnkr co edit hYuFfxLR38LA0clIkF48 p preview http plnkr co edit hYuFfxLR38LA0c
使用 htmlpurifier 将具有 of 类的元素列入白名单

我只想仅当 span 元素在 htmlpurifier 中具有特定类时才允许它有谁知道该怎么做现在我有 config gt set HTML Allowed a href p ol li ul img src blockquote em
Sharepoint 上的 WebPart 在本地下载文件 - 我需要将其发送到客户端

请帮助我在使用 Sharepoint 站点的计算机上下载文件而不是在具有 Sharepoint 服务器的计算机上 public class WebClientBL static WebClient client new WebClient
在自动热键中检测活动的镀铬配置文件

我有 2 个 google chrome 配置文件 1 个用于工作 1 个用于个人使用有时我会同时打开这两个配置文件并且我希望我的 ahk 脚本仅在特定配置文件窗口处于焦点时运行所以我查找了一些示例并制作了如下测试脚本 IfWinA
角度观察周期或摘要周期完成时如何调用函数

在 Angular 完成所有监视周期后有什么方法可以调用 Angular 中的自定义函数要求我的控制器内有多种手表功能现在我只想在所有手表函数都由角度执行后才执行函数摘要完成后有几种方法可以注册回调 Using postDige
npm ENOSELF 错误 - 在其 gh-pages 分支中安装包

我想使用 Lib 本身为 GitHub 上的 JS Lib 编写一些文档我创建了一个名为的空分支gh pages并开始构建文档页面现在我需要使用我正在记录的库编写一些 Javascript 因为谁不会使用自己的库我尝试通过安装它npm
如何将多行标签 xml 文件转换为 dataframe

我有一个包含多个行标签的 xml 文件我需要将此 xml 转换为正确的数据帧我使用了spark xml 它只处理单行标签 xml数据如下
是否有用于通过 HTTP、HTTP 隧道发送二进制数据的 Java 库？

我想通过 HTTP 以二进制格式发送相当大的数据块也称为HTTP 隧道 http en wikipedia org wiki HTTP tunnel 我想通过 Java 将这种技术用于一些 Java Swing 应用程序也可能是 And
当 DataSource 更改时 ComboBox 不会自动更新？

由于某种原因当从数据源一个简单的 BindingList 添加或删除项目时组合框会相应更新但如果我编辑这样的项目它不会自动更新 myBindingList index Name NewName myBindingList inde
合并两个对象数组并根据对象内部存在的键更新对象

我有两个数组对象 array1 和 array2 我想根据键名合并数据 array1 name adam data name eve data child secondchild array2 name adam data
使用SMT-LIB使用公式计算模块数量

我不确定使用 SMT LIB 是否可以做到这一点如果不可能是否存在可以做到这一点的替代求解器考虑方程 a lt 10 and a gt 5 b lt 5 and b gt 0 b lt c lt a with a b and c整数
Delphi XE 中的数据绑定向导 - 可以将其配置为映射到 MSXML 接口吗？

Delphi XE 中的数据绑定向导生成继承自 Delphi 自己的 DOM ADOM XML v4 实现的类和接口它似乎不支持针对模式进行验证解析时验证选项仅适用于 MSXML 供应商type 从 VCL 源代码以及 IDE 中 X
Codeigniter - 检查用户是否已登录并存在（它是真实用户）

我正在尝试在用户登录我的网站时为他们设置会话数据因此如果用户存在于数据库中我将设置一个会话数据例如 this gt session gt set userdata user exists 1 现在每次我想检查用户是否存在并已登录时
使用 Google Speech 时从 Google Cloud Storage 访问音频文件

我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 wav 文件并将其转换为文本但我想访问另一个 wav 文件该文件已放置在 Google Cloud Storage 公开上而不是本地硬盘上为什么不简单地

使用 Google Speech 时从 Google Cloud Storage 访问音频文件

使用 Google Speech 时从 Google Cloud Storage 访问音频文件 的相关文章

随机推荐

热门标签

使用 Google Speech 时从 Google Cloud Storage 访问音频文件的相关文章