在谷歌云语音API中使用增强模型

2024-03-31

我正在尝试使用 Google Speech API 上的增强模型,例如:

gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()

audio = types.RecognitionAudio(uri=gcs_uri)
config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
        language_code='en-US',
        sample_rate_hertz=48000,
        use_enhanced=True,
        model='phone_call',
        enable_word_time_offsets=True,
        enable_automatic_punctuation=True)

operation = client.long_running_recognize(config, audio)

我已在项目的“Cloud Speech API”设置中启用数据记录,以便能够使用增强模型

当我运行它时,它会抛出以下错误:

Traceback (most recent call last):   File "./transcribe.py", line 126, in <module>
    enable_automatic_punctuation=True) ValueError: Protocol message RecognitionConfig has no "use_enhanced" field.

有什么建议么?


您可以在 RecognitionConfig 类型中使用“use_enhanced”v1p1beta1包 http://google-cloud-python.readthedocs.io/en/latest/speech/gapic/v1p1beta1/types.html?highlight=use_enhanced#google.cloud.speech_v1p1beta1.types.RecognitionConfig.

为了能够运行您的示例,您只需将您的导入修改为如下所示:

import google.cloud.speech_v1p1beta1 as speech
gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()
audio = speech.types.RecognitionAudio(uri=gcs_uri)
config = speech.types.RecognitionConfig(
        encoding=speech.enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
        language_code='en-US',
        sample_rate_hertz=48000,
        use_enhanced=True,
        model='phone_call',
        enable_word_time_offsets=True,
        enable_automatic_punctuation=True)
operation = client.long_running_recognize(config, audio)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在谷歌云语音API中使用增强模型 的相关文章

随机推荐