有没有办法强制 Google Speech api 仅返回单词作为响应？

2024-02-23

我正在使用谷歌这个API：-

"+ language_code"& key="我的密钥"

用于语音识别，并且效果非常好。

问题在于数字，即如果我说one two three four结果将是1234如果我说one thousand two hundred thirty four结果还是1234.

另一个问题是对于其他语言，即这个词elf德语是eleven。如果你说elf结果是11，而不是精灵。

我知道我们无法控制 api，但是我们可以向此 api 添加任何参数或 hack 来强制它仅返回单词。

有时响应会产生正确的结果，但并非总是如此。

这些是示例响应

1）当我说“一二三四”时

{"result":[{"alternative":[{"transcript":"1234","confidence":0.47215959},{"transcript":"1 2 3 4","confidence":0.25},{"transcript":"one two three four","confidence":0.25},{"transcript":"1 2 34","confidence":0.33333334},{"transcript":"1 to 34","confidence":1}],"final":true}],"result_index":0}

2）当我说“一千二百三十四”时

{"result":[{"alternative":[{"transcript":"1234","confidence":0.94247383},{"transcript":"1.254","confidence":1},{"transcript":"1284","confidence":1},{"transcript":"1244","confidence":1},{"transcript":"1230 4","confidence":1}],"final":true}],"result_index":0}

我做了什么。

检查结果是否为数字，然后将每个数字按空格分开，并检查结果数组中是否存在相同的序列。在这个例子中结果 1234 变为 1 2 3 4，将搜索结果数组中是否有相似的序列，然后将其转换为单词。在第二种情况下，没有 1 2 3 4，因此将保留原始结果。

这是代码。

 String numberPattern = "[0-9]";
  Pattern r1 = Pattern.compile(numberPattern);
  Matcher m2 = r1.matcher(output);
  if (m2.find()) {
      char[] digits2 = output.toCharArray();
      String digit = "";
      for (char c: digits2) {
          digit += c + " ";
      }

      for (int i = 1; i < jsonArray2.length(); i++) {
          String value = jsonArray2.getJSONObject(i).getString("transcript");
          if (digit.trim().equals(value.trim())) {
              output = digit + " ";
          }
      }
  }

所以问题是，当我“说十三四八”时，这种方法会将 13 分成一三，因此不是一个可靠的解决方案。

Update

我尝试了新的云视觉 api (https://cloud.google.com/speech/ https://cloud.google.com/speech/）并且比 v2 好一点。结果为one two three four就语言本身而言，我的解决方法也有效。但当我说thirteen four eight仍然和 v2 中的结果相同。

而且 elf 在德语中仍然是 11 岁。

也尝试过speech_context那也没用。

看看这个问题和答案 https://stackoverflow.com/questions/39893742/google-speech-api-transcribing-spoken-numbers-incorrectly/42172599#42172599.

您可以向 API 提供“语音上下文”提示，如下所示：

"speech_context": {
  "phrases":["zero", "one", "two", ... "nine", "ten", "eleven", ... "twenty", "thirty,..., "ninety"]
 }

我想这也适用于其他语言，比如德语。

"speech_context": {
  "phrases":["eins", "zwei", "drei", ..., "elf", "zwölf" ... ]
 }

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有没有办法强制 Google Speech api 仅返回单词作为响应？的相关文章

使用 PhoneGap 使 Android 应用程序易于访问（对于残障人士）

有人有过使用 PhoneGap 使 Android 应用程序可访问的经验吗至少我们需要使我们的应用程序符合第 508 条规定我尝试实现一些标准的辅助功能文本框标签向 div 添加标题属性等但是当在 Android 中使用 Tal
在旋转时从错误的资源文件夹中提取可绘制对象

在这里拉我的头发因此我正在使用一个具有多种类型的可绘制对象的应用程序并且它们的结构如下 res Portrait resources drawable mdpi drawable hdpi drawable xhdpi Landsca
如何使用 Maven 打包并运行具有依赖项的简单命令行应用程序？

我对 java 和 Maven 都是全新的所以这可能非常简单如果我遵循maven2hello world此处的说明 http maven apache org guides getting started maven in Five m
将 Firebase 云消息传递与 Windows 应用程序结合使用

我在 Android 和 iOS 应用程序中使用 Firebase Cloud Messaging 但是我还有此应用程序的 Windows Mac OS 版本我想保留相同的逻辑我知道 Firebase Cloud Messaging 可
很好地处理数据库约束错误

再一次它应该很简单我的任务是在我们的应用程序的域对象中放置一个具有唯一约束的特定字段这本身并不是一个很大的挑战我刚刚做了以下事情 public class Location more fields Column unique tru
PhoneStateListener 不调用

这是我的完整代码广播示例 java package com example broadcast gt import android app Activity import gt android content Context import
在 Android 中调整可绘制对象的大小

我正在为进度对话框设置一个可绘制对象 pbarDialog 但我的问题是我想每次调整可绘制的大小但不知道如何调整这是一些代码 Handler progressHandler new Handler public void handleM
如何在 Java 中测试一个类是否正确实现了 Serialized（不仅仅是 Serialized 的实例）

我正在实现一个可序列化的类因此它是一个与 RMI 一起使用的值对象但我需要测试一下有没有办法轻松做到这一点澄清我正在实现该类因此在类定义中添加 Serialized 很简单我需要手动序列化反序列化它以查看它是否有效我找到了
react-native run-android 失败并出现错误：任务 ':app:dexDebug' 执行失败

我使用的是 Windows 8 1 和react native cli 1 0 0 and react native 0 31 0 添加后react native maps对于该项目我运行了命令react native upgrade并给
Android 后台服务示例，具有交互式调用方法

我不是 Android 方面的专家我正在寻找一个 Android 应用程序的示例该应用程序使用一个服务其中有真正的功能方法或者换句话说一个服务可以用来做什么我们什么时候需要它超越简单的东西服务举例我确信您渴望获得一些工作代码
有没有一种快速方法可以从 Jar/war 中删除文件，而无需提取 jar 并重新创建它？

所以我需要从 jar war 文件中删除一个文件我希望有类似 jar d myjar jar file I donot need txt 的内容但现在我能看到从 Linux 命令行执行此操作的唯一方法不使用 WinRAR Winzip
如何在 Viewpager 中禁用预加载下一页？ [复制]

这个问题在这里已经有答案了如何在 Viewpager 中禁用页面预加载 I tried viewPager setOffscreenPageLimit 0 但它不起作用用这个viewPager setOffscreenPageLimit
如何在JSTL中调用java方法？ [复制]

这个问题在这里已经有答案了这可能是重复的问题我只想调用不是 getter 或 setter 方法的方法例如 xyz 类的 makeCall someObj stringvalue Java类 Class XYZ public Strin
模块中的类无法加载

我正在开发一个 2D Unity android 游戏其中我最近添加了 Firebase Beta SDK 但添加后FirebaseAnalytics unitypackage我面临的错误是无法加载模块中的类当我删除文件夹时Fireb
Android：RecyclerView 不显示片段中的列表项

有人可以帮我尝试让我的 RecyclerView 出现吗如果我不在片段中实现它就会出现这种情况然而当我尝试将其实现到片段中时 CarFront 中的其他 XML 代码与 RecyclerView 分开显示我的日志中收到此错误 E
如何在 Android 中使用 C# 生成的 RSA 公钥？

我想在无法假定 HTTPS 可用的情况下确保 Android 应用程序和 C ASP NET 服务器之间的消息隐私我想使用 RSA 来加密 Android 设备首次联系服务器时传输的对称密钥 RSA密钥对已在服务器上生成私钥保存在服务器
spring中如何使用jackson代替JdkSerializationRedisSerializer

我在我的一个 Java 应用程序中使用 Redis 并且正在序列化要存储在 Redis 中的对象列表但是我注意到使用 RedisTemplate 会使用 JdkSerializationRedisSerializer 相反我想使用 J
为什么这个作业不起作用？

我有课Results which extends ArrayList
调整添加的绘制组件的大小和奇怪的摆动行为

这个问题困扰了我好几天我正在制作一个特殊的绘画程序我制作了一个 JPanel 并添加了使用 Paint 方法绘制的自定义 jComponent 问题是每当我调整窗口大小时所有添加的组件都会消失或者只是不绘制因此我最终会得到一个
带有 Maven Wrapper 的 Java 17 导致无法识别的 VM 选项“MaxPermSize=512m”

I use OpenJDK 17 https jdk java net 17 使用 Maven Wrapper 3 8 2 从春季初始化 https start spring io Maven项目 JAR打包 Java 17 Spring

随机推荐

提取关键属性 mongocxx

我试图通过 mongocxx 仅提取关键属性但使用 find 和 find one 函数我无法仅提取关键值 int main int char mongocxx instance inst mongocxx client conn mo
为什么在 C 中使用 atoi() 会得到这个意想不到的结果？

我不明白以下 C 代码的结果 main char s AAA advanceString s void advanceString p 3 int val atoi p printf The atoi val is d n val 这里的a
使用 FileSystemWatcher 观察 log4net 日志文件

我创建了简单的 WPF 控件来监视日志文件中的更改我使用 FileSystemWatcher 来监视特定文件我的配置 Directory System IO Path GetDirectoryName logFileFullPath F
Swift -Ounchecked 和断言

Preface 在斯威夫特中 ENABLE NS ASSERTIONS被忽略断言是打开还是关闭取决于SWIFT OPTIMIZATION LEVEL 浏览此处获取更多信息 http blog krzyzanowskim com 2015
两个多边形的最近点

我有两个多边形我想获得最小距离并测量该距离之间的点当然这样的点很可能位于两个节点之间的边缘这是一个例子我正在寻找一种算法可以给我绿色距离和两个点如果多边形不相交您可以这样做如果有多边形 A 和多边形 B 则 A i 和
在 wget 或curl 查询中使用通配符

从目录下载时是否可以在 wget 查询中使用通配符基本上我有一个网站 www download example com dir version package rpm 然而版本目录一直在变化有时包含多个RPM包是否有一个 wget
如何在有可用空间（如密度扫描仪）的 pdf 上插入图像或图章

我有一个 pdf 文件我在其中的所有页面上添加了图章但是问题是图章被添加到每个页面的左上角如果页面的该部分有文本则标记会出现在文本上我的问题是有什么方法可以阅读每一页如果该部分没有文本请添加图章否则搜索最近的可用可用空
onCreateOptionsMenu(Menu 菜单) 和 onPrepareOptionsMenu(Menu 菜单) 有什么区别？

解释一下之间的区别onCreateOptionsMenu Menu menu and onPrepareOptionsMenu Menu menu onCreateOptionsMenu 被调用一次 onPrepareOptionsMenu
如何在同一个组件中初始化和使用上下文？

我有一个名为 SortContext 的上下文我想做的是初始化这个上下文创建它的提供者然后在同一个组件中使用该上下文这可能吗例如 export default function MyComponent children const
连接两个 numpy 矩阵

如果你有两个 numpy 矩阵如何将它们连接在一起它们应该水平连接以便 0 1 0 1 1 0 1 0 4 1 4 1 0 1 0 1 例如对于这些矩阵 gt gt type X gt gt type Y gt gt X shape
Swift 可以将类/结构数据转换为字典吗？

例如 class Test var name String var age Int var height Double func convertToDict gt String AnyObject let test Test test na
React 使表格可点击并编辑详细信息

如何使表格行可单击以编辑和更新详细信息我正在从 pouchdb 检索这些详细信息我将部分代码粘贴到下面以供您评估 this state docs this db this props db componentDidMount this
计算图像中圆心的坐标

假设我有这张图像我想得到 X Y 中每个圆的中心 MatLab 有没有算法可以做到这一点只需拨打一次电话即可实现区域属性 http www mathworks nl help images ref regionprops html im
Django：检查模板中ManyToMany字段的值

我的 Django 应用程序中有以下模型 class Group models model name models CharField max length 30 users Models ManyToManyField User 在我的模
是否可以阻止远程脚本在 iframe 内加载？

我正在动态创建 iframe 并且我想阻止不是源自 iframe 来源的脚本这可能吗通过 JavaScript jQuery 例如如果我的页面加载 iframeexample com内容我想要example com要运行的脚本但我
关于函数声明中的函数指针

include
以不同（非 root）用户身份从 PHP 运行 shell 脚本

我正在尝试在 Ubuntu 服务器上从 PHP 运行非特权用户拥有的 shell 脚本权限问题使得运行它exec 不切实际因为它是www data正在运行它我用谷歌搜索了一下发现对 suExec 的各种引用对于这么小的问题来说这
测试 Selenium 的 onbeforeunload 事件

我正在尝试为网页编写一个 Selenium 测试该测试使用 onbeforeunload 事件在离开之前提示用户 Selenium 似乎无法识别出现的确认对话框或者提供点击确定或取消的方法有什么办法可以做到这一点吗我正在使用
最重要的常量和右值引用

在 C 03 中您可以使用const 将临时变量的生命周期延长到引用的生命周期的技巧或最重要的常量我的问题是在 C 0x 中这种行为是否扩展到右值引用 IEauto x someFunction 根据 class tempora
有没有办法强制 Google Speech api 仅返回单词作为响应？

我正在使用谷歌这个API language code key 我的密钥用于语音识别并且效果非常好问题在于数字即如果我说one two three four结果将是1234如果我说one thousand two hundred th

有没有办法强制 Google Speech api 仅返回单词作为响应？

有没有办法强制 Google Speech api 仅返回单词作为响应？ 的相关文章

随机推荐

热门标签

有没有办法强制 Google Speech api 仅返回单词作为响应？的相关文章