服务器端语音识别[关闭]

2023-11-25

有人知道已经托管的任何好的服务器端语音识别引擎吗？ IE。我希望能够调用一个简单的 Web API 来发布一些声音数据并获取文本。不一定是免费的——但希望可以自由地进行实验。

有多种 IVR 服务将整个 VOIP 会话（电话呼叫）作为一个完整的应用程序托管，而不是“按菜单点菜”提供单独的服务交易。如果您想让您的程序看起来像 VOIP 呼叫，您也许可以使用其中一些服务来完成它。

Voxeo发表了免费（且低成本）IVR 托管提供商列表面向有限使用的开发人员。毫不奇怪，所有这些都需要注册。

VoiceGenie Developer Workshop (absorbed into Genesys)
Loquendo C@fé status unknown
Nuance Café (Bevocal) now Nuance On-Demand
Plum Voice Hosting now Plum DEV
VOICE社区的VOICE测试中心

另一种可能性是直接询问Vlingo, Twilio, or Tropo因为他们可能会卖给你你所需要的东西。

更新：2012 年 7 月 25 日

AT&T 宣布推出语音API在。您向其发送音频 – 它会返回 XML 或 JSON 数据格式的文本。也可以看看开发者网站.

更新：2012 年 8 月 27 日

另一种可能性是龙移动SDK来自 Nuance，它的目标客户是寻求 API 的个人开发人员，该 API 可为消费者应用程序提供语音和/或文本转语音功能。

更新：2012 年 9 月 21 日

似乎有几个新的提供商提供exactly您正在寻找什么：语音样本输入，文本输出。以下列出了可编程网络:

iSpeech
语音API
OneTok
思语API
NexiWave

另请注意Loquendo现在是 Nuance 的一部分。

更新：2013 年 6 月 27 日

AT&T 的语音 API 有一个一些有针对性的 SDK (Android、iOS、PhoneGap、Titanium、Windows） - 其中一些托管在GitHub。甚至还有Unity 3D 演示的源代码.

更新：2014 年 1 月 23 日

OneTok已将其产品重新设计为 SDKiOS and Android.

显然是声音精灵产品已被彻底消化Genesys以至于几乎找不到它的踪迹。鉴于 Genesys 面向大型企业的定位，很难知道他们是否有任何小批量或商品产品。

梅花之声似乎扩大了他们的产品范围。

和之前的许多人一样，Vlingo现在是 Nuance 的一部分。

（我尝试更新原始答案中任何损坏的链接。）

更新：2015 年 10 月 31 日

保持这个答案是最新的是一项西西弗斯式的任务。

免费（且低成本）IVR 托管提供商的 Voxeo 列表现在重定向至，完全披露，我现在在其中有实质性参与，因此，我无法在不质疑我的可信度的情况下提供几乎任何内容的链接。

也就是说，语音/NLP 市场上有很多参与者。尽职尽责。

更新：2016 年 4 月 8 日

So now 谷歌彻底颠覆了苹果购物车.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Cloud

SpeechRecognition