服务器端语音识别[关闭]

2023-11-25

有人知道已经托管的任何好的服务器端语音识别引擎吗? IE。我希望能够调用一个简单的 Web API 来发布一些声音数据并获取文本。不一定是免费的——但希望可以自由地进行实验。


有多种 IVR 服务将整个 VOIP 会话(电话呼叫)作为一个完整的应用程序托管,而不是“按菜单点菜”提供单独的服务交易。如果您想让您的程序看起来像 VOIP 呼叫,您也许可以使用其中一些服务来完成它。

Voxeo发表了免费(且低成本)IVR 托管提供商列表面向有限使用的开发人员。毫不奇怪,所有这些都需要注册。

  • VoiceGenie Developer Workshop (absorbed into Genesys)
  • Loquendo C@fé status unknown
  • Nuance Café (Bevocal) now Nuance On-Demand
  • Plum Voice Hosting now Plum DEV
  • VOICE社区的VOICE测试中心

另一种可能性是直接询问Vlingo, Twilio, or Tropo因为他们可能会卖给你你所需要的东西。

更新:2012 年 7 月 25 日

AT&T 宣布推出语音API在 。您向其发送音频 – 它会返回 XML 或 JSON 数据格式的文本。也可以看看开发者网站.

更新:2012 年 8 月 27 日

另一种可能性是龙移动SDK来自 Nuance,它的目标客户是寻求 API 的个人开发人员,该 API 可为消费者应用程序提供语音和/或文本转语音功能。

更新:2012 年 9 月 21 日

似乎有几个新的提供商提供exactly您正在寻找什么:语音样本输入,文本输出。以下列出了可编程网络:

  • iSpeech
  • 语音API
  • OneTok
  • 思语API
  • NexiWave

另请注意Loquendo现在是 Nuance 的一部分。

更新:2013 年 6 月 27 日

AT&T 的语音 API 有一个一些有针对性的 SDK (Android、iOS、PhoneGap、Titanium、Windows) - 其中一些托管在GitHub。甚至还有Unity 3D 演示的源代码.

更新:2014 年 1 月 23 日

OneTok已将其产品重新设计为 SDKiOS and Android.

显然是声音精灵产品已被彻底消化Genesys以至于几乎找不到它的踪迹。鉴于 Genesys 面向大型企业的定位,很难知道他们是否有任何小批量或商品产品。

梅花之声似乎扩大了他们的产品范围。

和之前的许多人一样,Vlingo现在是 Nuance 的一部分。

(我尝试更新原始答案中任何损坏的链接。)

更新:2015 年 10 月 31 日

保持这个答案是最新的是一项西西弗斯式的任务。

免费(且低成本)IVR 托管提供商的 Voxeo 列表现在重定向至,完全披露,我现在在其中有实质性参与,因此,我无法在不质疑我的可信度的情况下提供几乎任何内容的链接。

也就是说,语音/NLP 市场上有很多参与者。尽职尽责。

更新:2016 年 4 月 8 日

So now 谷歌彻底颠覆了苹果购物车.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

服务器端语音识别[关闭] 的相关文章

  • 更新 AWS S3 对象密钥(密钥名称)

    我需要重命名 AWS S3 存储桶中存储的大量文件 每个文件 对象将单独重命名 基于特定标准 没有通用的 前缀 后缀 我想出了 current filename 和 new filename 的列表 它们可以作为 bat 文件 队列在 CL
  • 如何在通话过程中将语音转换为文本,并为呼叫者和呼叫接收者提供不同的文本颜色?

    我想在通话期间将语音转换为文本 我还希望文本以不同的颜色显示 呼叫发起者为红色 呼叫接收者为绿色 在测试期间 我在通话期间将语音转换为文本 但无法区分呼叫发起者的声音和呼叫接收者的声音 提前致谢 请帮帮我 None
  • 如何从音频文件中分离男声和女声(C++或Java)

    我想区分音频文件中的男声和女声并将它们分开 作为输出 我希望将两个声音分开 你能帮我一下吗 编码可以用java还是c 完成 这可能是一个非常复杂的问题 它类似于编写自己的语音识别 或识别 算法 您首先可以将音频转换为频域 这是使用快速傅立叶
  • 为什么 SpeechRecognizer 突然停止工作?

    我的 Android 应用程序 Xamarin 使用语音识别 这在 Android 8 11 和 12 的智能手机上运行良好 几周以来 我的应用程序的语音识别已停止在 Android 11 上运行 测试了 2 种不同的智能手机 在Andro
  • Terraform - 我应该使用 user_data 还是 Provisioner 来引导资源?

    看来我可以使用user data使用模板文件或 远程执行 provisioner使用内联命令进行引导 那么哪一个被认为更惯用呢 你应该使用user data The 用户数据 http docs aws amazon com AWSEC2
  • 如何隐藏 toast 消息“您的音频将发送到谷歌以提供语音识别服务。”在安卓中?

    我正在使用谷歌语音识别器在 Android 中集成语音服务 但是当按下麦克风按钮时 会显示这条烦人的 toast 消息 请建议我一种隐藏此 toast 消息的方法 这是我的java代码 public class FormActivity e
  • 何时应使用以下各项:Amazon EC2、Google App Engine、Microsoft Azure 和 Salesforce.com? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我是在非常普遍的意义上问这个问题 无论是从云提供商还是云消费者的角度来看 此外 问题不针对任何特定类型的应用程序 实际上 目的是了解哪种类型的应
  • 语音识别和语调检测

    我想做一个 iOS 应用来计算疑问句 我会寻找 WH 问题以及 我会吗 格式化问题 我对语音或音频技术领域不太了解 但我Google了一下 发现语音识别SDK很少 但仍然不知道如何检测和绘制语调 是否有支持语调或情感语音识别的 SDK 据我
  • 如何从 JavaScript 使用 Opus 编解码器

    我想看看是否可以使用直接访问 OpusgetUserMedia或最新浏览器中的任何类似内容 我对此进行了很多研究 但没有取得好的结果 我知道 Opus 或 Speex 实际上用于webkitSpeechRecognitionAPI 我想做语
  • 从 Google 语音识别中删除脏话审查

    我正在尝试使用 Google 的语音到文本 API 在 iOS 应用程序中将语音转换为文本 我只是将一些音频数据发送到 URL 并且它返回了我所说的 大部分 正确的单词 但是 它用 替换了任何脏话 我如何用实际的咒语替换 只是一些附加信息
  • 可扩展性和弹性有什么区别?

    我听说很多人交替使用这两个术语 但在我看来 它们之间还是有区别的 可扩展性 的能力软件系统在其当前硬件资源上处理更大的工作负载 scale up 或当前和额外的硬件资源 向外扩展 应用程序服务不中断 弹性 的能力硬件层下面 通常是云基础设施
  • 如何在Python程序中嵌入Google Speech to Text API? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个项目 在其中创建了客户端和主机之间的聊天程序 并且我必须在其中嵌入语音到文本 有什么方法可以在
  • 用于存储应用程序用户机密的 Azure Key Vault 机密

    在我的应用程序中 我必须存储用户的非常敏感的数据 例如其他第三部分服务的各种密码 用户填写一个表格 向我们提供第三部分服务的登录名和密码 该应用程序的目标是使用从 100 多个输入生成的 powershell 脚本来设置其他复杂系统 需要将
  • 使用 get/post 的免费云数据存储? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我知道还有其他类似的键 值存储http openkeyval org http openkeyval o
  • 将网站部署到云服务的最佳实践

    在云服务上部署多个网站的最佳实践是什么 我有三个网站 是否可以将这三个网站部署到一个云服务中 一个云服务三个实例 或者我是否必须创建三个云服务并单独部署每个网站 谢谢 我的服务定义文件
  • 语音识别和声音与音乐的比较

    我正在尝试制作一个具有语音识别功能的 Android 应用程序 但不幸的是谷歌不支持我的语言 马其顿语 并且我正在尝试比较两个录音声音 我在用着http code google com p musicg http code google c
  • 文本转语音无法在 Android 设备上运行

    下面是我的代码 我无法在 Kitkat 设备中听到声音 Toast 出现 但声音没有播放 我正在遵循本教程 https www tutorialspoint com android android text to speech htm ht
  • 不断收到错误消息,表示 localhost 的 Server App Engine Standard 无法启动

    当尝试在 Eclipse 中启动 Google 应用程序引擎项目时 我不断收到错误消息 指出本地主机上的服务器应用程序引擎标准无法启动 错误日志如下 以前有人遇到过这个问题吗 问题的原因是什么 WARNING An illegal refl
  • 我怎样才能用Python中的语音识别来检测一个单词

    我知道如何用 Python 检测语音 但这个问题更具体 如何让 Python 只监听一个单词 然后如果 Python 可以识别该单词则返回 True 我知道 我可以让 Python 一直监听 然后做出类似的东西 伪代码 while True
  • iPhone 上的语音识别

    我需要开发一个识别语音的 iPhone 应用程序 并根据结果执行进一步的任务 我知道iPhone 3 0不支持语音识别 我需要在服务器端实现语音识别软件 我只知道这个事情 因为我是新手 所以我不知道如何处理 意味着我需要购买哪些软件并在服务

随机推荐

  • Reflection API 是否破坏了数据封装的初衷?

    最近我遇到了 Reflection API 令我惊讶的是我们可以访问甚至更改私有变量 我尝试了以下代码 import java lang reflect Field public class SomeClass private String
  • 常见的 Lisp 错误:“应该是 lambda 表达式”

    几天前我刚刚开始学习 Common Lisp 我正在尝试构建一个将数字插入树中的函数 我收到一个错误 SYSTEM EXPAND FORM CONS NIL LST 应该是 lambda 表达式 通过谷歌搜索 似乎当你有太多括号时就会发生这
  • 如何为应用程序图标提供没有数字的通知徽章?

    Apple 的本地和推送通知编程指南第 7 页上有一张 iPhone 桌面的屏幕截图 其中一个应用程序图标有一个不包含数字的徽章 它只是纯红色 怎么可能做到这一点呢 我认为当前的通知 API 无法实现您想要做的事情 如果要在应用程序图标上显
  • WebAPI StreamContent 与 PushStreamContent

    我正在实施一个MVC4 WebAPI 版本的 BluImp jQuery 文件上传在我最初的尝试中 一切都运行良好 但我试图确保在下载非常大的文件 2GB 时充分利用内存 我读了Filip Woj 关于 PushStreamContent
  • 在android studio中打开和导入项目的区别

    在android studio中打开和导入项目有什么区别 有没有一种方法可以从命令行导入项目或进行导入项目时完成的所有设置 OPEN是打开已经在Android Studio中运行的现有项目 IMPORT用于将项目从其他环境迁移到 Andro
  • 允许 hgsubversion SVN 克隆推迟所需的步骤

    我所在的团队主要使用 SVN 而我更喜欢在可能的情况下使用 Mercurial 我使用 hgsubversion 设置了 SVN 存储库的 hg 克隆 并且几个基本的拉取 提交 推送似乎运行良好 现在 经过 2 周的本地开发 在此期间 我合
  • javascript中的继承,“父”中的变量

    我是第一次做 OO javascript 我读过有关继承和原型的内容 并认为我已经破解了它 直到我发现了这个小例子 function TestObject data this test array this clone array this
  • 在 Liquid/Jekyll 中对日期格式进行排序(例如“1st”、“3rd”和“4th”)

    是否可以在 Liquid 或 Jekyll 中的日期格式中添加月份后缀 例如 1 月 23 日或 5 月 18 日 我已经提到了Shopify 维基 但我很惊讶地发现那里没有格式 当然应该有这么简单的事情吗 Liquid 模板引擎Jekyl
  • Sql Server 2008 的更改通知

    我有一个由数据库和多个服务组成的应用程序 其中一项服务将信息添加到数据库 由用户触发 另一项服务定期查询数据库以了解更改 并使用新数据作为处理的输入 到目前为止 我使用了一个可配置的计时器 每 30 秒左右查询一次数据库 我读到了有关 Sq
  • 如何将多模块maven项目组装成一个WAR?

    类似问题here 我想从 3 个不同的 Maven 模块中部署一个生成的 WAR 战争模块绝对不冲突 第一个包含 Java 类和一些 WEB INF artifacts 第二个只是 API 接口 必须已经存在于容器中或者是由此产生的战争的一
  • 大约一天后,Service Broker 消息开始挂起

    我有一个使用 Service Broker 的应用程序是 SQL 2008 大约每天一次 数据库的性能开始受到明显的影响 我确定这是由 Service Broker 造成的 如果我使用以下命令硬重置所有代理连接 ALTER DATABASE
  • 获取可排序 jQuery 中拖动列表项的 ID

    我有这个html ul li First li li Second li li Third li ul 和这个 sortable jQuery function listofpages sortable 如何获取被拖动元素的id 在 的里面
  • 从 IEnumerable 转换为列表 [重复]

    这个问题在这里已经有答案了 我想转换自IEnumerable
  • 如何设置 eclipse.ini -vm 选项?

    我安装了Maven插件Eclipse 然后我收到如下错误 请确保 eclipse ini 中的 vm 选项指向 JDK 我该如何使用 vm在 eclipse ini 中选择指向我的 JDK 我的解决方案是 vm D work Java jd
  • 使用 PHP 将 jpg 图像转换为 gif、png 和 bmp 格式

    如何使用 PHP 将单个 jpg 图像转换为 3 种不同的图像格式 gif png 和 bmp 您首先从文件中创建一个图像对象imagecreatefromjpeg 然后 您将该对象转储为不同的格式 使用图像gif 例如 imageObje
  • 使用 ng-repeat 进行 Angularjs 表排序

    我有一个 HTML 表格 想要对我的记录进行排序 scope records在 ctrl 中 通过单击表标题 scope headers在 ctrl 中 任何人都可以解释为什么它有效 th a headers 0 a th th a hea
  • git 预提交钩子代码格式化与部分提交?

    有没有办法有一个预提交钩子来自动格式化代码 对于 示例与astyle 但是确实not销毁部分提交 工作流程 edit a file txt git add p file txt add one chunk but not another g
  • 如何在 Swift 中获得 Bool 的相反值?

    我的具体情况是我正在尝试切换导航栏的隐藏和显示 let navHidden self navigationController navigationBarHidden self navigationController setNavigat
  • iOS - 如何发出 SOAP 请求并接收关注响应

    我知道网络上有很多关于 如何在 iOS 中使用 SOAP 的内容 但我仍然未能遵循 SOAP 请求和响应 非常感谢帮助 我用的是简单的NSURLConnection用于请求和响应 SOAP 请求 POST asmx HTTP 1 1 Hos
  • 服务器端语音识别[关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 有人知道已经托管的任何好的服务器端语音识别引擎吗 IE 我希望能够调用一个简单的 Web API 来发布一些声音数据并获取文本 不一定是免费的 但希