将语音输出解析为 JSON 以调用应用程序 API

2023-12-06

这是一个想法：

我们有带有公开的 Restful API 的 Web 应用程序，它接受 json。现在，如何使用 Google 语音 API 获取用户语音输入，将其转换为文本，然后以某种方式将该文本转换为 API 所需的 JSON，然后使用 JSON 调用这些应用程序 APIe？有没有。将文本翻译为指定的 JSon 格式的库？有人用过这种方法吗？

这称为“意图分析”。有这样的库，例如RASA

例如，您输入的是“显示中国餐馆”。输出将是

{
  "text": "show me chinese restaurants",
  "intent": "restaurant_search",
  "entities": [
    {
      "start": 8,
      "end": 15,
      "value": "chinese",
      "entity": "cuisine"
    }
  ]
}

总的来说，它是相当先进的 NLU。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

artificialintelligence

SpeechRecognition

将语音输出解析为 JSON 以调用应用程序 API 的相关文章

数独求解算法 C++

我花了几天时间尝试制作一个数独解决程序但我被这些方法所困扰我在这里找到了这个算法但我不太理解它从第一个空单元格开始并在其中输入 1 检查整个板子看看是否有冲突如果板上存在冲突请将当前单元格中的数字加 1 因此将 1 更改为
如何跟踪语速

我正在开发一个跟踪语速的 iPhone 应用程序并希望使用 Nuance Speechkit https developer nuance com public Help DragonMobileSDKReference iOS Spee
我自己的 Python OCR 程序

我还是一个初学者但我想写一个字符识别程序这个程序还没有准备好而且我编辑了很多所以评论可能不完全一致我将使用 8 个连通性来标记连通分量 from PIL import Image import numpy as np im Ima
Android 语音识别服务在 <= Ice Cream Sandwich 上速度慢得多

我有一个正在实现 RecognitionListener 的服务如下所示 Android 语音识别作为 Android 4 1 和 4 2 上的服务 https stackoverflow com questions 14940657 a
理解含义的算法[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想知道是否有任何特定的算法可以遵循
在 scikit-learn Pipeline 中插入或删除步骤

是否可以删除或插入步骤sklearn pipeline Pipeline object 我正在尝试在 Pipeline 对象中有或没有一步进行网格搜索想知道我是否可以在管道中插入或删除一个步骤我看到在Pipeline源代码有一个sel
以编程方式比较图像 - lib 或类 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
浏览器上的连续语音识别，例如“ok google”或“hey siri”

我正在做一个 POC 我的要求是我想实现这样的功能OK google or Hey Siri在浏览器上我正在使用 Chrome 浏览器Web speech api 我注意到我无法继续识别因为它会在一段时间后自动终止而且我知道出于安全考
帮助--LibSVM 的准确率达到 100%？

名义上这是一个好问题但我很确定这是因为发生了一些有趣的事情作为上下文我正在研究面部表情识别空间中的一个问题因此获得 100 的准确度似乎令人难以置信并不是说在大多数应用程序中这是合理的我猜测数据集中存在一些一致的偏差这使得
如何从 JavaScript 使用 Opus 编解码器

我想看看是否可以使用直接访问 OpusgetUserMedia或最新浏览器中的任何类似内容我对此进行了很多研究但没有取得好的结果我知道 Opus 或 Speex 实际上用于webkitSpeechRecognitionAPI 我想做语
Q-learning 和价值迭代有什么区别？

Q learning 与强化学习中的值迭代有何不同我知道 Q learning 是无模型的训练样本是过渡 s a s r 但是既然我们知道 Q 学习中的转换和每个转换的奖励那么它与基于模型的学习不一样吗在基于模型的学习中我们知道
C# - 捕获 RTP 流并发送到语音识别

我正在努力实现的目标在 C 中捕获 RTP 流将该流转发到 System Speech SpeechRecognitionEngine 我正在创建一个基于 Linux 的机器人它将接受麦克风输入将其发送给 Windows 机器 Wi
人体的宽度和高度

如何识别图像中人体的高度和宽度你需要一些参考点除非您知道相机设置位置变焦镜头畸变等以及人相对于相机的位置否则简单的照片是不够的如果您确实有参考例如背景中的网格或其他东西那么您可以测量网格并从那里开始听起来不像你需要的
Javascript 使事件点击和语音识别与多个按钮一起工作

所以我正在使用 webkitSpeechRecognition 并且它工作得很好但问题是我想同时在多个地方使用它当我将它添加到页面上的另一个部分时它无法正常工作这是它自己工作的情况 var final transcript var
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
如何在GPU支持下运行python代码

我创建了一个 Flask 服务用于接受以相机 URL 作为参数的请求用于在相机框架中查找对象桌子椅子等我已经在 Flask 中编写了用于接受 POST 请求的代码 app route rest detectObjects meth
飞船推进AI：控制飞船在x=0、v=0时着陆的力

我必须编写 AI 代码来控制游戏中宇宙飞船的许多推进喷气机为简单起见令空间为一维宇宙飞船是一个点只有 1 架喷气机规则与问题 Let x v and a是飞船的位置速度加速度 Let F是施加在船上的喷射力我知道质量m宇宙飞
Rasa core 和 Rasa nlu 之间的区别

我试图理解之间的区别拉莎核心 https core rasa ai and Rasa NLU https nlu rasa ai installation html从官方文档看的但我不太明白我的理解是Rasa core用于引导对话流程
如何组合多个朴素贝叶斯分类器的输出？

我是新来的我有一组使用 Sklearn 工具包中的朴素贝叶斯分类器 NBC 构建的弱分类器我的问题是如何结合每个 NBC 的输出来做出最终决定我希望我的决定是基于概率而不是标签我用 python 编写了以下程序我假设 sklean
极小极大算法

我有一个关于 Minimax 算法的简单问题例如对于 tic tac toe 游戏如何确定每个玩家玩的效用函数它不会自动执行此操作是吗我必须对游戏中的值进行硬编码它无法自己学习它们不是吗不 MiniMax 不会学习它是暴

随机推荐

如何自动将合约程序集包含在 nupkg 中？

我刚刚开始使用 nuget 为我们公司的内部库创建一些包该库由许多程序集组成其中许多具有从代码合同生成的合同引用程序集我用的是最简单的nuget pack方法就是传入csproj文件路径让它解析项目之间的所有依赖关系问题是它不包
WPF：“ApplicationCommands.New”在 MenuItem 的情况下显示不正确的源

我是 WPF 新手正在查看 net 4 5 中的 Professional WPF 示例在命令章节中有一个示例多个控件可以发送相同的命令我使用按钮复选框和菜单项来触发新建命令我面临的问题是如果第一次按下 MenuItem
从 javascript 对象数组中删除一些属性

我想从 javascript 对象数组中删除一些属性这是对象数组 obj array DATA ID 1 DATA NAME Jim DATA BB TYP 2 DATA MAC 5474 DATA ID 3 DATA NAME Fro
如何使用默认 R 安装通过 conda 安装 rpy2

我在 Ubuntu Linux 上使用 Anaconda Python 发行版并希望在 IPython 笔记本中使用 R 魔法有没有办法使用 conda 发行版安装 rpy2 并使用我当前在 usr bin R 的默认 R 安装我的目
codeigniter 在 find_in_set 中添加 IS NULL

通过生成查询时代码点火器框架 this gt db gt select id memo sent to sent by read by date gt from memos gt where FIND IN SET 1 sent to gt
Zxing有时会从条形码中获取错误的数据

我知道这可能是一个相当简单的问题我们还可以设置 Zxing 扫描的条形码格式如下所示 1 intent putExtra SCAN MODE QR CODE MODE or any other format 如果我们这样做 2 inte
什么时候优化为时过早？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我看到这个词用得很多但我
Xcode 5：代码签名权利错误

我已经构建了一个支持 IOS 7 的新应用程序我获得了新的 XCode 5 GM 并尝试使用我的新配置文件和分发证书来签署我的应用程序但我在分发时遇到了问题我不断收到以下错误无效的代码签名权利您的应用程序中的权利包签名与包含在包
拆分一列字符向量并返回一个列表

我有以下内容数据框 df lt data frame Sl No c 1 6 Variable c a a b a b c b c b c Sl No Variable 1 a 2 a b 3 a b c 4 b 5 c 6 b c 我想将
os/exec StdoutPipe 带颜色

我正在制作一个包装纸我的世界使用 Go 的服务器控制台它使用 os exec 运行服务器和 process StdoutPipe 以获取子进程的实时输出但是由于某种原因我无法让它显示颜色当我直接从终端运行服务器时颜色可以工作但当
如何忽略包含在我的yarn.lock 文件中的包？

因此在我的 package json 中我有一堆 npm 库以及一个从 git ssh url 拉入的私有存储库该存储库需要始终是最新版本该yarn lock添加了git sha和yarn升级等不会获取最新的基本上鉴于此 de
如何通过 Socket 连接接收大数据流 - 没有 TCPClient

我有一个问题我想通过 SocketConnection 发送一个大字符串但我无法立即接收该字符串因为网络限制为 1500 字节那么如何在不使用 TCPClient 的情况下通过 Socket 接收所有字节或者这是不可能的 publ
如何在类路径中使用嵌入表达式

我试图将文件的绝对值传递给类路径的读取函数如果我传递绝对路径和类路径它就可以正常工作但是当我传递嵌入表达式时它不起作用我的代码如下 Scenario create swagger first RAD 给定 url 应用服务器给定参
在 PrintDialog 中以编程方式选择打印机

我在 Windows 窗体中有一个 Web 浏览器控件它加载一个 HTML 文件我希望能够为用户提供将其另存为 PDF 文件的选项如果用户安装了 CutePDF Writer 那么我想我可以通过编程方式从打印对话框中选择它并将其另存为
jQuery 中的 this 和 $(this) 有什么区别？

jQuery 中的 this 和 this 有什么区别我什么时候应该使用哪个 p each function this id this attr id 如果您考虑上面的函数 jQuery 将循环访问页面上的每个段落元素并通过将 this
如何可靠地猜测 MacRoman、CP1252、Latin1、UTF-8 和 ASCII 之间的编码 [重复]

这个问题在这里已经有答案了在工作中似乎每周都会遇到一些与编码相关的忧虑灾难或灾难该问题通常源于程序员认为他们可以在不指定编码的情况下可靠地处理文本文件但你不能因此决定从今以后禁止文件名以以下结尾 txt or text 人们
错误“‘git’未被识别为内部或外部命令”

我安装了 Windows 版 Git 但是当我尝试使用git命令提示符中的命令我收到以下错误 git is not recognized as an internal or external command operable progra
是否可以从列表中的项目获取索引？

我的意思是我有一个列表框我将列表放入 itemsSource 属性中我还想显示它的绑定中的索引我不知道这在 WPF 中是否可行谢谢有几种方法可以做到这一点包括使用 AlternationIndex 的一些解决方法但是由于我
iOS，将文件从收件箱文件夹复制到文档路径

我启用了文档类型以将文件从其他应用程序导入或复制到我的应用程序我有一些疑问 1 应该在哪里创建将文件从收件箱移动到文档目录的方法这是正确的地方吗 func applicationWillEnterForeground applicati
将语音输出解析为 JSON 以调用应用程序 API

这是一个想法我们有带有公开的 Restful API 的 Web 应用程序它接受 json 现在如何使用 Google 语音 API 获取用户语音输入将其转换为文本然后以某种方式将该文本转换为 API 所需的 JSON 然后使用

将语音输出解析为 JSON 以调用应用程序 API

将语音输出解析为 JSON 以调用应用程序 API 的相关文章

随机推荐

热门标签