python 中的 SpeechRecogniton 模块太慢

2023-12-02

我试图对我的深度学习聊天机器人使用语音识别来获取用户的输入。实际上我的语音识别功能代码是这样的：

def get_audio():
    r = sr.Recognizer()

    with sr.Microphone() as source:
        r.pause_threshold = 1
        r.adjust_for_ambient_noise(source, duration=1)
        audio = r.listen(source)
        said = ""

        try:
            print("Listening...")
            said = r.recognize_google(audio)
            print("You said: " + said)
        except Exception as e:
            print("Exception: " + str(e))

    return said.lower()

嗯，没有错误，这才是最大的错误！我的互联网连接没有问题，因为我可以同时传输高质量的视频，而且这甚至不是视频，它是一个字符串，那么可能是什么问题？我等了将近 15 分钟才收到短信。

嗯，我也尝试过离线 API：recognize_sphinix()方法。您需要构建 pocketsphinix 的二进制安装文件（whl）。哦，我忘了提，你还需要在你的机器上构建 pyaudio 才能使用语音识别。我已经完成了所有这些工作，即使这个离线 API 也有同样的问题......早上recognize.sphinix()认出了我所说的 2-3 倍，但现在，它甚至没有回应！

NOTE:我用任务管理器监控我的电脑，只运行语音识别功能，Python 仅占用 9MB 的 RAM 和 0.3% 的 CPU 使用率。所以算力有限是没有问题的。

有人能解决这个问题吗？如果你解决了这个令人头疼的问题，我就会很高兴。提前致谢！

持续时间参数现已弃用。参考号StackOverflow问题.
而是使用phrase_time_limit or timeout.

这是使用的代码块phrase_time_limit:

import speech_recognition as sr
def myCommand():
    r = sr.Recognizer()
    with sr.Microphone() as source:
        audio = r.listen(source, phrase_time_limit = 5)  
    try:
        command = r.recognize_google(audio).lower()
        print("you said: " + command)
        
    except sr.UnknownValueError:
        print("Sorry, Cant understand, Please say again")
        command = myCommand()
    return command

这工作得很好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

SpeechRecognition

python 中的 SpeechRecogniton 模块太慢的相关文章

尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
使用Python开发Web应用程序

我一直在用 python 做一些工作但这都是针对独立应用程序的我很想知道 python 的任何分支是否支持 Web 开发有人还会建议一个好的教程或网站吗我可以从中学习一些使用 python 进行 Web 开发的基础知识既然大家都说
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

在 iPhone 上将 .caf 转换为 .mp3

有没有办法使用以下方法将我录制的 caf 文件转换为 mp3 iPhone SDK 核心音频还有其他吗我已经环顾了一段时间但我发现的只是一个命令行实用程序不允许在 iPhone 上运行 Regards 由于iPhone不应该真正用于
如何使用 GDK 检查 Google Glass 是否连接到互联网

有没有办法在运行时检测 Google Glass 是否连接到互联网例如在我的应用程序中使用语音输入时我经常收到现在无法联系 Google 的消息相反我想先发制人地拦截会导致该消息的条件并使用默认值而不是要求语音输入经过一段时间
从 R 中的数字中删除逗号

我的数字有表示 1 000 及以上 R 将其视为因子我想将两个这样的变量从因子切换为数字实际上这两个变量都是数字但出于某种原因 R 将它们视为因子数据是从 Excel 导入的更改因子变量mydata x1对于数字变量我使用以下
java 中更好的 Html Builder [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我想要低于输出 table tbody thead Blah Blah table Header Constant Part thead tr so
单击按钮时反应获取数据

我正在尝试在反应中获取数据问题是我必须单击按钮两次才能获取该数据虽然我在第一次单击时没有获取数据但如果我向其中添加 JSON stringify 它会以某种方式呈现如果我不添加 JSON stringify 它会返回未定义如果有人
依赖属性上的 XAML 绑定

我目前正在开发 WPF TimePicker 控件该控件继承了一个 TextBox 它有一个 MaskedTexProvider 它以以下格式显示 TimeSpan HH MM 到目前为止一切都按预期工作向上和向下箭头更改基础 Tim
在 RecyclerView 中发布 ExoPlayer

我正在 RecyclerView 中实现 ExoPlayer 但滚动时视频会停止但音频不会停止如何在RecyclerView中释放ExoPlayer 或者我怎样才能获得回收对象的位置以便我能够释放 ExoPlayer 这是我的数据对象
System.Data.Entity.DbContext 找不到添加为引用

当我去构建我的项目时我收到此错误类型 System Data Entity DbContext 是在未引用的程序集中定义的您必须添加对程序集 EntityFramework Version 5 0 0 0 Culture neutra
如何更改 Oracle 中视图的列大小

我正在尝试使用与表相同的命令来更改视图的列大小例如 alter table STUDENT modify ROLL NO VARCHAR2 80 但它的抛出错误 SQL 错误 ORA 00942 表或视图不存在那么我们如何改变视图的列大
注册到活动的 Google 发布商代码

我查看了 Google 发布商代码参考并决定可以向我的广告位添加一些事件如果我只定义了一个插槽它会非常有效如果我添加更多插槽事件会在我的控制台上不断重复我有插槽的次数所以如果我做这样的事情
如何使用 javascript 展开和折叠
？

我在我的网站上创建了一个列表该列表是由 foreach 循环创建的该循环使用我的数据库中的信息构建每个项目都是一个包含不同部分的容器因此这不是像 1 2 3 等这样的列表我列出了带有信息的重复部分每个部分都有一个小节一般构建如
C++ 大数算术

我正在开发一个用于大数算术的类它现在知道如何进行加法处理 cin 和 cout 然而它的减法功能非常有限且基本并且不知道如何处理负数但这很容易解决我的问题是如何进行乘法运算我将在这里详细介绍它如何处理 cin 和 cout
将本地 Sourcetree 存储库恢复为 master

我是 Sourcetree 的新手在本地造成了混乱与 origin master 相比有 7 个提前提交我想忽略并删除我在本地完成的所有操作然后通过将本地存储库恢复到当前的 origin master 来重新开始我该怎么做呢 R
DIV 汇编的错误答案

我有我的代码的一部分 mov di 3 mov cx 16 looop xor dx dx shl bx 1 adc dx dx cmp cx 16 je cx16 it s will dec cx and jump loop push d
更改 ggplot 因子颜色

我注意到这里盒须图电话 p geom boxplot aes fill factor cyl 为箱线图填充生成明亮的红色绿色蓝色同时 p geom boxplot aes fill factor vs 产生独特的浅绿色红色在我的数
如何获取链接到耶拿资源的资源列表？

我使用 Jena API 创建了一个模型 public static void main String args Model model ModelFactory createDefaultModel Resource alice Reso
iOS - 从后台自动打开应用程序

是否可以以某种方式从后台模式重新打开应用程序例如如果后台应用程序正在检查服务器中的某些标志然后触发时它会自动转到前台吗如果没有我可以显示一条消息并播放声音以供用户请求重新打开应用程序吗例如 WhatsApp 如何实现这一目标
C#中有指数运算符吗？

例如是否存在可以处理此问题的操作员 float Result Number1 Number2 Number1 2 Number2 2 Result Number1 operator Number2 过去的运算符在其他语言中充当指数运算符
如何在 Jenkins 中为工件添加时间戳

我关注了 Jenkisfile 并且正在尝试上传带有时间戳的工件 import groovy transform Field Field def timeStamp Calendar getInstance getTime format Y
python 中的 SpeechRecogniton 模块太慢

我试图对我的深度学习聊天机器人使用语音识别来获取用户的输入实际上我的语音识别功能代码是这样的 def get audio r sr Recognizer with sr Microphone as source r pause thres

python 中的 SpeechRecogniton 模块太慢

python 中的 SpeechRecogniton 模块太慢 的相关文章

随机推荐

热门标签

python 中的 SpeechRecogniton 模块太慢的相关文章