python 中的 SpeechRecogniton 模块太慢

2023-12-02

我试图对我的深度学习聊天机器人使用语音识别来获取用户的输入。实际上我的语音识别功能代码是这样的:

def get_audio():
    r = sr.Recognizer()

    with sr.Microphone() as source:
        r.pause_threshold = 1
        r.adjust_for_ambient_noise(source, duration=1)
        audio = r.listen(source)
        said = ""

        try:
            print("Listening...")
            said = r.recognize_google(audio)
            print("You said: " + said)
        except Exception as e:
            print("Exception: " + str(e))

    return said.lower()

嗯,没有错误,这才是最大的错误!我的互联网连接没有问题,因为我可以同时传输高质量的视频,而且这甚至不是视频,它是一个字符串,那么可能是什么问题?我等了将近 15 分钟才收到短信。

嗯,我也尝试过离线 API:recognize_sphinix()方法。 您需要构建 pocketsphinix 的二进制安装文件(whl)。 哦,我忘了提,你还需要在你的机器上构建 pyaudio 才能使用语音识别。我已经完成了所有这些工作,即使这个离线 API 也有同样的问题......早上recognize.sphinix()认出了我所说的 2-3 倍,但现在,它甚至没有回应!

NOTE:我用任务管理器监控我的电脑,只运行语音识别功能,Python 仅占用 9MB 的 RAM 和 0.3% 的 CPU 使用率。所以算力有限是没有问题的。

有人能解决这个问题吗?如果你解决了这个令人头疼的问题,我就会很高兴。提前致谢!


持续时间参数现已弃用。参考号StackOverflow问题.
而是使用phrase_time_limit or timeout.

这是使用的代码块phrase_time_limit:

import speech_recognition as sr
def myCommand():
    r = sr.Recognizer()
    with sr.Microphone() as source:
        audio = r.listen(source, phrase_time_limit = 5)  
    try:
        command = r.recognize_google(audio).lower()
        print("you said: " + command)
        
    except sr.UnknownValueError:
        print("Sorry, Cant understand, Please say again")
        command = myCommand()
    return command

这工作得很好。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python 中的 SpeechRecogniton 模块太慢 的相关文章

  • 尽管极其懒惰,但如何在 Python 中模拟 IMAP 服务器?

    我很好奇是否有一种简单的方法来模拟 IMAP 服务器 例如imaplib模块 在Python中 without做很多工作 是否有预先存在的解决方案 理想情况下 我可以连接到现有的 IMAP 服务器 进行转储 并让模拟服务器在真实的邮箱 电子
  • 使用Python开发Web应用程序

    我一直在用 python 做一些工作 但这都是针对独立应用程序的 我很想知道 python 的任何分支是否支持 Web 开发 有人还会建议一个好的教程或网站吗 我可以从中学习一些使用 python 进行 Web 开发的基础知识 既然大家都说
  • SQL Alchemy 中的 NULL 安全不等式比较?

    目前 我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较 其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
  • 如何使用 Scrapy 从网站获取所有纯文本?

    我希望在 HTML 呈现后 可以从网站上看到所有文本 我正在使用 Scrapy 框架使用 Python 工作 和xpath body text 我能够获取它 但是带有 HTML 标签 而且我只想要文本 有什么解决办法吗 最简单的选择是ext
  • Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

    据我了解 distinct 哈希分区 RDD 来识别唯一键 但它是否针对仅移动每个分区的不同元组进行了优化 想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上 所有重复键
  • Python tcl 未正确安装

    我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
  • __del__ 真的是析构函数吗?

    我主要用 C 做事情 其中 析构函数方法实际上是为了销毁所获取的资源 最近我开始使用python 这真的很有趣而且很棒 我开始了解到它有像java一样的GC 因此 没有过分强调对象所有权 构造和销毁 据我所知 init 方法对我来说在 py
  • 如何使用装饰器禁用某些功能的中间件?

    我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
  • 从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

    我有一个清单 things A1 B2 C3 我有一个 pandas 数据框 其中有一列包含用分号分隔的值 某些行将包含与上面列表中的一项的匹配 它不会是完美的匹配 因为它在其中包含字符串的其他部分 该列 例如 该列中的一行可能有 哇 这里
  • 使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

    问题是当我尝试启动应用程序 app py 时 我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效 整个文件app py coding utf 8 from flask
  • python pandas 中的双端队列

    我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
  • 在pyyaml中表示具有相同基类的不同类的实例

    我有一些单元测试集 希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求 但测试属于不同的套装 结果有不同的父类 这是我所拥有的示例 gt gt gt rz shorthand for
  • 当玩家触摸屏幕一侧时,如何让 pygame 发出警告?

    我使用 pygame 创建了一个游戏 当玩家触摸屏幕一侧时 我想让 pygame 给出类似 你不能触摸屏幕两侧 的错误 我尝试在互联网上搜索 但没有找到任何好的结果 我想过在屏幕外添加一个方块 当玩家触摸该方块时 它会发出警告 但这花了很长
  • Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

    我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它 而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
  • 如何从没有结尾的管道中读取 python 中的 stdin

    当管道来自 打开 时 不知道正确的名称 我无法从 python 中的标准输入或管道读取数据 文件 我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
  • 从 Python 中的类元信息对 __init__ 函数进行类型提示

    我想做的是复制什么SQLAlchemy确实 以其DeclarativeMeta班级 有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
  • 循环标记时出现“ValueError:无法识别的标记样式 -d”

    我正在尝试编码pyplot允许不同标记样式的绘图 这些图是循环生成的 标记是从列表中选取的 为了演示目的 我还提供了一个颜色列表 版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
  • 协方差矩阵的对角元素不是 1 pandas/numpy

    我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
  • Python - 字典和列表相交

    给定以下数据结构 找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出 我可以将列表 不是 dict1 组织到任何其他数
  • PyAudio ErrNo 输入溢出 -9981

    我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

  • 在 iPhone 上将 .caf 转换为 .mp3

    有没有办法使用以下方法将我录制的 caf 文件转换为 mp3 iPhone SDK 核心音频 还有其他吗 我已经环顾了一段时间 但我发现的只是一个命令行实用程序 不允许在 iPhone 上运行 Regards 由于iPhone不应该真正用于
  • 如何使用 GDK 检查 Google Glass 是否连接到互联网

    有没有办法在运行时检测 Google Glass 是否连接到互联网 例如 在我的应用程序中使用语音输入时 我经常收到 现在无法联系 Google 的消息 相反 我想先发制人地拦截会导致该消息的条件并使用默认值而不是要求语音输入 经过一段时间
  • 从 R 中的数字中删除逗号

    我的数字有 表示 1 000 及以上 R 将其视为因子 我想将两个这样的变量从因子切换为数字 实际上这两个变量都是数字 但出于某种原因 R 将它们视为因子 数据是从 Excel 导入的 更改因子变量mydata x1对于数字变量 我使用以下
  • java 中更好的 Html Builder [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 我想要低于输出 table tbody thead Blah Blah table Header Constant Part thead tr so
  • 单击按钮时反应获取数据

    我正在尝试在反应中获取数据 问题是我必须单击按钮两次才能获取该数据 虽然我在第一次单击时没有获取数据 但如果我向其中添加 JSON stringify 它会以某种方式呈现 如果我不添加 JSON stringify 它会返回未定义 如果有人
  • 依赖属性上的 XAML 绑定

    我目前正在开发 WPF TimePicker 控件 该控件继承了一个 TextBox 它有一个 MaskedTexProvider 它以以下格式显示 TimeSpan HH MM 到目前为止 一切都按预期工作 向上和向下箭头更改基础 Tim
  • 在 RecyclerView 中发布 ExoPlayer

    我正在 RecyclerView 中实现 ExoPlayer 但滚动时视频会停止 但音频不会停止 如何在RecyclerView中释放ExoPlayer 或者我怎样才能获得回收对象的位置 以便我能够释放 ExoPlayer 这是我的数据对象
  • System.Data.Entity.DbContext 找不到添加为引用

    当我去构建我的项目时 我收到此错误 类型 System Data Entity DbContext 是在未引用的程序集中定义的 您必须添加对程序集 EntityFramework Version 5 0 0 0 Culture neutra
  • 如何更改 Oracle 中视图的列大小

    我正在尝试使用与表相同的命令来更改视图的列大小 例如 alter table STUDENT modify ROLL NO VARCHAR2 80 但它的抛出错误 SQL 错误 ORA 00942 表或视图不存在 那么我们如何改变视图的列大
  • 注册到活动的 Google 发布商代码

    我查看了 Google 发布商代码参考 并决定可以向我的广告位添加一些事件 如果我只定义了一个插槽 它会非常有效 如果我添加更多插槽 事件会在我的控制台上不断重复我有插槽的次数 所以 如果我做这样的事情
  • 如何使用 javascript 展开和折叠

    我在我的网站上创建了一个列表 该列表是由 foreach 循环创建的 该循环使用我的数据库中的信息构建 每个项目都是一个包含不同部分的容器 因此这不是像 1 2 3 等这样的列表 我列出了带有信息的重复部分 每个部分都有一个小节 一般构建如
  • C++ 大数算术

    我正在开发一个用于大数算术的类 它现在知道如何进行加法 处理 cin 和 cout 然而 它的减法功能非常有限且基本 并且不知道如何处理负数 但这很容易解决 我的问题是 如何进行乘法运算 我将在这里详细介绍它如何处理 cin 和 cout
  • 将本地 Sourcetree 存储库恢复为 master

    我是 Sourcetree 的新手 在本地造成了混乱 与 origin master 相比 有 7 个提前提交 我想忽略并删除我在本地完成的所有操作 然后通过将本地存储库恢复到当前的 origin master 来重新开始 我该怎么做呢 R
  • DIV 汇编的错误答案

    我有我的代码的一部分 mov di 3 mov cx 16 looop xor dx dx shl bx 1 adc dx dx cmp cx 16 je cx16 it s will dec cx and jump loop push d
  • 更改 ggplot 因子颜色

    我注意到这里盒须图电话 p geom boxplot aes fill factor cyl 为箱线图填充生成明亮的红色 绿色 蓝色 同时 p geom boxplot aes fill factor vs 产生独特的浅绿色 红色 在我的数
  • 如何获取链接到耶拿资源的资源列表?

    我使用 Jena API 创建了一个模型 public static void main String args Model model ModelFactory createDefaultModel Resource alice Reso
  • iOS - 从后台自动打开应用程序

    是否可以以某种方式从后台模式重新打开应用程序 例如 如果后台应用程序正在检查服务器中的某些标志 然后触发时 它会自动转到前台吗 如果没有 我可以显示一条消息并播放声音以供用户请求重新打开应用程序吗 例如 WhatsApp 如何实现这一目标
  • C#中有指数运算符吗?

    例如 是否存在可以处理此问题的操作员 float Result Number1 Number2 Number1 2 Number2 2 Result Number1 operator Number2 过去的 运算符在其他语言中充当指数运算符
  • 如何在 Jenkins 中为工件添加时间戳

    我关注了 Jenkisfile 并且正在尝试上传带有时间戳的工件 import groovy transform Field Field def timeStamp Calendar getInstance getTime format Y
  • python 中的 SpeechRecogniton 模块太慢

    我试图对我的深度学习聊天机器人使用语音识别来获取用户的输入 实际上我的语音识别功能代码是这样的 def get audio r sr Recognizer with sr Microphone as source r pause thres