带麦克风输入的 Python Librosa

2023-12-30

因此，我试图让 librosa 使用麦克风输入而不是仅使用 wav 文件，但遇到了一些问题。最初我使用 pyaudio 库连接到麦克风，但我在翻译这些数据以供 librosa 使用时遇到问题。关于如何解决这个问题有什么建议，或者是否可能？

我尝试过的一些事情包括从 pyaudio mic 接收数据，将其解码为浮点数组并将其传递给 librosa （从文档来看，这就是 librosa 对带有 .load 的 wav 文件所做的事情），但它不起作用它会产生以下错误： “librosa.util.exceptions.ParameterError：音频缓冲区并非到处都是有限的”


FORMAT = pyaudio.paInt16
RATE = 44100
CHUNK = 2048
WIDTH = 2
CHANNELS = 2
RECORD_SECONDS = 5

stream = audio.open(format=FORMAT,
                    channels = CHANNELS,
                    rate = RATE,
                    input=True,
                    output=True,
                    frames_per_buffer=CHUNK)
while True:
        data = stream.read(CHUNK)
        data_float = np.fromstring(data , dtype=np.float16)
        data_np = np.array(data_float , dtype='d')
        # data in 1D array
        mfcc = librosa.feature.mfcc(data_np.flatten() , 44100)
        print(mfcc)

你可以使用callback函数来自pyaudio。我认为使用类更容易。

在构造函数中__init__您定义所需的所有常量并将 FORMAT 设置为pyaudio.paFloat32这将使您以后能够使用它librosa.

然后在start方法我打开音频流。这stream_callback中的参数.open()让您指定实现功能的方式。

callback方法作为参数in_data, frame_count, time_info, flag然后你会收到in_data在二进制文件中。所以你需要使用np.frombuffer(in_data, dtype=np.float32)将它们转换为 numpy 数组。

完成此操作后，您可以使用您的numpy.ndarray就像你通常对 librosa 所做的那样

我认为这可以优化，但这个解决方案对我来说效果很好，希望它有帮助:)

import numpy as np
import pyaudio
import time
import librosa

class AudioHandler(object):
    def __init__(self):
        self.FORMAT = pyaudio.paFloat32
        self.CHANNELS = 1
        self.RATE = 44100
        self.CHUNK = 1024 * 2
        self.p = None
        self.stream = None

    def start(self):
        self.p = pyaudio.PyAudio()
        self.stream = self.p.open(format=self.FORMAT,
                                  channels=self.CHANNELS,
                                  rate=self.RATE,
                                  input=True,
                                  output=False,
                                  stream_callback=self.callback,
                                  frames_per_buffer=self.CHUNK)

    def stop(self):
        self.stream.close()
        self.p.terminate()

    def callback(self, in_data, frame_count, time_info, flag):
        numpy_array = np.frombuffer(in_data, dtype=np.float32)
        librosa.feature.mfcc(numpy_array)
        return None, pyaudio.paContinue

    def mainloop(self):
        while (self.stream.is_active()): # if using button you can set self.stream to 0 (self.stream = 0), otherwise you can use a stop condition
            time.sleep(2.0)


audio = AudioHandler()
audio.start()     # open the the stream
audio.mainloop()  # main operations with librosa
audio.stop()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

带麦克风输入的 Python Librosa 的相关文章

无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
Python 中的 Lanczos 插值与 2D 图像

我尝试重新缩放 2D 图像灰度图像大小为 256x256 所需输出为 224x224 像素值范围从 0 到 1300 我尝试了两种使用 Lanczos 插值来重新调整它们的方法首先使用PIL图像 import numpy as np
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

Jenkins 中颠覆轮询失败的电子邮件通知

由于密码更改我们在 Jenkins 中的一项工作失败了它的颠覆轮询超过 24 小时当这种情况发生时并不是立即显而易见的除非您注意到作业没有运行并实际检查日志构建不会失败因为它从未启动有没有人找到解决方案来通知 Jenkins
Spark中如何获取数组列的所有组合？

假设我有一个数组列group ids user id group ids 1 5 8 3 1 2 3 2 1 4 Schema root user id integer nullable false group ids array null
Composer 未下载包的 src 目录

我正在使用 Laravel 和 Composer 构建一个网络应用程序在我的本地计算机上我在composer json 文件中设置了其要求并且一切正常我正在使用 Github 推送到生产服务器但是然后我运行composer in
我能否获取 C#/WPF 中绑定对象的 Type()（即使绑定值为 null）？

我与未知来源有绑定我所拥有的只是绑定我没有其他方法来查看绑定对象我需要找出绑定对象的类型即使该值为空这就是我的问题所在我通过绑定到一个对象然后使用该对象作为获取类型的方式来评估绑定但即使该值为 null 我也需要知道该类型例
使用 pytest 时如何组织装置

固定装置往往较小且可重复使用鉴于特定装置可以依赖其他装置 pytest fixture def Account db memcache 我想在模块中组织我的装置并将它们导入到特定的测试文件中如下所示例如 from fixtures
从 XP 中的隐藏或剪切窗口复制内容？

我需要将隐藏窗口 BitBlt 的内容复制到另一个窗口问题是一旦我隐藏源窗口我得到的设备上下文就不再被绘制你需要的是打印窗口 http msdn microsoft com en us library ms535695 aspx从
airodump-ng 使用 python subprocess.Popen 通信方法输出

嗨我正在尝试从中获得连续输出airodump ng mon0 因此我试图读取的输出airodump ng mon0经过一段时间与 Popen communicate 但仍然无法得到任何东西 import subprocess airod
如何在backbone.js中创建基本视图？

我需要创建一个基本视图我的所有视图都会扩展我不太确定何时何地声明这个观点基本上我需要注入global variables我的所有模板但我不会在每个模板中都这样做render 方法这是我现在的树结构 main js app js
MySQL 更新查询 - 竞争条件和行锁定会遵守“where”条件吗？（PHP、PDO、MySQL、InnoDB）

我正在尝试建立一个先到先得的模型销售页面我们有 n 个相同类型的物品我们希望将这 n 个项目分配给前 n 个发出请求的用户每个项目对应有一个数据库行当用户按下购买按钮时系统会尝试查找尚未出售的条目 reservationCompl
.用曲线制作动画

首先看一下猫需要移动到 a 中的 xcurve 见箭头当猫击中 x 时应停留 10 秒然后猫应返回 o 再次呈曲线状然后重复我用这段代码尝试过 function curve cat delay 10000 animate top
Webpack 从 /folder/folder.js 而不是 /folder/index.js 导入

使用 webpack 当我在 blah 中创建一个 index js 时然后执行import blah from blah 它成功地从index js获取但是我的代码编辑器现在充满了名为 index js 的选项卡并执行 Ctrl
旋转拨盘控制的核心动画困难（非常详细）

我正在尝试创建一个旋转拨号控件基本上是一组 6 位数字它们不断旋转以产生旋转数字计的效果类似于您的电表水表或者可能是扑克机实际上与现有的 UIPickerView 控件但具有完全不同的外观和感觉到目前为止我几乎可以正常工作
PMD - 跳过检查@PostConstruct或@PreDestroy注释的方法

我有以下课程 import javax annotation PostConstruct public class PmdUnusedMethod private void unusedMethod PostConstruct privat
分段错误-strcat

这是我的代码 include
asp.net mvc 4 - razor 视图中的 DataAnnotations 验证（正则表达式）

在正则表达式中使用特殊字符时 DataAnnotations 验证器无法在 asp net mvc 4 razor 视图中工作 Model StringLength 100 Display Description First Name Re
对非常量对象的 const 引用

下面在将 const 引用用于非 const 对象之前是否会创建一个临时对象 const int y 2000 const int s y ok const reference to const object int x 1000 co
使用 Cursor.Position、SetCursorPos()、SendInput() 和 mouse_event() 有什么区别？

Cursor Position SetCursorPos SendInput 和 mouse event 都将鼠标位置设置为指定坐标那么它们之间有什么区别呢 Cursor Position http msdn microsoft com
CacheDispatcher.java 中的 NegativeArraySizeException:99

负数组大小异常 java lang NegativeArraySizeException 1105 at com android volley toolbox d a DiskBasedCache java 300 at com andro
Matplotlib：第二个轴上的 twinx() 值错误

我遇到了一个问题plt twinx 的函数matplotlib pyplot当我尝试绘制主要的次要 x 轴时ln x axis 它们应该显示相应的值但具有不同的刻度为了清楚起见这是我迄今为止在 MWE 中尝试过的 import num
带麦克风输入的 Python Librosa

因此我试图让 librosa 使用麦克风输入而不是仅使用 wav 文件但遇到了一些问题最初我使用 pyaudio 库连接到麦克风但我在翻译这些数据以供 librosa 使用时遇到问题关于如何解决这个问题有什么建议或者是否可能我

带麦克风输入的 Python Librosa

带麦克风输入的 Python Librosa 的相关文章

随机推荐

热门标签