给语音信号加混响的常用方法（方法一）

2023-11-02

使用python包（pyroomacoustic）给干净语音加混响。

Pyroomacoustics是一款旨在快速开发和测试音频阵列处理算法的软件包。包的内容可分为三个主要组成部分：

1、直观的Python面向对象接口，可快速构建2D和3D房间中涉及多个声源和麦克风的不同仿真场景；

2、快速c++实现一般多面体房间的镜像声源模型和光线追踪，有效地产生房间脉冲响应和模拟源与接收机之间的传播；

3、STFT、波束成型、测向、自适应滤波、声源分离和单通道去噪的流行算法的参考实现。

本次实验主要是用pyroomacoustic包实现房间脉冲响应（RIR）来给干净的语音信号加混响。

一、一个麦克风的情况：

房间尺寸：7×5×4（长×宽×高，单位：米）；

人的位置：（1，1）；

麦克风位置：（2，2）；

麦克风数量：1个；

人与麦克风的距离：1.414米；

混响时间T60：550ms；

模拟的结果如下图所示：

房间样式

房间俯视图，其中：实心圆点为人的位置，十字符号为麦克风位置

房间脉冲响应时域波形

二、三个麦克风的情况：

房间尺寸：7×5×4（长×宽×高，单位：米）；

人的位置：（1，1）；

麦克风阵列圆心位置：（2，2）；

麦克风数量：3个；

人与麦克风阵列的距离：1.414米；

混响时间T60：550ms；

模拟的结果如下图所示：

房间俯视图，其中：实心圆点为人的位置，三个十字符号代表三个麦克风位置，三个麦克风组成麦克风阵列

三个麦克风的房间脉冲响应时域波形

三、六个麦克风的情况：

房间尺寸：7×5×4（长×宽×高，单位：米）；

人的位置：（1，1）；

麦克风阵列圆心位置：（2，2）；

麦克风数量：6个；

人与麦克风阵列的距离：1.414米；

混响时间T60：550ms；

模拟的结果如下图所示：

房间俯视图，其中：实心圆点为人的位置，六个十字符号代表六个麦克风位置，六个麦克风组成麦克风阵列

六个麦克风的房间脉冲响应时域波形

程序如下图所示：

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from scipy.signal import fftconvolve
import IPython
import pyroomacoustics as pra
import soundfile as sf
#/****************************/
# 创建一个尺寸为(7,5)的矩阵房间
corner = np.array([[0, 0], [7, 0], [7, 5], [0, 5]]).T
#corner = np.array([[0, 0], [3.15, 0], [3.15, 3.15], [0, 3.15]]).T
room = pra.Room.from_corners(corner)
'''
corner: 房间的四个角。`pra.Room.from_corners()`的函数文档中表示四个角的声明顺序必须逆时针。
'''

plt.figure(1)
fig, ax = room.plot()
ax.set_xlim([-1, 10])
ax.set_ylim([-1, 10])
plt.show()
#/***********************************/
plt.figure(2)
corner = np.array([[0, 0], [7, 0], [7, 5], [0, 5]]).T  # 房间的长宽为7米，5米
#corner = np.array([[0, 0], [3.15, 0], [3.15, 3.15], [0, 3.15]]).T
room = pra.Room.from_corners(corner)
#room.extrude(3.)  # 高为3米的房间
room.extrude(4.)  # 高为4米的房间
fig, ax = room.plot()
ax.set_xlim([-1, 10])
ax.set_ylim([-1, 10])
ax.set_zlim([-1, 4])
plt.show()
#/********************************/

audio, sr = sf.read('HPYJY01.wav')
corners = np.array([[0, 0], [7, 0], [7, 5], [0, 5]]).T
#corners = np.array([[0, 0], [3.15, 0], [3.15, 3.15], [0, 3.15]]).T
room1 = pra.Room.from_corners(corners, fs=sr,
                              max_order=3,
                              materials=pra.Material(0.2, 0.15),# 0.2，0.15 / 0.45,0.33
                              ray_tracing=True, air_absorption=True)
room1.add_source([1, 1], signal=audio)  # 人的位置
'add microphone'
#添加麦克风M表示麦克风数量
R = pra.circular_2D_array(center=[2.,2.], M=1, phi0=0, radius=0.3)
#R = pra.circular_2D_array(center=[2.,2.], M=1, phi0=0, radius=0.0)
# 人和麦克风距离是[(2-1)^2+(2-1)^2]开根号 = 根号下(2) = 1.414m
room1.add_microphone_array(pra.MicrophoneArray(R, room1.fs))
fig, ax = room1.plot()
ax.set_xlim([-1, 10])
ax.set_ylim([-1, 10])
#/********************************/
room1.image_source_model()
fig, ax = room.plot(img_order=3)
# fig.set_size_inches(18.5, 10.5)

#/***********************************/
room1.plot_rir()
fig = plt.gcf()
fig.set_size_inches(20, 10)
# t60 = pra.experimental.measure_rt60(room1.rir[0][0], fs=room1.fs, plot=True)
# print(f"The RT60 is {t60 * 1000:.0f} ms")
plt.show()
room1.simulate()
sf.write('HPYJY_wav.wav', room1.mic_array.signals.T, samplerate=sr)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

语音识别

人工智能

python

给语音信号加混响的常用方法（方法一）的相关文章

为什么 Mypy 在 __init__ 中分配已在类主体中进行类型提示的属性时不给出键入错误？

这是我的示例 python 文件 class Person name str age int def init self name age self name name self age age p Person 5 5 但当我跑步时myp
App Engine 上的 Django 与 webapp2 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用管理员权限打开cmd（Windows 10）

我有自己的 python 脚本来管理我的计算机上的 IP 地址它主要在命令行 Windows 10 中执行netsh命令您必须具有管理员权限这是我自己的计算机我是管理员运行脚本时我已经使用管理员类型的用户 Adrian 登录我无
如何在 Pandas Python 中按 id 对行进行排名

我有一个像这样的数据框 id points1 points2 1 44 53 1 76 34 1 63 66 2 23 34 2 44 56 我想要这样的输出 id points1 points2 points1 rank points2
Python 不考虑 distutils.cfg

我已经尝试了给出的所有内容并且所有教程都指向相同的方向即使用 mingw 作为 python 而不是 Visual C 中的编译器我确实有 Visual C 和 mingw 当我想使用 pip 安装时问题开始出现它总是给Unabl
使用 Boto3 超时的 AWS Lambda 函数

我已经解决了我自己的问题但无论如何我都会发布它希望能节省其他人几个小时我在 AWS 上有一个无服务器项目使用 Python 将记录插入到 kinesis 队列中但是当我使用 boto3 client kinesis 或 put
Scrapy 文件管道不下载文件

我的任务是构建一个可以下载所有内容的网络爬虫 pdfs 在给定站点中 Spider 在本地计算机和抓取集线器上运行由于某种原因当我运行它时它只下载一些但不是全部的 pdf 通过查看输出中的项目可以看出这一点JSON 我已经设定MEDI
如何用函数记录一个文件？

我有一个带有函数 lib py 但没有类的python 文件每个函数都有以下样式 def fnc1 a b c This fonction does something param a lalala type a str param b
如何找到多个 pandas 数据框中一对列与任意顺序对的交集？

我有多个 pandas 数据框为了简单起见假设我有三个 gt gt df1 col1 col2 id1 A B id2 C D id3 B A id4 E F gt gt df2 col1 col2 id1 B A id2 D C id
Python 在哪些系统上不使用 IEEE-754 双精度浮点数

Python 对 IEEE 754 浮点运算进行了各种引用但不保证1 https docs python org 3 tutorial floatingpoint html 2 https pythondev readthedocs io
在 django 中导入设置时出现奇怪的错误

我有很多项目在 ubuntu 中使用 python2 7 和 virtualenv virtualenvwrapper 工作在我的工作中一些开发人员使用 macosx 和 windows 通常我像往常一样创建项目 django admi
使用 ElementTree 在 python 中解析 xml

我对 python 很陌生我需要解析一些脏的 xml 文件这些文件需要先清理我有以下 python 代码 import arff import xml etree ElementTree import re totstring wit
Flymake的临时文件可以在系统临时目录下创建吗？

我目前正在使用以下代码在 emacs 中连接 Flymake 和 Pyflakes defun flymake create temp in system tempdir filename prefix make temp file or
pandas groupby 操作缺少数据

在 pandas 数据框中我有一列如下所示 0 M 1 E 2 L 3 M 1 4 M 2 5 M 3 6 E 1 7 E 2 8 E 3 9 E 4 10 L 1 11 L 2 12 M 1 a 13 M 1 b 14 M 1 c 15
Python：导入模块一次然后与多个文件共享

我有如下文件 file1 py file2 py file3 py 假设这三个都使用 lib7 py lib8 py lib9 py 目前这三个文件中的每一个都有以下行 import lib7 import lib8 import lib
在Python中使用pil读取tif图像时出现值错误？

我必须读取尺寸的tif图像2200 2200并输入 uint16 我将 PIL 库与 anaconda python 一起使用如下所示 from PIL import Image img Image open test tif img i
为什么从 openAI 导入 Universe 模块时出现“无效语法”错误

当我导入时universe来自 openAI 的模块我收到以下错误 Traceback most recent call last File
py2exe ImportError：没有名为的模块

我已经实现了一个名为 myUtils 的包它由文件夹 myUtils 文件组成 init py 和许多名称为 myUtils 的 py 文件该包包含在 myOtherProject py 中当我从 Eclipse 运行它们时可以找到
PyObjC + Python 3.0 问题

默认情况下 Cocoa Python 应用程序使用默认的 Python 运行时版本 2 5 如何配置我的 Xcode 项目以便它使用较新的 Python 3 0 运行时我尝试用新版本替换项目中包含的Python framework 但它不
从 Django 运行 shell 命令

我正在 Django 中开发一个网页使用 apache 服务器需要调用 shell 命令来启用禁用一些守护进程我尝试这样做 os system service httpd restart 1 gt HOME out 2 gt HOM

随机推荐

HyperLogLog（关于基数统计）

写在前面今天在复习Redis的一种在Redis 2 8 9 版本更新的结构的时候知道了这个数据结构是基于一种优秀的算法HyperLogLog 基数统计算法简单来说就是统计集合中的元素数量但是对比set有了很大的优化就去了解了一下这
Lemmings4

See also Lemmings1 Lemmings2 and Lemmings3 Although Lemmings can walk fall and dig Lemmings aren t invulnerable If a Lem
ARouter原理剖析及手动实现

简介最近可能入了魔怔也可能是闲的蛋疼自己私下学习了ARouter的原理以及一些APT的知识为了加深对技术的理解同时也本着热爱开源的精神为大家提供分享所以就带着大家强行撸码分析下ARouter路由原理和Android中APT的使
U-Boot 启动流程详解

文章目录链接脚本 u boot lds 详解 Uboot启动流程链接脚本 u boot lds 详解要分析 uboot 的启动流程首先要找到入口找到第一行程序在哪里程序的链接是由链接脚本来决定的所以通过链接脚本可以找到程序的
linux驱动模块编译Makefile

该Makefile最好是和hello c同样的路径 obj m hello o 表示编译生成的模块前缀hello必须和 c文件相同 all make C lib modules shell uname r build M PWD modu
/bin/sh: 1: nvcc: not found Makefile:89: recipe for target 'obj/convolutional_kernels.o' failed

在测试YOLO时出现 nvcc gencode arch compute 30 code sm 30 gencode arch compute 35 code sm 35 gencode arch compute 50 code sm 50
高性能内存分配器 jemalloc 基本原理

Netty 内存管理的实现并不是一蹴而就的它也是参考了 jemalloc 内存分配器今天我们就先介绍 jemalloc 内存分配器的基本原理为我们后面的课程打好基础背景知识 jemalloc 是由 Jason Evans 在 Fre
[Warning] ‘typedef‘ was ignored in this declaration解决

首先先展示一下问题是怎么样的出现了 typedef was ignored in this declaration的问题下面提供解决方案及原因原因在于使用结构体的时候没有使用别名解决方案 1 去掉typedef 2 在结构体后面加
elementui tree怎样设置默认勾选

在树形菜单数据里面设置一个唯一的字段这里我的就是id字段然后设置node key为那个唯一字段然后用default checked keys绑定一个数组这个数组里面就是需要勾选的菜单所对应的的id 比如我这里的是9 这样运行之后菜单
echarts使用结合时间轴timeline动态刷新案例

1 echarts简介 ECharts 一个使用 JavaScript 实现的开源可视化库可以流畅的运行在 PC 和移动设备上兼容当前绝大部分浏览器 IE8 9 10 11 Chrome Firefox Safari等底层依赖轻量级的
unity的UGUI的mask（遮罩）的使用

之前我写过一篇博客关于UGUI的优化其中提到了Mask的使用会增加性能的消耗但是在一些情况下使用这个会有奇效比如小地图 Minimap 的开发这篇博客介绍一下UGUI中的Mask的使用方法很简单的首先创建一个 Image 给他
【PHP发送邮件】PHP实现发送邮件

PHP发送邮件 Thinkphp直接使用其他框架修改使用 1 安装 composer require phpmailer phpmailer 2 填写配置表配置文件mail php
MQTT协议介绍

1 MQTT协议简介 MQTT Message Queuing Telemetry Transport 消息队列遥测传输是一个轻量的发布订阅模式消息传输协议是专门针对低带宽和不稳定网络环境的物联网应用设计的特点 1 开放消息协议易
Spring Data HelloWorld（三）

在 Spring Data 环境搭建二的基础之上我们改动定义个一个接口继承Repository类咱们先实现一个根据名字查询 package org springdata repository import org springd
Python开发篇——添加mysqlclient

最近使用mysql8 0 于是我就尝试用Django的框架但是执行poetry add mysqlclient却出现了错误 python3 7 dison dison X450LD workstation project script s
Kuberneters企业级容器云平台落地实践之二

九日志中心 1 filebeat安装 Filebeat 是一个用于转发和集中日志数据的轻量级传送器作为代理安装在您的服务器上 Filebeat 监控您指定的日志文件或位置收集日志事件并将它们转发到Elasticsearch或 Log
Linux下装载Qt

Linux下装载Qt 官网文件下载Qt 本官网地址 http download qt io archive qt 5 9 5 9 6 https www qt io offline installers 将文件放置Linux目录下将随意一
6.SpringBoot Web开发-webjars&静态资源映射规则（欢迎页和角标favicon.ico替换）

文章总结作为一个后端开发在Springboot中怎样引入需要的js依赖以及常用的静态资源映射呢 SpringBoot已经给做好了自动化配置使用时只需要按照默认的配置去放相应的文件就可以快速上手 1 创建SpringBoot web项
ArrayList，List 的区别;

List 的区别 6 数组数组内存中是连续存储的索引速度非常快赋值与修改元素也很简单但不利于动态扩展以及移动 ArrayList 因为数组的缺点就产生了 ArrayList ArrayList 使用该类时必须进行引用同时继承
给语音信号加混响的常用方法（方法一）

使用python包 pyroomacoustic 给干净语音加混响 Pyroomacoustics是一款旨在快速开发和测试音频阵列处理算法的软件包包的内容可分为三个主要组成部分 1 直观的Python面向对象接口可快速构建2D和3D房间

给语音信号加混响的常用方法（方法一）

给语音信号加混响的常用方法（方法一） 的相关文章

随机推荐

热门标签

给语音信号加混响的常用方法（方法一）的相关文章