【文献笔记】【通信】MAVL: Multiresolution Analysis of Voice Localization

2023-05-16

文章地址:MAVL: Multiresolution Analysis of Voice Localization

这是2021年春季刚发的文章

类似的文献笔记:
【文献精读】【通信】Symphony: Localizing Multiple Acoustic Sources with a Single Microphone Array


常见术语:
AoA:到达信道的角度(也就是 DoA)
xH:x的共轭转置


文章目录

  • Insight
  • 1 Introduction
  • 2 Primer on AoA Estimation
    • 2.1 Antenna Array Model
    • 2.2 AoA Estimation Algorithms
    • 2.3 Modeling Multipath Propagation
    • 2.4 Challenges
  • 3 Multipath Voice Localization
    • 3.1 AoA Estimation of Voice Signals
    • 3.2 Room Structure Estimation
      • 3.2.1 3D MUSIC
      • 3.2.2 Our Enhancements
    • 3.3 Constrained Beam Retracing
  • 4 Implementation
  • 5 Evaluation
    • 5.1 Performance of AoA Estimation
    • 5.2 Performance of Room Estimation
    • 5.3 Overall localization results
  • 6 Related Work
  • 7 Conclusion

Insight

1 Introduction

三个部分:
(1)人声定位能力对于智能设备的好处
(2)语音追踪面临的挑战
(3)作者及逆行定位的方法

语音定位有什么好处?
(1)知道了用户的位置后,智能设备可以集中波束向用户传播信息,这样可以进行更远距离的通信
(2)知道了用户的位置后,可以更好的掌握用户的意图,比如用户让开灯,通过定位用户位置就可以知道要开哪盏灯
(3)位置信息可以给予语音识别和NLP重要的context information

语音追踪面临的挑战:
(1)许多现有的系统要求被追踪的信号是已知的(chirps、OFDM,正弦波),但是人声显然不可能已知
(2)为了定位用户,需要估计多径信道的AoA,但是通过多径信道传播的信号是相干的,所以很难进行AoA估计
(3)使用多个 AoA 追踪位置有个前提,需要先估计室内环境,但是一般家庭的硬件设施不满足室内估计所需条件
(4)用户与智能设备间的信道可能是不可视的,由此造成的低信噪比和迂回的传播路径会造成问题

作者进行定位的方法:
如下所示为 MAVL系统框图
在这里插入图片描述
首先进行多径信道的 AoA 估计,然后通过发射宽带宽的chirps 估计房间结构,最后在通过 AoA和 房间结构来定位声音(a constrained beam retracing algorithm)


AoA估计的困难点:
(1)语音信号低频
(2)相干路径的存在


2 Primer on AoA Estimation

这一部分正如作者所说:

we introduce AoA estimation problem, existing approaches, and challenges.

2.1 Antenna Array Model

本文使用由N个麦克风组成的均匀圆形阵列
在这里插入图片描述
对于均匀原型阵列来说,single source 发送的接收信号可表示为:
在这里插入图片描述

2.2 AoA Estimation Algorithms

介绍了一种叫 MUSIC 的 AoA估计算法
看不懂

2.3 Modeling Multipath Propagation

对于多径信道估计很有参考价值,都是公式,直接截图
在这里插入图片描述
在这里插入图片描述
只是给出了一个接收端信号的公式而已,并没有讲如何进行信道估计

2.4 Challenges

作者想完成的是对相干低频信号的定位,这里有两个特性,相干性和低频,都会降低 AoA estimation的精度

3 Multipath Voice Localization

3.1 AoA Estimation of Voice Signals

3.2 Room Structure Estimation

3.2.1 3D MUSIC

3.2.2 Our Enhancements

3.3 Constrained Beam Retracing

4 Implementation

5 Evaluation

5.1 Performance of AoA Estimation

5.2 Performance of Room Estimation

5.3 Overall localization results

6 Related Work

7 Conclusion

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【文献笔记】【通信】MAVL: Multiresolution Analysis of Voice Localization 的相关文章

  • Xcode 6 本地化无法读取字符串文件

    Xcode 无法生成 xliff 本地化文件并出现错误本地化无法读取字符串文件 请检查系统日志以获取更多详细信息 有谁知道我在哪里可以找到这些日志 它是 Xcode 6 3 2 GM 但我也尝试过 6 3 1 版本 同 6 3 1 错误发生
  • asp和iis 6.0从哪里获取其日期格式

    我发现了一个带有新网络服务器的小泡菜 我们有一个新的网络服务器 它显示的日期与我们旧的网络服务器不同 我们在 Windows Server 2003 的 IIS 6 0 上运行 asp 经典网页 我们以管理员身份登录并设置适当的区域设置 然
  • 列表本地化

    本地化字符串列表的正确方法是什么 我知道分隔符可以本地化为逗号或分号 但是连词是否本地化 如果是这样 任意长度列表的格式字符串会是什么样子 Example 蝙蝠 猫和狗 我可以根据区域设置使用分隔符并构建列表 如下所示 LIST UNIT
  • 如何从注册表获取重定向字符串?

    我正在使用从注册表中读取一些值Registry http msdn microsoft com en us library microsoft win32 registry 28v vs 110 29 aspx 我需要访问使用的一些值注册表
  • 如何在 VB.NET 中单击按钮切换表单语言?

    我想创建本地化应用程序并想要实现语言切换器 例如特殊按钮 我使用 Visual Studio 2010 Express VB NET 我创建了带有一个标签和一个按钮的简单测试应用程序 我将表单的属性 Localized 设置为 True 并
  • 如何将正文中的数字替换为波斯数字?

    我想将 html 内容中的每个数字转换为波斯数字 而不会对页面元素产生其他影响 例如 div style color c2c2c2 text number 1 span text number 2 span div text number
  • 如何检测 JSF 应用程序中的客户端区域设置?

    我该如何使用ServletRequest getLocale 在 JSF 应用程序中 当Servlet我的代码中不存在并且由 JSF 实现提供 我正在尝试使用ServletContextListener 但是有可能达到ServletRequ
  • 在 xcode 中,有没有办法验证所有 NSLocalizedStrings 的密钥?

    除了运行其中包含 NSLocalizedString 的每个代码路径之外 是否有一种方法可以验证所有 NSLocalizedString 是否都具有实际存在于所有捆绑包的所有 Localized strings 文件中的密钥 例如 一个键中
  • OSX 上的 locale.getlocale() 问题

    我需要获取系统区域设置来执行许多操作 最终我想使用 gettext 翻译我的应用程序 我打算在 Linux 和 OSX 上分发它 但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
  • string.Compare 行为

    怎么会这样呢 这是从VS2008中的立即窗口获取的 string Compare 1 string Compare 0 0 1 从言论来看字符串比较 http msdn microsoft com en us library 84787k2
  • 页面中某些超链接控件上的本地化资源未发生变化

    上面是正在开发中的网站的屏幕截图 我们有一个 DropdownList 控件 并在其 SelectedIndexChanged 上进行回发 然后我们更改站点区域性 然后加载相应的资源文件 DropDownList ASP NET 代码
  • 在浏览器中语音聊天? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我们正在寻求建立一个小组 voice 使用服务器上的node js 在浏览器中聊天 这可能吗 如果您希望您的解决方案是基于服务器端和客
  • Java 区域设置区分大小写

    我有以下代码来显示当前区域设置 System out println Locale getDefault System out println new Locale en US 上面给出的输出如下 en US en us 如何构造一个 Lo
  • 使用 WPF 网络浏览器以及带有斜体标签和阿拉伯文本的 HTML 时出现奇怪的字符

    我无法弄清楚这个 但我在下面做了一个简单的演示 当在 IE 或 Edge 中查看此页面时 它会正确呈现 我尝试过不同的编码 如 utf 16 Windows 1252 但没有成功 对我来说 看起来像是 WebBrowser 控件的问题 有人
  • “foreach”循环中会发生什么样的本地化?

    来自 perldocperlsyn http perldoc perl org perlsyn html Foreach Loops关于 Foreach 循环的主题 如果变量之前是 用 my 声明 它使用 变量而不是全局变量 但它仍然局限于
  • 在 iOS 7 中使用新的格式字符串说明符配置字典(复数支持)

    我正在尝试使用 iOS 7 中对复数的更复杂本地化的新支持 我创建了一个 stringsdict 文件 根据 Foundation 发行说明 以及 Cocoa WWDC 会议中的新增功能 中的信息进行格式化 我已经验证 stringsdic
  • 如何在 JavaScript 中将本地化日期转换为标准日期?

    我正在编写一段 JavaScript 代码来对包含日期 包含本地化日期 和其他字段的数据表进行排序 例如 lunes 29 de agosto de 2011 field1 field2 lunes 28 de agosto de 2011
  • C# - 在同一键盘布局中的两个不同 IME 之间自动切换

    我做了一个在数据库中输入中文拼音和汉字的应用程序 这意味着操作者必须通过ctrl shift不断地在 拼音输入法 和 搜狗输入法 之间切换 有没有办法让 IME 在选择文本框时自动更改 我的意思是 不是切换键盘布局 只是相同键盘布局的输入法
  • 通过Javascript捕获右键单击,无需节点

    当使用英语以外的任何其他语言时 Flash 播放器在 Firefox Chrome 中使用 wmode window 以外的任何内容时都会出现错误 此错误已报告但尚未修复 http bugs adobe com jira browse FP
  • 为什么 Rails 中的区域设置充当全局(使用 Thin 时)?

    我刚刚意识到在控制器中设置区域设置的推荐 Rails 方法 before filter set locale def set locale I18n locale params locale I18n default locale end

随机推荐