在 iOS 中同时管理文本转语音和语音识别

2024-01-09

我想要我的iOS我正在开发一个应用程序,使用文本转语音功能向用户朗读从服务器接收到的一些信息,并且我还想允许用户通过语音命令停止此类语音。我尝试过 iOS 的语音识别框架,例如OpenEars我发现问题在于它正在监听和检测应用程序本身“说”的信息,并且它涉及用户语音命令的识别。

有人处理过这种情况吗iOS并找到了解决方案?提前致谢


实施起来并不是一件小事。不幸的是,iOS 和其他系统会录制通过扬声器播放的声音。您唯一的选择就是使用耳机。在这种情况下,语音识别可以继续监听输入。在 Openears 中,除非插入耳机,否则 TTS 期间会禁用识别。

如果您仍然想实现此功能(称为“打断”),则必须执行以下操作:

  1. 存储您通过麦克风播放的音频
  2. 实施噪声消除算法,有效地从录音中删除音频。您可以使用互相关在录音中找到适当的偏移,并使用频谱减法来删除音频。
  3. 识别剩余信号中的语音。

如果不对 openears 源进行重大修改,这是不可能做到的。

相关问题是Android 播放音乐时的语音识别 https://stackoverflow.com/questions/20495397/android-speech-recognition-while-music-is-playing

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 iOS 中同时管理文本转语音和语音识别 的相关文章

随机推荐