在 iOS 中同时管理文本转语音和语音识别

2024-01-09

我想要我的iOS我正在开发一个应用程序，使用文本转语音功能向用户朗读从服务器接收到的一些信息，并且我还想允许用户通过语音命令停止此类语音。我尝试过 iOS 的语音识别框架，例如OpenEars我发现问题在于它正在监听和检测应用程序本身“说”的信息，并且它涉及用户语音命令的识别。

有人处理过这种情况吗iOS并找到了解决方案？提前致谢

实施起来并不是一件小事。不幸的是，iOS 和其他系统会录制通过扬声器播放的声音。您唯一的选择就是使用耳机。在这种情况下，语音识别可以继续监听输入。在 Openears 中，除非插入耳机，否则 TTS 期间会禁用识别。

如果您仍然想实现此功能（称为“打断”），则必须执行以下操作：

存储您通过麦克风播放的音频
实施噪声消除算法，有效地从录音中删除音频。您可以使用互相关在录音中找到适当的偏移，并使用频谱减法来删除音频。
识别剩余信号中的语音。

如果不对 openears 源进行重大修改，这是不可能做到的。

相关问题是Android 播放音乐时的语音识别 https://stackoverflow.com/questions/20495397/android-speech-recognition-while-music-is-playing

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 iOS 中同时管理文本转语音和语音识别的相关文章

如何在 AVAudioSession 内使用 iPhone XS 中内置的立体声（2 通道）麦克风？

我试图从 iPhone XS 的所谓立体声后置麦克风获取两个通道但在不同位置只能看到一个通道AVAudioSession and AVAudioSessionPortDescription与后置摄像头相关联我尝试过使用AVAudioSe
为什么 JSON.stringify 对于似乎具有属性的对象返回空对象符号“{}”？

下面的例子表明JSON stringify 返回字符串对于 SpeechSynthesisVoice 对象 var voiceObject window speechSynthesis getVoices 0 JSON stringify
删除 UICollectionView 中的最后一个单元格会导致崩溃

您好我正在使用自定义 UICollectionView https github com SureCase WaterfallCollectionView https github com SureCase WaterfallCollec
iOS 中如何清除特定域的 cookie？

我已经搜索了 StackOverflow 上的几乎所有问题来寻找我的问题的答案我还没有找到任何有用的链接或教程来说明哪种方式最好清除特定域的 cookie 如果有人可以帮助我请我自己找到了解决方案如果您想删除 UIWebView 中
如何在 iOS 中查找蓝牙音频设备

好的我正在开发一个有趣的项目该项目有一个障碍我需要为我的 iOS 应用程序启用蓝牙音频支持我遇到的障碍是我什至无法开始获取已连接的蓝牙音频设备的列表即使我的 iPhone 5S 可以识别我的耳机大约 3 4 岁的耳机 LG HB
iOS8 CoreData“使用未实现的初始化程序”

我尝试运行我的应用程序时收到以下错误致命错误对类 rcresttest CatalogItem 使用未实现的初始化程序 init entity insertIntoManagedObjectContext 我可以通过将数据模型中的实体类
从 UIImagePickerController 相机视图推送 viewController

我正在开发一款消息应用程序类似于 WhatsApp 用户可以互相发送文本和图像消息当用户想要发送图像时他可以从相机胶卷中选择一张图像也可以用相机拍摄一张图像这就是我介绍的方式UIImagePickerController对于这两种
本地化现有的 iOS 应用程序

我不敢相信以前没有人问过这个问题要么是我的编码实践太无组织性要么是我没有使用正确的关键字 How can I localize an existing iOS app that does not use NSLocalizedStrin
NSString – 静态还是内联？有性能提升吗？

如果我写的话会有任何性能提升吗 NSString helloStringWithName NSString name static NSString formatString Hello return NSString stringWith
如何在 Firebase 控制台中使用 Apple 新的 APN .p8 证书

随着最近 Apple 开发者帐户的升级我面临着一个困难在尝试创建推送通知证书时它为我提供了 p8 证书而不是可以导出到 p12 的 APNs 证书 Firebase 控制台仅接受 p12 证书那么我如何从这些新的 p8 证书中获取
导入 RNCryptor 后架构 armv7 的未定义符号

我导入了 RNCryptor 可以在这里找到 https github com rnapier RNCryptor https github com rnapier RNCryptor进入我的应用程序但是我在日志中收到了三个错误 Und
如何使用AudioKit保存音频文件？

我有音频文件我给它做了一些效果 let pitchshifter AKPitchShifter self audioPlayer pitchshifter shift 10 AudioKit output pitchshifter 如果我
如何接收有关与我共享的记录中所做更改的 CloudKit 通知？

我有两个 iCloud 帐户 A and B 在两个不同的设备上来自其中之一 A 我将 ckrecord 分享给另一个人 B 像这样 let controller UICloudSharingController controller p
在 iOS 上将 NSString 转换为 NSDate 的正确方法？

我一直在使用此方法将常规 NSString 对象转换为 NSDate 但尝试向 Apple 提交更新但遭到拒绝在 iOS 中还有什么其他方法可以做到这一点 NSString date str 2011 08 12T12 20 00Z N
UIButton的高亮状态由什么控制事件开始和结束

我正在创建类似钢琴的视图UIButton作为钢琴键什么UIControlEvents当按钮获得和失去突出显示状态时我应该监听以获得回调吗我试图创建子类UIButton并添加属性观察者highlighted并且运行良好然而有时我需要
推送动画，没有阴影和停电

我有一个简单的iOS NavigationController基于应用程序二UICollectionViews 相继如果元素打开第一个合集被点击时第二集将被打开非常简单重要的提示 Both UICollectionViews
Apple Watch 预构建操作可更改故事板 customModule 引用

我目前有一个项目其中包含同一应用程序的 3 个不同版本不同的品牌等该项目运行得很好从那时起我添加了 3 个新的 Apple Watch 目标每个应用程序版本 1 个其中 2 个引用主 Apple Watch 目标中的文件
AVAssetExportSession 为零 iPhone 7 - Plus 模拟器

AVAssetExportSession在 iPhone 6 及以下版本上运行良好但在 iPhone 7 iPhone 7 Plus 模拟器上运行不佳 Xcode 8 0 这段代码return nil在exportSession中当在i
如何将 ios7 通用应用程序升级到基于 Xcode 6 的通用故事板应用程序？

我目前有一个基于 xcode 5 ios 7 的通用应用程序因此有两个故事板我正在考虑将其更新到 ios 8 有没有办法最佳方法将两个故事板迁移到通用的单个故事板我在 xcode 6 中看不到转换选项 None
PFQueryTableViewController 错误

我正在遵循在线教程使用 Parse 作为后端创建照片共享应用程序我已经运行了两次教程两次都从头开始创建应用程序但在同一位置仍然出现相同的错误我到处寻找解决方案但仍然没有运气我正在使用 PFQueryTableViewContr

随机推荐

如何在 Vue 工作流程（ Vanilla Bootstrap ）中覆盖 Bootstrap 变量？

官方推荐的自定义主题引导程序的方法是使用 sass 覆盖引导程序变量但我该如何做到这一点或者更确切地说如何将这部分流程添加到 Vue webpack 工作流程中谷歌搜索导致尝试编辑vue config js文件将 scss 加载器
命名捕获对的正则表达式问题

我有以下值 start 2011 03 10T13 00 00Z end 2011 03 30T13 00 00Z scheme W3C DTF 我使用以下正则表达式去除开始和结束日期并将它们分配给自己的命名捕获对 start P
朴素贝叶斯分类器 - 多重决策

我需要知道朴素贝叶斯分类器是否可用于生成多个决策我不能找到任何有证据支持的例子多项决定我是这个领域的新手所以我有点使困惑实际上我需要开发字符识别软件在那里我需要确定给定的字符是什么看来贝叶斯分类器可以用来识别给定的字
Numpy 中形状的 (4,) 和 (4,1) 有什么区别？

我有两个 ndarrayA and B 其形状为 4 和另一个 4 1 当我想使用计算余弦距离时this http docs scipy org doc scipy reference generated scipy spatial dis
如何在python脚本中多次导入python文件

是否可以在 python 脚本中多次导入 python 文件因为我使用 import 命令在函数中运行循环回到我的驱动程序文件但它只工作一次谢谢 edit 自己解决了谢谢您很可能不应该使用 import 来执行您想要执行的操作没
可变借用自动更改为不可变？

看起来u 一个可变的借用在以下情况下自动变得不可变 let v u Both u and v然后是不可变的借用引用因此它们都是允许的 use std ascii AsciiExt fn show a str println a a fn
如何帮助反序列化器了解泛型不需要反序列化绑定

考虑以下代码 use std marker PhantomData use serde Deserialize derive Deserialize pub struct Parent
唯一约束的命名约定

命名约定很重要主键和外键都有常用且明显的约定 PK Table and FK Table ReferencedTable 分别这IX Table Column索引的命名也相当标准那么 UNIQUE 约束呢此约束是否有普遍接受的命名约
在 Ruby 中执行 XSL 转换的最佳方法 (XSLT 2.0)

在 Ruby 中执行 XSL 转换的最佳且最有效的方法是什么我尝试过Nokogiri 但无论我尝试什么它总是会导致 compilation error element stylesheet 该样式表在我的 XML 编辑器中完美运行我在
Clojure：“java.lang.IllegalArgumentException：没有为键提供值：”当我更改要求时

我得到了一个java lang IllegalArgumentException No value supplied for key 在我的 Clojure 代码中我知道当我尝试解构作为参数传递的映射中的键时会发生这种情况然而奇怪的是
Django 从原始查询创建管理列表

我愿意在管理员中创建查询集列表模板查询集是通过cursor execute 获得的因此可能需要一个假模型基本上我只是想利用 Django admin list 提供的分页和过滤功能这是我的代码的相关部分模型 py class Qu
JSR250：CommonAnnotations for Java，2.3：@Resource 方法必须是遵循标准 JavaBeans 约定的 setter

我在这条线上遇到问题 Resource public void setMessageDrivenContext MessageDrivenContext context this context context 消息是 JSR250 Jav
将从mongo返回的日期转换为这种格式2015-10-25

我有一个从 mongo db 返回的 json 文件如下所示 id date 2014 10 19T04 00 00 000Z value 29 id date 2014 10 20T04 00 00 000Z value 20 id d
使用OpenMP计算PI值

我正在尝试通过并行化蒙特卡罗代码来学习如何使用 OpenMP 该代码通过给定的迭代次数计算 PI 的值代码的核心内容是这样的 int chunk CHUNKSIZE count 0 pragma omp parallel shared c
Simplecov gem 在 Rails 中缺少未经测试的文件

Using simple covRails 应用程序中的 gem 我们可以将未测试的文件包含在报告中吗如果是怎么办如果不是该文件应该计入覆盖率对吧尝试编辑您的config environments test rb并设置这一行 c
PhpStorm 中有选择当前行的键盘快捷键吗？

在 PhpStorm 中有扩展选择的快捷方式ctrl w 有没有选择当前所有行的快捷方式我正在寻找类似的东西ctrl l在崇高这样的操作是可用的但分配的快捷键如果有取决于实际使用的键盘映射任何状况之下 Settings Pref
确认第一条消息后发送第二条消息。 RabbitMQ 保证顺序吗？

假设多个生产者发布到同一个交易所 E 扇出每个生产商都有自己的渠道队列 Q 绑定到交换机 E 生产者 P1 向 E 发布消息 M1 并从 E 接收确认 A1 只有在确认 A1 后第二个生产者 P2 才发布第二条消息 M2 Rabbit
矩阵和向量的逐元素点积[重复]

这个问题在这里已经有答案了确实有类似的问题here https stackoverflow com questions 26168363 elegant expression for row wise dot product of two
我可以在套件中运行单个测试吗？

我已经为我的结构设置了一个测试套件 https github com stretchr testify suite package https github com stretchr testify suite package 在我能够通过
在 iOS 中同时管理文本转语音和语音识别

我想要我的iOS我正在开发一个应用程序使用文本转语音功能向用户朗读从服务器接收到的一些信息并且我还想允许用户通过语音命令停止此类语音我尝试过 iOS 的语音识别框架例如OpenEars我发现问题在于它正在监听和检测应用程序本身说

在 iOS 中同时管理文本转语音和语音识别

在 iOS 中同时管理文本转语音和语音识别 的相关文章

随机推荐

热门标签

在 iOS 中同时管理文本转语音和语音识别的相关文章