有没有一种快速方法可以在音频文件中查找（不一定识别）人类语音？

2024-01-19

我想编写一个程序，自动同步未同步的字幕。我想到的解决方案之一是以某种方式通过算法找到人类语音并根据其调整字幕。我发现的 API（Google Speech API、Yandex SpeechKit）与服务器一起工作（这对我来说不太方便）并且（可能）做了很多不必要的工作来确定到底说了些什么，而我只需要知道某些内容被说过。

换句话说，我想给它音频文件并得到如下内容：

[(00:12, 00:26), (01:45, 01:49) ... , (25:21, 26:11)]

有没有一种解决方案（最好是Python）只能找到人类语音并在本地计算机上运行？

您正在尝试做的事情的技术术语称为语音活动检测 (VAD) https://en.wikipedia.org/wiki/Voice_activity_detection。有一个Python库叫做SPEAR https://pypi.org/project/bob.bio.spear/这样做（除其他外）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

voicerecognition

有没有一种快速方法可以在音频文件中查找（不一定识别）人类语音？的相关文章

Python：在列表理解本身中引用列表理解？

这个想法刚刚出现在我的脑海中假设您出于某种原因想要通过 Python 中的列表理解来获取列表的唯一元素 i if i in created comprehension else 0 for i in 1 2 1 2 3 1 2 0 0 3
使用 psycopg2 在 python 中执行查询时出现“编程错误：语法错误位于或附近”

我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数它将 SQL 查询作为文本字段返回我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
通过 Scrapy 抓取 Google Analytics

我一直在尝试使用 Scrapy 从 Google Analytics 获取一些数据尽管我是一个完全的 Python 新手但我已经取得了一些进展我现在可以通过 Scrapy 登录 Google Analytics 但我需要发出 AJAX
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
将图像分割成多个网格

我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class

随机推荐

使用自定义图标进行 Google 地图标记定位

我遇到一个问题带有自定义图标的标记似乎显示在地图上略有不同的点具体取决于缩放级别我以前使用过带有自定义图标的标记所以我不知道我做错了什么您会看到最初标记看起来像是位于道路上但如果缩小两次它看起来就像在上面如果放大两次它看
GAE Blobstore 类文件 API 弃用时间表（py 2.7 运行时）

这是 App Engine 团队的问题上周我们意识到 App Engine 团队已将用于写入和读取 blobstore 的类文件 API 标记为已弃用并且将来可能会被删除我们有相当多的基础设施依赖于该 API 现在我们需要移植到他们建
在python 3.6中导入tensorflow时出现非法指令：4

我安装了macOS 上的张量流 https www tensorflow org install install mac使用 Virtualenv 一切顺利成功安装了 6 1 11 0 tensorflow 1 6 0 是终端的最后一个输
尝试呈现一个 UIViewController，其视图不在窗口层次结构中

我有一个具有以下层次结构的多视图应用程序启动 gt 导航控制器 gt 表视图控制器 gt 设置视图控制器 Splash 是应用程序入口点因此成为根视图控制器当我尝试通过设置视图控制器上的操作将图块添加到带区时我收到调试器警告 app
传单 GeoJSON 显示

我遇到了一个任务需要使用 leaflet js 库和 geojson 作为数据存储几乎立即遇到了以下问题从 geojson 对象创建的多边形不显示在地图上而由本机传单方法创建的多边形则完美地工作这是我的代码 var map ne
自编译 Roslyn 构建性能：不如最初发布的 Roslyn 版本快

用一句话来形容我在做什么检查分支Update 1来自罗斯林 github 存储库 https github com dotnet roslyn git 构建 csc exe 并使用我刚刚自己构建的 csc exe 版本编译随机解决方案预
Pandas 的 ValueError - 传递值的形状

我正在尝试使用 Pandas 和 PyODBC 从 SQL Server 视图中提取内容并将内容转储到 Excel 文件中但是在转储数据帧时出现错误我可以打印列和数据帧内容 ValueError Shape of passed val
Eclipse 中的调试：无断点的变量快照

我正在 Eclipse 中调试 Java 程序我想观察一个特定的变量但是由于我的程序使用 GUI 因此创建断点会导致窗口冻结例如这尤其令人烦恼尝试右键单击某个项目并导航上下文菜单我实际上并不想停止程序我只是想观察一个特定的变
页面加载时使用 AJAX 不是一件坏事吗？

我在上面看到过这个书呆子晚餐 http nerddinner codeplex com和其他网站页面加载时在 JavaScript 中通过浏览器将发出 AJAX 请求从呈现初始页面的同一服务器获取一些数据数据会很小并且不存在会
AnyDac 又名 FireDac 无法生成更新查询

我已经使用 UniDac 很长时间了决定转向 FireDac 因为它具有良好的异步方法在继续使用后我发现我的数据编辑不再起作用它给了我一个错误 FireDAC 物理 330 无法生成更新查询更新表未定义我在这里想做的是我有一个
Spring单例和Java单例（设计模式）有什么区别？ [复制]

这个问题在这里已经有答案了我正在学习 Spring 框架目前正在阅读一本关于它的书这本书里说Spring单例与Java单例不同这意味着什么以及有什么区别谢谢 Java 单例的作用域是 Java 类加载器 Spring 单例的作用域
严重：泄漏：在垃圾收集之前未调用 ByteBuf.release()。内蒂

我已经创建了一些游戏服务器并且刚刚与大约 10 个伙伴进行了测试一切都很顺利我们玩了大约 10 分钟在游戏的某个时刻游戏服务器停止为客户端提供服务断开了每个人的连接而且我连接到运行游戏的 VPS 的 SSH 也断开了连接我不
Excel VBA 函数检查文件名是否包含该值

我需要一个可以输出如下内容的公式如果特定文件夹中的文件名包含因为文件名在字符后会有一个附加字符串因此如果文件名包含单元格值 AB1 则在单元格 AC1 中添加完整文件名用VBA可以实现吗非常感谢这在VBA中可行吗当然这是我
如何反序列化 ArrayObject

Note 我尝试过使用反序列化函数但它说第一个参数应该是字符串而不是对象所以我的问题 Q 如何在 php 中反序列化 ArrayObject 我的 ArrayObject 包含 O 11 ArrayObject 2 s 14 shopp
将 WebKit 用于桌面应用程序 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
UIImage：调整大小，然后裁剪

几天来我一直在努力解决这个问题尽管我一直觉得自己正处于启示的边缘但我根本无法实现我的目标在设计的概念阶段之前我认为从 iPhone 的相机或库中抓取图像使用相当于宽高比填充UIImageView 的选项完全在代码中然后cro
是什么导致我的 WP7 应用程序崩溃？

我在模拟器和手机本身上都发生过一些无法解释的崩溃基本上当我的应用程序崩溃时我不会看到任何对话框并且手机会返回主屏幕我有以下代码来显示消息框但这在某种程度上被绕过了 Code to execute if a navigation
明星算法：距离启发式

我正在使用 A 星算法如此处所示取自http code activestate com recipes 578919 python a pathfinding with binary heap http code activestate
将等高线与等高线填充图对齐不规则网格极坐标图（半圆）

我看到有几个人回答了使用不规则网格绘图的问题我无法使轮廓线与填充轮廓对齐此外需要在绘图上显示数据点位置以及以 30 度增量显示的径向辐条以及在 10 20 30 处显示的半圆 Ref 在不规则网格上绘制等高线 https stac
有没有一种快速方法可以在音频文件中查找（不一定识别）人类语音？

我想编写一个程序自动同步未同步的字幕我想到的解决方案之一是以某种方式通过算法找到人类语音并根据其调整字幕我发现的 API Google Speech API Yandex SpeechKit 与服务器一起工作这对我来说不太方便并且

有没有一种快速方法可以在音频文件中查找（不一定识别）人类语音？

有没有一种快速方法可以在音频文件中查找（不一定识别）人类语音？ 的相关文章

随机推荐

热门标签

有没有一种快速方法可以在音频文件中查找（不一定识别）人类语音？的相关文章