Python 语音比较

2023-12-28

我有两个 .wav 文件，我需要比较并确定它们是否包含相同的单词（顺序也相同）。

一段时间以来我一直在寻找最好的方法。我不知道如何让 pyspeech 使用文件作为输入。我尝试过让 CMU sphinx 项目正常工作，但我似乎无法让 GStreamer 与 Python 27 一起工作，更不用说他们的项目了。我也用 DragonFly 搞砸了，但没有运气。

我使用的是 Win7 64 位和 Python27。有人有什么想法吗？

任何帮助是极大的赞赏。

你可以尝试PySpeech http://code.google.com/p/pyspeech/。有关更多信息，请参阅pyspeech (python) - 转录 mp3 文件？ https://stackoverflow.com/questions/4611373/pyspeech-python-transcribe-mp3-files。我从未使用过这个，但我相信它利用了 Windows 内置的语音识别引擎。这将允许您将 Wav 文件转换为文本，然后您可以进行文本比较。

要使用 Windows 语音引擎并使用 wav 文件进行输入，有两个要求。

使用进程内识别器 (SpeechRecognitionEngine)。共享识别器不能使用 Wav 文件作为输入。
在识别器对象上调用 SetInputToWaveFile 来指定您的输入 wav 文件。

您可能需要重新采样 wav 文件，因为语音识别引擎仅支持某些采样率。

每个样本 8 位
单通道单声道
每秒 22,050 个样本
PCM编码

在 Windows 上运行良好。看https://stackoverflow.com/a/6203533/90236 https://stackoverflow.com/a/6203533/90236了解更多信息。

有关 Windows 语音引擎的更多背景信息，您可以看看SAPI 和 Windows 7 问题 https://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem/4217638#4217638 and System.Speech.Recognition 和 Microsoft.Speech.Recognition 之间有什么区别？ https://stackoverflow.com/questions/2977338/what-is-the-difference-between-system-speech-recognition-and-microsoft-speech-re

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 语音比较的相关文章

如何关闭python服务器

使用此代码来运行 python 服务器 import os from http server import SimpleHTTPRequestHandler HTTPServer os chdir c users owner desktop
如何使用 python 从嵌套表结构中识别最终父级？

我有下表我的问题是我如何以编程方式识别最终父级以下是通过示例解释的规则 the id 5 0的父母是51 0 身份证号51 0没有父母因此 id5 0的最终父级是51 0 the id 6 0的父母是1 0 身份证号1 0的父母是1
使用 for 循环 Python 为数组赋值

我正在尝试将字符串的值分配给不同的数组索引但我收到一个名为列表分配超出范围的错误 uuidVal distVal uuidArray distArray for i in range len returnedList for beac
使用解析将 ** 运算符更改为幂函数？

我的要求是将运算符更改为幂函数例如 1 Input B 2 Output power B 2 2 B 2 T 2 X Output power B 2 我写了下面的正则表达式来解决这个问题 rx r a zA Z0 9 a zA Z0
使用opencv+picamera流IO用树莓派捕获视频

我使用 Raspberry 来简单地显示一个视频目前仅此为此我必须使用 opencv cv2 我尝试了很多解决方案但现在我想使用 Picamera 库捕获视频我将向您展示我的代码 import io import time imp
不使用 graphviz/web 可视化决策树

由于某些限制我无法使用 graphviz webgraphviz com 可视化决策树工作网络与另一个世界是封闭的问题是否有一些替代实用程序或一些 Python 代码用于至少非常简单的可视化可能只是决策树的 ASCII 可视化 py
自定义信号的声明

在 Qt 中我们可以通过将自定义信号设为静态变量来创建它们然后我们使用self signame反而classname signame 这样就在类中创建了一个实例变量我想了解这种模式之外的理论这是我尝试过的一些伪代码这些伪代码已记录
使用 Twisted Python 的 UDP 客户端和服务器

我想创建一个服务器和客户端使用 Twisted 从网络发送和接收 UDP 数据包我已经用 Python 中的套接字编写了此代码但想利用 Twisted 的回调和线程功能然而我需要 Twisted 设计方面的帮助我想接收多种类型的
如何使用lxml和python更新xml文件？
如何使用子进程打开新的浏览器选项卡？

我正在打开一个新的 IE 窗口 subprocess Popen r os environ PROGRAMFILES Internet Explorer IEXPLORE EXE Call URL 当 IE 关闭时这很好但即使打开它也会生
如何对嵌套函数进行单元测试？ [复制]

这个问题在这里已经有答案了您将如何对嵌套函数进行单元测试f1 在下面的例子中 def f def f1 return 1 return 2 或者需要测试的函数不应该嵌套吗有一个类似的问题这个链接 https stackoverflow
替换 pandas 数据框中的点

我有一个如图所示的数据框数字实际上是对象正在做df treasury rate pd to numeric df treasury rate 可预见的炸弹然而做df replace np nan 似乎没有摆脱这个点所以我很困惑有
Mac 上的 Errno 13 权限被拒绝

我只是测试如何从一个 py 文件调用外部 py 文件我有 2 个 py 文件都在同一目录中这是主要代码 runext py 假设调用 ext py import subprocess subprocess call Users tra
在 Django 中翻译文件时的 Git 命令

我在 Django 中有一个现有的应用程序我想在页面上添加翻译在页面上我有 trans Projects 在 po 文件中我添加了 templates staff site html 200 msgid Projects msgid P
在 Mac (Catalina) 上安装 PyGame 时出错 [重复]

这个问题在这里已经有答案了我一直在尝试将 PyGame 安装到 Catalina 上的 Mac 上但不知道如何安装我收到的错误消息是 SystemExit error command gcc failed with exit stat
使用 Tweepy 获取推文时出错

我有一个用于获取推文的 Python 脚本在脚本中我使用该库 Tweepy 我使用有效的身份验证参数运行此脚本后一些推文存储在我的 MongoDB 中有些则被 if 语句拒绝但我仍然收到错误 requests packages u
“ModuleNotFoundError：我的 Docker 容器中没有名为的模块”

我正在尝试在 Docker 容器中运行 python 脚本但我不知道为什么 python 找不到任何 python 模块我认为它与 PYTHONPATH 环境变量有关所以我尝试将其添加到 Dockerfile 中如下所示 ENV P
透视包含字符串的 Pandas Dataframe - “没有要聚合的数字类型”错误

关于此错误有很多问题但环顾四周后我仍然无法找到解决解决方案我正在尝试用字符串旋转数据框以使一些行数据变成列但到目前为止还没有成功我的 df 的形状
有效积累稀疏 scipy 矩阵的集合

我有一个 O N NxN 的集合scipy sparse csr matrix 每个稀疏矩阵都有 N 个元素集我想将所有这些矩阵加在一起以获得一个常规的 NxN numpy 数组 N 约为 1000 矩阵内非零元素的排列使得所得总和肯定不
Scrapy - 持续从数据库中获取要爬取的url

我想不断地从数据库中获取要爬行的网址到目前为止我成功地从基地获取了 url 但我希望我的蜘蛛继续从该基地读取因为该表将由另一个线程填充我有一个管道一旦爬行工作就会从表中删除 url 换句话说我想使用我的数据库作为队列我尝试

随机推荐

Android Studio - 如何更改布局

在 Eclipse 中我可以右键单击我的布局例如 LinearLayout 然后单击更改布局在 Android Studio 中我没有看到类似的东西我确实看到了变形但现在它会随时出现例如如果您使用RelativeLayou
Windows 上的 Nginx 使用 WSGI

现在我决定使用 Nginx 作为我最喜欢的网络服务器来部署 Django 我得到了一些迷雾我在 Windows 上也就是说当我尝试使用 Django 作为 FastCGI 时出现错误似乎 Flup 无法加载它给我错误从网站上看
QSqlDatabase::open() 总是返回 true

我正在尝试使用 Qt 框架连接到 SQL 数据库不幸的是尽管没有建立连接 db open 总是返回true 您可以设置任何密码主机名等我从对数据库没有任何影响的查询中得出这一点我在 Ubuntu 14 04 上使用 LAMPP 我
垂直对齐图像

我有一个包含图像和 p 标签的 div 如下所示我想根据段落的行数将图像垂直对齐在 div 中间垂直对齐不起作用我现在正在使用 JavaScript 来计算要添加到 margin top 的量但更愿意使用 CSS 有任何想法吗 di
使用 Django + Celery 更新 Haystack 搜索索引

在我的 Django 项目中我使用 Celery 我将 crontab 中的命令切换为定期任务它运行良好但它只是调用模型上的方法是否也可以通过定期任务更新我的 Haystack 索引有人这样做过吗 manage py update
x64 本机工具命令提示符和 x64 交叉工具命令提示符之间有什么区别？

我在 64 位 Windows 8 1 上安装了 32 位 Visual Studio 2013 我有 5 个命令提示符 VS2013 的开发人员命令提示符 VS2013 ARM 交叉工具命令提示符 VS2013 x64 交叉工具命令提示符
具有多个命令的 CTest

我正在使用 CTest 构建一些测试通常我可以简单地通过以下行设置测试 ADD TEST Test Name executable args 但是我遇到了一个问题我有一些测试需要运行两个命令才能工作有什么方法可以在一个 ctest
TwoWay 或 OneWayToSource 绑定无法对只读属性起作用

我有一个只读属性需要在文本框中显示并在运行时收到此错误我已经设置了IsEnabled False IsReadOnly True 没有运气其他搜索说只读应该修复它但不适合我我有一个丑陋的解决方法添加一个虚拟设置器没有代码很难
Internet Explorer 中的图像数据集

我有一个数组缓冲区名为MEM 大于画布宽度高度尺寸我想将 arrayBuffer 数据绘制到画布上 imgData data set 应该可以工作因为 imgData data 是一个 Uint8Array 它具有 set 方法它
如何在 ASP.NET Core 中获取 HttpContext.Current？ [复制]

这个问题在这里已经有答案了我们目前正在使用 ASP NET Core 重写转换我们的 ASP NET WebForms 应用程序尽量避免重新设计有一个部分我们使用HttpContext在类库中检查当前状态我怎样才能访问HttpCo
在invalidatelat观察者内增加reactivevalue

我正在尝试构建闪亮的应用程序来进行一个非常简单的测验我有一个包含 10 个问题的 data frame 用户点击回答 0 或 1 它一直有效直到我尝试实施timer 倒数以便下一个问题在 5 秒后自动出现使用invalidateLat
如何在 netlogo 上创建计时器？

对于我的迷宫项目我想创建一个监视器按钮来跟踪海龟从开始到结束所需的时间我该如何为计时器编写代码查看reset timer and timer并在文档中在迷宫设置期间执行reset timer 在迷宫运行过程中您可以使用以下命令检
解构 C# 元组

是否可以像 F 一样在 C 中解构元组例如在 F 中我可以这样做 in F let tupleExample 1234 ASDF let x y tupleExample x has type int y has type strin
如何在 Delphi 中使用 dll 导出的 C++ 类

有没有办法在 Delphi for win32 中使用 win32 dll 导出的 C 类是否有其他方法来归档类似的东西 COM NET 您无法导入类您只能导入函数鲁迪维尔修斯 Rudy Velthuis 就该主题撰写了详细的文章
Spring Boot应用程序启动后立即关闭

我正在尝试构建一个简单的 Spring Boot 应用程序当我运行 Spring Boot 应用程序时它在启动后立即关闭下面是控制台日志 Spring Boot v1 4 1 BUILD SNAP
符号导数和积分

我想集成功能f4关于x然后求新函数的导数t 我可以用数值方法计算积分有没有办法在R中以符号方式计算这个积分和导数 lambda 1 ci 1 aa lt function u k t f4 lt function x f1 lt func
如何让实验性 ngTemplateOutlet 发挥作用？

我正在尝试在 Angular2 中构建一个列表组件该组件从组件的用户那里获取项目列和项目字段的模板所以我正在尝试使用ngTemplateOutlet and ngOutletContext 我读过的都是实验性的但我无法让它发挥作用
使用 RXJava 和 Retrofit 获取标头信息

我正在尝试将当前使用 Retrofit 的应用程序转换为使用 RX Java 为了处理分页我传统上是从响应标头中获取 nextPage URL Override public void success Assignment assignm
具有可选属性的 JSON 类型提供程序的数据示例

我正在尝试使用 JSON 类型提供程序通过 API 访问 StackOverflow StackExchange 数据它效果很好但有一点需要注意 API 有一个节流阀它由退避字段发出信号其中包含您应该退避到下一个请求之前的秒数
Python 语音比较

我有两个 wav 文件我需要比较并确定它们是否包含相同的单词顺序也相同一段时间以来我一直在寻找最好的方法我不知道如何让 pyspeech 使用文件作为输入我尝试过让 CMU sphinx 项目正常工作但我似乎无法让 GStrea

Python 语音比较

Python 语音比较 的相关文章

随机推荐

热门标签

Python 语音比较的相关文章