我有两个 .wav 文件,我需要比较并确定它们是否包含相同的单词(顺序也相同)。
一段时间以来我一直在寻找最好的方法。我不知道如何让 pyspeech 使用文件作为输入。我尝试过让 CMU sphinx 项目正常工作,但我似乎无法让 GStreamer 与 Python 27 一起工作,更不用说他们的项目了。我也用 DragonFly 搞砸了,但没有运气。
我使用的是 Win7 64 位和 Python27。有人有什么想法吗?
任何帮助是极大的赞赏。
你可以尝试PySpeech http://code.google.com/p/pyspeech/。有关更多信息,请参阅pyspeech (python) - 转录 mp3 文件? https://stackoverflow.com/questions/4611373/pyspeech-python-transcribe-mp3-files。我从未使用过这个,但我相信它利用了 Windows 内置的语音识别引擎。这将允许您将 Wav 文件转换为文本,然后您可以进行文本比较。
要使用 Windows 语音引擎并使用 wav 文件进行输入,有两个要求。
- 使用进程内识别器 (SpeechRecognitionEngine)。共享识别器不能使用 Wav 文件作为输入。
- 在识别器对象上调用 SetInputToWaveFile 来指定您的输入 wav 文件。
您可能需要重新采样 wav 文件,因为语音识别引擎仅支持某些采样率。
- 每个样本 8 位
- 单通道单声道
- 每秒 22,050 个样本
- PCM编码
在 Windows 上运行良好。看https://stackoverflow.com/a/6203533/90236 https://stackoverflow.com/a/6203533/90236了解更多信息。
有关 Windows 语音引擎的更多背景信息,您可以看看SAPI 和 Windows 7 问题 https://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem/4217638#4217638 and System.Speech.Recognition 和 Microsoft.Speech.Recognition 之间有什么区别? https://stackoverflow.com/questions/2977338/what-is-the-difference-between-system-speech-recognition-and-microsoft-speech-re
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)