我想设计一个神经网络,训练后将 .mp3 文件作为输入,然后根据训练,以 1-10 的等级来决定音乐的好坏。但为此,我需要将音频文件转换为波长、频率、振幅和定义音乐所需的所有其他参数的数组,然后使用这些数组作为神经网络的输入。我应该如何解决这个问题?
如果您将 .mp3 文件转换为 .wav,您可以执行以下操作:
from scipy.io import wavfile as wav
from scipy.fftpack import fft
import numpy as np
rate, data = wav.read('music.wav')
fft_out = fft(data)
From http://www.dummies.com/programming/python/performing-a-fast-fourier-transform-fft-on-a-sound-file/ http://www.dummies.com/programming/python/performing-a-fast-fourier-transform-fft-on-a-sound-file/
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)