根据定义,声音去噪是从音频信号中去除不需要的噪音或干扰,以提高其质量和清晰度的过程。这涉及识别和隔离噪音成分(通常以不规则或高频元素为特征),并将其过滤掉,同时保持原始声音的完整性。
声音去噪目标是改善聆听体验以及音频分析和处理的准确性。过滤掉噪音对于高保真音频来说非常重要,不仅是为了聆听,也是为了创建某些机器学习任务的数据集。
理想情况下,去噪应该是数据清理步骤中的一部分。
理解FFT
我们从实际的例子开始,在派对上房间里充满了各种声音:人们在说话,音乐在播放,玻璃杯在碰撞。在所有的噪音中,很难专注于我们对话说的声音。
我们可以把FFT(快速傅里叶变换)想想成一个一副神奇的眼镜,它可以让你能够看到房间里的每种声音都有不同的颜色。戴上这副眼镜,你就可以在所有其他声音中轻松识别出你朋友的声音(一种特定的颜色)。这样就可以过滤掉其他分散注意力的声音(颜色),只专注于你朋友的声音。
**FFT(快速傅里叶变换)**是一种强大的工具,它将信号从原始的时域转换到频域。通过分析信号的频率成分,我们可以识别并去除不需要的噪音,从而提高原始声音的质量。
https://avoid.overfit.cn/post/d536ed94e2d74cbf8e73a4ea06ec6cec