无损音频为什么是44.1Khz

由于人耳能听到的频率范围为20~20Khz。所以对于人类来说,超出该范围的声音无意义(反正听不到)。

也就是说,对于20~20Khz的模拟信号,数字信号下使用什么样的采样率才能完全无损的恢复到模拟信号呢?

正常思维是微积分方法,当采样率越大时,模拟信号的恢复程度越好。

但实际上,我们只需要2倍的最高频率的采样率就可以完全恢复模拟信号,该定理简述如下:

时域采样定理(香农采样定理,又称奈奎斯特采样定理)的表述如下:

频带为 F 的连续信号 f(t) 可用一系列离散的采样值 f(t1), f(t1±Δ t), f(t1±2Δ t),...来表示,只要这些采样点的时间间隔  Δ t≤1/2 F,便可根据各采样值完全恢复原来的信号 f(t)。
时域采样定理的另一种表述方式是:
当时间信号函数 f(t) 的最高频率分量为 fM时,     f(t) 的值可由一系列采样间隔小于或等于1/2 fM的采样值来确定,即采样点的重复频率 f≥2 fM。图为模拟信号和采样样本的示意图。

所以,对于人类极限的20Khz,我们只需要40Khz的采样率即可完全恢复原来的模拟信号。

但实际上,重构出原始讯号所用来抗混叠(Anti-Aliasing)、消除某频率以上讯号的低通滤波器(Low Pass Filter)并非是理想的,它有个过渡频宽(Transition Band)会导致在这个频宽内的讯号仍被衰减通过。

所以,如果取样频率不足于被取样讯号的最大频率加上其低通滤波器的过渡频宽的两倍,最大频率附近的声音讯号依然会有混叠现象,将会导致讯号失真(Distortion)。

为了完整保留最大声音频率,必须预留过度频宽,典型的过度频宽大小为2050Hz。

所以 (20000Hz + 2050Hz ) * 2 = 44100Hz = 44.1Khz。


但是为什么专业人士使用48Khz,96Khz,甚至192Khz 呢?

这是为了加工音频时,更精确的还原现场的讯号而预留出来的操作处理空间,以及Anti-Aliasing。 最终输出的频率依然是44.1Khz。

比如电脑分辨率是1920 * 1080像素,给你张4K、8K的图片,最终显示结果还是1920*1080像素的图片。

但是我们用Photoshop编辑时,将会多出很多的细节修改空间。

而给你张100 * 50 像素的照片,无论怎么样处理,当用1920 * 1080的屏幕浏览时也很容易发现其中细节缺陷。

评论列表: