|
知识路径: > 多媒体信息处理及编辑技术 > 多媒体音频的处理与编辑 > 音频数据的编辑处理概述 > 音频数据的编辑处理概述 >
|
被考次数:1次
被考频率:低频率
总体答错率:40%  
知识难度系数:
|
由 软考在线 用户真实做题大数据统计生成
|
相关知识点:20个
|
|
|
|
将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中,一般需要对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,以减少音频的数据量,并以这种形式在计算机内传输和存储。在播放这些声音时,需要经解码器将二进制编码恢复成原来的声音信号。
|
|
|
|
. 声音信号中存在着很大的冗余度,通过识别和去除这些冗余度能达到压缩的目的。
|
|
|
. 音频信息的最终接收者是人,人的视觉和听觉器官都具有某种不敏感性。舍去人的感官所不敏感的信息对声音质量的影响很小,在有些情况下甚至可以忽略不计。例如,人耳听觉有一个重要的特点,即听觉的“掩蔽”,指一个强音能抑制一个同时存在的弱音的听觉现象。利用该性质可以抑制与信号同时存在的量化噪声。
|
|
|
. 对声音波形进行采样后,相邻采样值之间存在着很强的相关性。
|
|
|
|
按照压缩原理的不同,声音的压缩编码可分为3类,即波形编码、参数编码和混合型编码。
|
|
|
|
波形编码主要利用音频采样值的幅度分布规律和相邻采样值之间的相关性进行压缩,目标是力图使重构的声音信号的各个样本尽可能地接近于原始声音的采样值。这种编码保留了信号原始采样值的细节变化,即保留了信号的各种过渡特征,因此复原的声音质量较高。波形编码技术有脉冲编码调制(PCM)、自适应增量调制(ADM)和自适应差分脉冲编码调制(ADPCM)等。
|
|
|
|
参数编码是一种对语音参数进行分析合成的方法。语音的基本参数是基音周期、共振峰、语音谱、声强等,如能得到这些语音基本参数,就可以不对语音的波形进行编码,只要记录和传输这些参数就能实现声音数据的压缩。这些语音基本参数可以通过分析人的发音器官的结构及语音生成的原理建立语音生成的物理或数学模型。得到语音参数后,就可以对其进行线性预测编码(Linear Predictive Coding, LPC)。
|
|
|
|
混合型编码是一种在保留参数编码技术的基础上,引用波形编码准则去优化激励源信号的方案。混合型编码充分利用了线性预测技术和综合分析技术,其典型算法有:码本激励线性预测(CELP)、多脉冲线性预测(MP-LPC)、矢量和激励线性预测(VSELP)等。
|
|
|
波形编码可以获得很高的声音质量,因此在声音编码方案中应用较广。下面介绍波形编码方案中常用的PCM编码。
|
|
|
|
PCM脉冲编码调制是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称,即它把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储,其原理框图如下图所示。在下图中,输入是模拟声音信号,输出是PCM样本。下图中的防失真滤波器是一个低通滤波器,用来滤除声音频带以外的信号;波形编码器可暂时理解为采样器;量化器可理解为量化阶大小(step-size)生成器或者量化间隔生成器。
|
|
|
|
|
PCM方法可以按量化方式的不同分为均匀量化、非均匀量化和自适应量化等。
|
|
|
|
采用相等的量化间隔对采样得到的信号进行量化称为均匀量化,也称线性量化。均匀量化将输入的声音信号的振幅范围分成2B个等份(B为量化的二进制位数),所有落入同一等份数的采样值都被编码成相同的B位二进制码。只要采样频率足够大,量化位数也适当,便能获得较高的声音信号数字化效果。为了满足听觉效果,均匀量化必须使用较多的量化位数,这样所记录和产生的音乐才可以达到最接近原声的效果。当然,提高采样率及分辨率将造成存储数据空间的增大。
|
|
|
为了适应幅度大的输入信号,同时又要满足精度要求,就需要增加样本的位数。但是,对话音信号来说,大信号出现的机会并不多,增加的样本位数没有被充分利用。为了克服这个不足,出现了非均匀量化的方法,这种方法也称非线性量化。
|
|
|
|
对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数表示。声音数据还原时则采用相同的规则。
|
|
|
|
自适应量化是一种根据输入信号幅度改变量化阶距的一种波形编码技术。这种自适应可以是瞬时自适应(即量化阶距每隔几个样本就改变),也可以是音节自适应(即量化阶距在较长的时间周期内发生变化)。
|
|
|