音频编码基础和标准-软考在线

音频编码基础和标准


知识路径： > 多媒体信息处理及编辑技术 > 多媒体音频的处理与编辑 > 音频数据的编辑处理概述 > 音频数据的编辑处理概述
被考次数：1次被考频率：低频率总体答错率：39% 知识难度系数：	由软考在线用户真实做题大数据统计生成
考试要求：掌握相关知识点：20个

>> 更多本知识点历年真题

将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中，一般需要对数字化后的声音信号进行压缩编码，使其成为具有一定字长的二进制数字序列，以减少音频的数据量，并以这种形式在计算机内传输和存储。在播放这些声音时，需要经解码器将二进制编码恢复成原来的声音信号。

声音信号能被压缩编码的基本依据主要有以下3点。

. 声音信号中存在着很大的冗余度，通过识别和去除这些冗余度能达到压缩的目的。

. 音频信息的最终接收者是人，人的视觉和听觉器官都具有某种不敏感性。舍去人的感官所不敏感的信息对声音质量的影响很小，在有些情况下甚至可以忽略不计。例如，人耳听觉有一个重要的特点，即听觉的“掩蔽”，指一个强音能抑制一个同时存在的弱音的听觉现象。利用该性质可以抑制与信号同时存在的量化噪声。

. 对声音波形进行采样后，相邻采样值之间存在着很强的相关性。

音频编码基础

按照压缩原理的不同，声音的压缩编码可分为3类，即波形编码、参数编码和混合型编码。

①波形编码。

波形编码主要利用音频采样值的幅度分布规律和相邻采样值之间的相关性进行压缩，目标是力图使重构的声音信号的各个样本尽可能地接近于原始声音的采样值。这种编码保留了信号原始采样值的细节变化，即保留了信号的各种过渡特征，因此复原的声音质量较高。波形编码技术有脉冲编码调制（PCM）、自适应增量调制（ADM）和自适应差分脉冲编码调制（ADPCM）等。

②参数编码。

参数编码是一种对语音参数进行分析合成的方法。语音的基本参数是基音周期、共振峰、语音谱、声强等，如能得到这些语音基本参数，就可以不对语音的波形进行编码，只要记录和传输这些参数就能实现声音数据的压缩。这些语音基本参数可以通过分析人的发音器官的结构及语音生成的原理建立语音生成的物理或数学模型。得到语音参数后，就可以对其进行线性预测编码（Linear Predictive Coding, LPC）。

③混合型编码。

混合型编码是一种在保留参数编码技术的基础上，引用波形编码准则去优化激励源信号的方案。混合型编码充分利用了线性预测技术和综合分析技术，其典型算法有：码本激励线性预测（CELP）、多脉冲线性预测（MP-LPC）、矢量和激励线性预测（VSELP）等。

波形编码可以获得很高的声音质量，因此在声音编码方案中应用较广。下面介绍波形编码方案中常用的PCM编码。

脉冲编码调制

PCM脉冲编码调制是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称，即它把连续输入的模拟信号变换为在时域和振幅上都离散的量，然后将其转化为代码形式传输或存储，其原理框图如下图所示。在下图中，输入是模拟声音信号，输出是PCM样本。下图中的防失真滤波器是一个低通滤波器，用来滤除声音频带以外的信号；波形编码器可暂时理解为采样器；量化器可理解为量化阶大小（step-size）生成器或者量化间隔生成器。

PCM脉冲编码调制原理

PCM方法可以按量化方式的不同分为均匀量化、非均匀量化和自适应量化等。

①均匀量化。

采用相等的量化间隔对采样得到的信号进行量化称为均匀量化，也称线性量化。均匀量化将输入的声音信号的振幅范围分成2^B个等份（B为量化的二进制位数），所有落入同一等份数的采样值都被编码成相同的B位二进制码。只要采样频率足够大，量化位数也适当，便能获得较高的声音信号数字化效果。为了满足听觉效果，均匀量化必须使用较多的量化位数，这样所记录和产生的音乐才可以达到最接近原声的效果。当然，提高采样率及分辨率将造成存储数据空间的增大。

为了适应幅度大的输入信号，同时又要满足精度要求，就需要增加样本的位数。但是，对话音信号来说，大信号出现的机会并不多，增加的样本位数没有被充分利用。为了克服这个不足，出现了非均匀量化的方法，这种方法也称非线性量化。

②非均匀量化。

对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔，这样就可以在满足精度要求的情况下用较少的位数表示。声音数据还原时则采用相同的规则。

③自适应量化。

自适应量化是一种根据输入信号幅度改变量化阶距的一种波形编码技术。这种自适应可以是瞬时自适应（即量化阶距每隔几个样本就改变），也可以是音节自适应（即量化阶距在较长的时间周期内发生变化）。


	相关知识点：
	临界频带 RA格式 WMA格式 MP3格式 MIDI格式音频数据的编辑处理概述 MIDI系统音频数字化过程 MIDI音乐基础模拟音频和数字音频 CD格式 WAV格式掩蔽效应音频信号的特点 MP3 Pro格式数字音频基础数字音频的文件格式等响度曲线音乐合成 MIDI简介

	软考在线指南
	优惠劵及余额
	在线支付
	修改密码
	下载及使用
	购买流程
	取消订单

	联系我们
	关于我们
	联系我们
	商务合作

旗下网站群

高级资格科目
信息系统项目管理师	系统分析师
系统架构设计师	网络规划设计师
系统规划与管理师
初级资格科目
程序员	网络管理员
信息处理技术员	信息系统运行管理员

中级资格科目
系统集成项目管理工程师	网络工程师
软件设计师	信息系统监理师
信息系统管理工程师	数据库系统工程师
多媒体应用设计师	软件评测师
嵌入式系统设计师	电子商务设计师
信息安全工程师

本网站所有产品设计（包括造型，颜色，图案，观感，文字，产品，内容），功能及其展示形式，均已受版权或产权保护。
任何公司及个人不得以任何方式复制部分或全部，违者将依法追究责任，特此声明。
本站部分内容来自互联网或由会员上传，版权归原作者所有。如有问题，请及时联系我们。

工作时间：9:00-20:00

客服

QQ 486577830

商务合作

QQ 486577830

客服邮箱service@rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5 |