数字音频处理技术-软考在线

数字音频处理技术



被考次数： 6次

被考频率：中频率

答错率： 29%

知识难度：

考试要求：了解

知识路径： > 计算机系统知识 > 计算机应用基础知识 > 多媒体应用基础知识 > 多媒体基础知识 > 多媒体技术应用

本知识点历年真题试卷分布

>> 试题列表

声音是一种模拟振动波，主要有三种类型：波形声音、语音和音乐。音调、音强和音色是声音的三要素，也是声音的质量特性。声音处理是多媒体的重要特征之一，为多媒体计算机配备上光盘驱动器CD-ROM、声卡、话筒和扬声器等硬件，并加上相应的软件，就可以进行声音处理了，例如录音、播放、合成等。

数字音频处理技术

多媒体涉及到多方面的音频处理技术，如音频采集、语音编码／解码、文语转换、音乐合成、语音识别与理解、音频数据传输、音频视频同步、音频效果与编辑等。而多媒体计算机要解决的第一个关键技术是视频音频信号获取问题，只有将视频音频信号获取到计算机中，才能谈到综合处理。声音信息的计算机获取过程就是声音信号的数字化处理的过程。

（1）音频信息的数字化。

复杂的声波由许多具有不同振幅和频率的正弦波组成，代表声音的模拟信息是个连续的量，不能由计算机直接处理，必须将其数字化。

音频信息的数字化指的是：把模拟音频信号转换成有限个数字表示的离散序列，即数字音频。转换过程是：选择采样频率，进行采样（即每隔一个时间间隔在模拟声音波形上取一个幅度值），选择合适的量化精度进行量化（将样本值从模拟量转换为二进制的数字量），编码（即把声音数据写成计算机的数据格式），从而形成声音文件。数字音频信息的质量受三个因素的影响，即采样频率、量化精度和声道数。经过数字化处理之后的数字声音信息能够像文字和图形信息一样进行存储、检索、编辑和其他处理。计算机数字CD、数字磁带（DAT）中存储的都是数字声音。

音频文件大小的计算公式为：文件的字节数／每秒=采样频率（Hz）×分辨率（位）×声道数/8，对音频的数字化来说，在相同条件下，立体声比单声道占的空间大、分辨率越高则占的空间越大、采样频率越高则占的空间越大。

（2）音频信号的处理。

音频数据是随时间变化的一维函数。因此，与图像信号的播放（由一幅幅的帧序列按一定的速率播放）不同，声音信号的处理过程是不可以停止的。数字音频的播放要经过解码器（即数／模转换器）将二进制信息恢复成模拟声音信号，并由扬声器来播放。

音频信号可分为语音信号和非语音信号。语音是人类交流的工具，而非语音包括音乐和其他声音，不具有复杂的语意和语法，识别起来较简单。一般来说，实现计算机语音输出有两种方法：①录音／重放：是最简单的音乐合成方法，曾相继产生了应用调频（FM）音乐合成技术和波形表音乐合成技术；②文语转换：是基于声音合成技术的一种声音产生技术，它可用于语音合成和音乐合成。

由于模拟音响技术已经比较成熟，并且数字声音（例如CD、数字电话等）也比较普及，所以音频数据的处理和压缩编码比图像数据的处理容易。

数字音频信息的编码

数字音频信号数据量大，所以需要进行压缩。并且，由于音频数据中存在着冗余，所以可以进行压缩编码。音频冗余主要表现为：时域冗余度和频域冗余度。音频信号的编码方式主要分成如下几大类。

（1）波形编码法：波形编码是对声音波形进行采样、量化和编码。在信号采样和量化过程中，考虑人的听觉特性，使编码后的音频信号与原始信号的波形尽可能相匹配，采样频率如果在9.6～64kb/s得到的声音信号的质量较高。但波形编码法容易受到量化噪声的影响，进一步降低编码率也较困难。常用的波形编码方法是PCM（脉冲编码调制）、DPCM（差值脉冲编码调制）和ADPCM（自适应差值编码调制）。

（2）参数编码法。参数编码法是以声音信号产生的模型为基础，提取声音信号的特征参数（基音周期、共振峰、语音谱、声强等）进行编码。利用特征参数，就不必对声音的波形进行编码，只要记录和传输这些参数就可以实现声音数据的压缩。声音的特征参数可以由声音生成机构模型通过实验得到。这类编码技术一般称为声码器，典型的有通道声码器、同态声码器和线性预测声码器。参数编码法的压缩率大，但计算量大，保真度不高，适合于语音信号的编码。

（3）混合编码法。将上述两种编码方法结合起来，就是混合编码法。此方法可以在较低的数据率上得到较高的音质。典型的有码本激励线性预测编码和多脉冲激励线性预测编码。

目前几种流行的多媒体声音文件效果是：WAVE（扩展名为WAV）、MOD（扩展名MOD、ST3、XT、S3M、FAR等）、MPEG-3（扩展名MP3）、Real Audio（扩展名RA）、CD Audio音乐CD（扩展名CDA）、MIDI（扩展名MID）。下面就介绍其中的几种：

WAV文件又称为波形文件格式，它来源于对声音模拟波形的采样，用不同的采样频率对声音的模拟波形进行采样，得到一系列离散的采样点，以不同的量化位数把这些采样点的值转换成二进制数并存盘，从而产生了WAV文件。在WAV文件中，声音是由采样数据组成的，所以需要很大的存储容量。

MP3文件是现在最流行的声音文件格式，压缩率大，在网络可视电话通信方面应用广泛，但和CD唱片相比，音质不能令人非常满意。

RA文件，这种格式的压缩量很大，并且失真极小。和MP3相同，它也是为了解决网络传输带宽资源而设计的，因此主要目标是压缩比和容错性，其次才是音质。

电子乐器数字接口（MIDI）系统

电子乐器数字接口（Musical Instrument Digital Interface, MIDI）是乐器和计算机使用的标准语言，它不是声音信号，而是一套指令，指示乐器（即MIDI设备）要做什么、怎么做，例如演奏音符、加大音量、生成音响效果等。标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件，播放时，合成器对MIDI信息进行解释，然后产生出相应的一段音乐或声音。MIDI是用于在音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议，可以解决不同电子乐器之间不兼容的问题。

MIDI文件是指存放MIDI信息的标准格式文件。MIDI文件中包含音符、定时和多达16个通道的演奏定义，还包括每个通道的演奏音符信息（键通道号、音长、音量和击键力度）。由于MDDI文件是一系列指令而不是波形数据的集合，所以它需要的磁盘空间非常少；并且现装载MIDI文件比波形文件容易得多。这样，在设计多媒体节目时，可以指定什么时候播放音乐，将有很大的灵活性。在以下几种情况下，使用MIDI文件比使用波形音频更合适：①长时间播放高质量音乐，如想在硬盘上存储的音乐大于4分钟，而硬盘又没有足够的存储容量；②需要以音乐作背景音响效果，同时从CD-ROM中装载其他数据，例如图像、文字的显示；③需要以音乐作背景音响效果，同时播放波形音频，以实现音乐和语音的同时输出。

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5