|
本节主要介绍数据压缩的相关技术和标准。对于多媒体数据压缩算法而言,数据质量是压缩的效果,数据量是压缩的能力,计算复杂度是压缩的代价,这需要综合考虑。
|
|
|
|
数据之所以能够压缩,是因为基本原始信源的数据存在着很大的冗余度。一般来说,多媒体数据中存在以下种类的数据冗余。
|
|
|
(1)空间冗余(几何冗余):一幅图像的背景及其景物中,在某点自身与其相邻的一些区域内,常存在有规则的相关性。例如,一幅蔚蓝的天空中漂浮着白云的图像,其蔚蓝的天空及白云本身都具有较强的相关性,这种相关性的图像部分,在数据中就表现为冗余。空间冗余是视频图像中常见的一种冗余。
|
|
|
(2)时间冗余:对于电视动画类的图像,其序列中前后相邻的两幅图像之间呈现较强的相关性,这就反映为时间冗余。如某一帧图像经过时间t后,在某下一帧图像中带有较强的相关性(即画面像素相似)。
|
|
|
(3)知觉冗余:知觉冗余是指那些处于人们听觉和视觉分辨率以下的视、音频信号,若在编码时舍去这种在感知门限以下的信号,虽然这会使恢复原信号产生一定的失真,但并不能为人们所感知,为此,此种超出人们感知能力部分的编码就称为知觉冗余。例如:一般的视频图像采用28的灰度等级,而人们的视觉分辨率仅达26的等级,此差额即为知觉冗余。
|
|
|
(4)信息熵冗余:信息熵是指一组数据所携带的信息量。它一般定义为:
|
|
|
|
其中N为数据类数或码元个数,Pi为码元Yi发生的概率。由定义,为使单数据量d接近于或等于H,应设:
|
|
|
|
其中b(yi)是分配给码元Yi的比特数,理论上应取b(yi)=-log2pi,实际上在应用中很难估计出{p0,p1,…,pn-1}。因此一般取b(y0)=b(y1)=…=b(yN-1)。这样所得的d必然大于H,由此带来的冗余称为信息熵冗余或编码冗余。
|
|
|
(5)结构冗余:有些图像从大的区域上看存在着非常强的纹理结构,例如,布纹图像和草席图像,我们说它们在结构上存在冗余。
|
|
|
(6)知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如:人脸的图像有固定的结构,比如,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面图像的中线上等。这类规律性的结构可由先验知识和背景知识得到,此类冗余称为知识冗余。
|
|
|
数据压缩技术可以分为两大类:一类是无损压缩编码法,也称为冗余压缩法、熵编码法;另一类是有损压缩编码法,也称为熵压缩法。
|
|
|
(1)无损压缩法:去掉或减少了数据的冗余,这些冗余值可以重新插入到数据中,因此是可逆的,也是无失真压缩。它通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等。它的压缩比较低,通常是2:1~5:1。
|
|
|
(2)有损压缩法:压缩了熵,会减少信息量,因此是不可逆的。它通常可以分为特征抽取和量化两大类。特征抽取包括基于模式的编码、分形编码等;量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中,预测编码和变换编码是最常见的方法。有损压缩能够达到较高的压缩比。对于声音可达4:1~8:1,对于动态的视频数据更是可高达100:1~400:1之多。
|
|
|
|
|
(1)JPEG(Joint Photographic Experts Group,联合图像专家组)。这是采用基于DCT(Discrete Cosine Transform,离散余弦变换)和可变长编码的算法。它的关键技术是变换编码、量化、差分编码、哈夫曼编码和行程编码等。JPEG 2000作为JPEG标准的一个更新换代标准,它的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子图书馆、传真、Internet上服务和保安等方面的应用。它与传统JPEG最大的不同,在于它放弃了JPEG所采用的以离散余弦变换为主的区块编码方式,而采用以离散小波转换为主的多解析编码方式。
|
|
|
(2)MPEG。MPEG(动态图像专家组)是ISO(International Standards Organization,国际标准化组织)制定和发布的视频、音频和数据的压缩标准。它的三大特点是兼容性好;压缩比高,可达200:1;数据的损失很小。MPEG采用预测和插补两种帧间编码技术。MPEG视频压缩算法中包含两种基本技术:一种是基于16×16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于DCT的压缩,用于减少帧序列的空域冗余,在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算法是当前视频图像压缩技术中使用最普遍的方法之一。常用的MPEG标准如下表所示。
|
|
|
|
|
(3)DVI(Digital Visual Interface,数字视频接口)。与MPEG-1相当,可达VHS(Video Home System,家用录像系统)水平,压缩后数据传输速率为1.5Mbps。为了扩大DVI的应用,Intel公司还推出了DVI算法的软件解码算法,可以将未压缩的数字视频文件压缩为原来的1/5~1/10。
|
|
|
(4)H.261。它主要是针对在ISDN上实现电信会议应用,特别是面对面的可视电话和视频会议而设计的。它的算法类似于MPEG(Moving Pictures Experts Group,动态图像专家组),但实时编码比MPEG占用CPU小,它在图像质量与运动幅度间采取了折中,即剧烈运动的图像要比相对静止的图像的质量差。它属于恒定码流可变质量编码。它采用CIF(Common Intermediate Format,通用中间格式)和QCIF(四分之一CIF)作为可视电话的视频格式。
|
|
|
(5)H.263。它主要是针对低带宽通信而设计的,它在低带宽下能够提供比H.261更好的图像效果。不仅支持CIF和QCIF,还支持SQCIF(八分之一CIF)、4CIF、16CIF。后来又推出了H.263,增加了在易误码、易丢包、异构网络下的传输效果,现在已基本代替了H.261。
|
|
|