|
|
|
数据之所以能够压缩,是因为基本原始信源的数据存在着很大的冗余度。一般来说,多媒体数据中存在以下种类的数据冗余。
|
|
|
|
(1)空间冗余(几何冗余):一幅图像的背景及其景物中,在某点自身与其相邻的一些区域内,常存在有规则的相关性。例如,一幅蔚蓝的天空中漂浮着白云的图像,其蔚蓝的天空及白云本身都具有较强的相关性,这种相关性的图像部分,在数据中就表现为冗余。空间冗余是视频图像中常见的一种冗余。
|
|
|
|
(2)时间冗余:对于电视动画类的图像,其序列中前后相邻的两幅图像之间呈现较强的相关性,这就反映为时间冗余。如某一帧图像经过时间t后,在某下一帧图像中带有较强的相关性(即画面像素相似)。
|
|
|
|
(3)知觉冗余:知觉冗余是指那些处于人们听觉和视觉分辨率以下的视、音频信号,若在编码时舍去这种在感知门限以下的信号,虽然这会使恢复原信号产生一定的失真,但并不能为人们所感知,为此,此种超出人们感知能力部分的编码就称为知觉冗余。例如:一般的视频图像采用28的灰度等级,而人们的视觉分辨率仅达26的等级,此差额即为知觉冗余。
|
|
|
|
(4)信息熵冗余:信息熵是指一组数据所携带的信息量。它一般定义为:
|
|
|
|
|
|
其中N为数据类数或码元个数,Pi为码元Yi发生的概率。由定义,为使单数据量d接近于或等于H,应设:
|
|
|
|
|
|
其中b(yi)是分配给码元Yi的比特数,理论上应取b(yi)=-log2pi,实际上在应用中很难估计出{p0,p1,…,pn-1}。因此一般取b(y0)=b(y1)=…=b(yN-1)。这样所得的d必然大于H,由此带来的冗余称为信息熵冗余或编码冗余。
|
|
|
|
(5)结构冗余:有些图像从大的区域上看存在着非常强的纹理结构,例如,布纹图像和草席图像,我们说它们在结构上存在冗余。
|
|
|
|
(6)知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如:人脸的图像有固定的结构,比如,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面图像的中线上等。这类规律性的结构可由先验知识和背景知识得到,此类冗余称为知识冗余。
|
|
|
|
数据压缩技术可以分为两大类:一类是无损压缩编码法,也称为冗余压缩法、熵编码法;另一类是有损压缩编码法,也称为熵压缩法。
|
|
|
|
(1)无损压缩法:去掉或减少了数据的冗余,这些冗余值可以重新插入到数据中,因此是可逆的,也是无失真压缩。它通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等。它的压缩比较低,通常是2:1~5:1。
|
|
|
|
(2)有损压缩法:压缩了熵,会减少信息量,因此是不可逆的。它通常可以分为特征抽取和量化两大类。特征抽取包括基于模式的编码、分形编码等;量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中,预测编码和变换编码是最常见的方法。有损压缩能够达到较高的压缩比。对于声音可达4:1~8:1,对于动态的视频数据更是可高达100:1~400:1之多。
|
|
|