数据压缩概述-软考在线

数据压缩概述



被考次数： 2次

被考频率：低频率

答错率： 40%

知识难度：

考试要求：掌握

知识路径： > 计算机系统综合知识 > 计算机应用 > 多媒体压缩、编码与存储技术 > 多媒体基础知识 > 压缩编码技术

本知识点历年真题试卷分布

>> 试题列表

数据之所以能够压缩，是因为基本原始信源的数据存在着很大的冗余度。一般来说，多媒体数据中存在以下种类的数据冗余。

（1）空间冗余（几何冗余）：一幅图像的背景及其景物中，在某点自身与其相邻的一些区域内，常存在有规则的相关性。例如，一幅蔚蓝的天空中漂浮着白云的图像，其蔚蓝的天空及白云本身都具有较强的相关性，这种相关性的图像部分，在数据中就表现为冗余。空间冗余是视频图像中常见的一种冗余。

（2）时间冗余：对于电视动画类的图像，其序列中前后相邻的两幅图像之间呈现较强的相关性，这就反映为时间冗余。如某一帧图像经过时间t后，在某下一帧图像中带有较强的相关性（即画面像素相似）。

（3）知觉冗余：知觉冗余是指那些处于人们听觉和视觉分辨率以下的视、音频信号，若在编码时舍去这种在感知门限以下的信号，虽然这会使恢复原信号产生一定的失真，但并不能为人们所感知，为此，此种超出人们感知能力部分的编码就称为知觉冗余。例如：一般的视频图像采用28的灰度等级，而人们的视觉分辨率仅达26的等级，此差额即为知觉冗余。

（4）信息熵冗余：信息熵是指一组数据所携带的信息量。它一般定义为：

其中N为数据类数或码元个数，P_i为码元Y_i发生的概率。由定义，为使单数据量d接近于或等于H，应设：

其中b（y_i）是分配给码元Y_i的比特数，理论上应取b（y_i）=-log₂p_i，实际上在应用中很难估计出{p₀，p₁，…，p_n_-1}。因此一般取b（y₀）=b（y₁）=…=b（y_N_-1）。这样所得的d必然大于H，由此带来的冗余称为信息熵冗余或编码冗余。

（5）结构冗余：有些图像从大的区域上看存在着非常强的纹理结构，例如，布纹图像和草席图像，我们说它们在结构上存在冗余。

（6）知识冗余：有许多图像的理解与某些基础知识有相当大的相关性。例如：人脸的图像有固定的结构，比如，嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于正面图像的中线上等。这类规律性的结构可由先验知识和背景知识得到，此类冗余称为知识冗余。

数据压缩技术可以分为两大类：一类是无损压缩编码法，也称为冗余压缩法、熵编码法；另一类是有损压缩编码法，也称为熵压缩法。

（1）无损压缩法：去掉或减少了数据的冗余，这些冗余值可以重新插入到数据中，因此是可逆的，也是无失真压缩。它通常使用的是统计编码技术，包括哈夫曼编码、算术编码、行程编码等。它的压缩比较低，通常是2：1～5：1。

（2）有损压缩法：压缩了熵，会减少信息量，因此是不可逆的。它通常可以分为特征抽取和量化两大类。特征抽取包括基于模式的编码、分形编码等；量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中，预测编码和变换编码是最常见的方法。有损压缩能够达到较高的压缩比。对于声音可达4：1～8：1，对于动态的视频数据更是可高达100：1～400：1之多。

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5