数据压缩概述
被考次数: 2次
被考频率: 低频率
答错率:    40%
知识难度:
考试要求: 掌握     
知识路径:  > 计算机系统综合知识  > 计算机应用  > 多媒体压缩、编码与存储技术  > 多媒体基础知识  > 压缩编码技术


本知识点历年真题试卷分布
>> 试题列表    
 

 
       数据之所以能够压缩,是因为基本原始信源的数据存在着很大的冗余度。一般来说,多媒体数据中存在以下种类的数据冗余。
       (1)空间冗余(几何冗余):一幅图像的背景及其景物中,在某点自身与其相邻的一些区域内,常存在有规则的相关性。例如,一幅蔚蓝的天空中漂浮着白云的图像,其蔚蓝的天空及白云本身都具有较强的相关性,这种相关性的图像部分,在数据中就表现为冗余。空间冗余是视频图像中常见的一种冗余。
       (2)时间冗余:对于电视动画类的图像,其序列中前后相邻的两幅图像之间呈现较强的相关性,这就反映为时间冗余。如某一帧图像经过时间t后,在某下一帧图像中带有较强的相关性(即画面像素相似)。
       (3)知觉冗余:知觉冗余是指那些处于人们听觉和视觉分辨率以下的视、音频信号,若在编码时舍去这种在感知门限以下的信号,虽然这会使恢复原信号产生一定的失真,但并不能为人们所感知,为此,此种超出人们感知能力部分的编码就称为知觉冗余。例如:一般的视频图像采用28的灰度等级,而人们的视觉分辨率仅达26的等级,此差额即为知觉冗余。
       (4)信息熵冗余:信息熵是指一组数据所携带的信息量。它一般定义为:
       
       其中N为数据类数或码元个数,Pi为码元Yi发生的概率。由定义,为使单数据量d接近于或等于H,应设:
       
       其中b(yi)是分配给码元Yi的比特数,理论上应取byi)=-log2pi,实际上在应用中很难估计出{p0p1,…,pn-1}。因此一般取by0)=by1)=…=byN-1)。这样所得的d必然大于H,由此带来的冗余称为信息熵冗余或编码冗余。
       (5)结构冗余:有些图像从大的区域上看存在着非常强的纹理结构,例如,布纹图像和草席图像,我们说它们在结构上存在冗余。
       (6)知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如:人脸的图像有固定的结构,比如,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面图像的中线上等。这类规律性的结构可由先验知识和背景知识得到,此类冗余称为知识冗余。
       数据压缩技术可以分为两大类:一类是无损压缩编码法,也称为冗余压缩法、熵编码法;另一类是有损压缩编码法,也称为熵压缩法。
       (1)无损压缩法:去掉或减少了数据的冗余,这些冗余值可以重新插入到数据中,因此是可逆的,也是无失真压缩。它通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等。它的压缩比较低,通常是2:1~5:1。
       (2)有损压缩法:压缩了熵,会减少信息量,因此是不可逆的。它通常可以分为特征抽取和量化两大类。特征抽取包括基于模式的编码、分形编码等;量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中,预测编码和变换编码是最常见的方法。有损压缩能够达到较高的压缩比。对于声音可达4:1~8:1,对于动态的视频数据更是可高达100:1~400:1之多。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有