数字图像处理_胡学龙等_第05章_图像编码与压缩0607-

知识要点,信息论中的有关概念：信息量，信息熵，冗余度统计编码预测编码变换编码混合编码,5.1 概述,数据编码的目的各异信息保密信息的压缩存储与传输等图像数据是一种十分重要且数据量大的信息源，特别是多媒体及网络技术兴起之后，它成为多媒体信息中的重要组成部分。通过数码相机等获得大量照片、图片等静态图像信息并能够永久保存，在图像通信、多媒体网络通信中，压缩编码形成一系列的静态图像和视频图像压缩编码标准。数码相机图像编码与压缩技术成功的范例。本章主要介绍静态图像压缩编码的原理，应用,5.1.1 数据压缩的基本概念,数据压缩以较少的数据量表示信源以原始形式所代表的信息目的在于节省存储空间、传输时间、信号频带或发送能量等。,数据压缩系统组成图,编码对原始的信源数据进行压缩，便于传输和存储；解码是编码的反过程。信源编码主要解决压缩的有效性，信道编码主要解决编码的可靠性，压缩主要靠前者，后者是压缩过程能够可靠实现的保证。课本主要讨论是信源编码。,熵（Entropy）,代表信源所含的平均信息量若信源编码的熵大于信源的实际熵，则信源中的数据一定存在冗余度冗余数据的去除不会减少信息量。信息量与数据量的关系可由下式表示 I D du （5.1）,在实际应用中，压缩过程赢尽量去除冗余量而不会或较少减少信息量，即压缩后的数据要能够完全或在一定容差内近似恢复。压缩方法分类:无损（无失真）压缩方法：完全恢复被压缩信源信息的方法。有损（有失真）压缩方法：近似恢复被压缩信源信息的方法。采用同一压缩方法对同样的信源进行压缩，压缩成都越高，信息损失越大。只能在压缩程度和保真度之间权衡。,采用数字技术之后使信号处理的性能大大提高，但是其数据量的增加也是十分惊人的。图像数据更是多媒体、网络通信等技术重点研究的压缩对象，不压缩的数据是计算机处理速度、通信信道的容量等无法承受的。,5.1.2 图像编码压缩的必要性,图像信号的数据量可表示为 V w h d/8 （5.2） V、w、h、d分别表示图像数据量（字节，byte，B）、图像宽度（像素数，pel）、图像高度（像素数，pel）、图像深度（位，bit）。图像的尺寸为wh。,典型图像的数据量,5.1.3 图像编码压缩的可能性,一般图像中存在着以下数据冗余因素: 编码冗余（信息熵冗余）：对像素进行编码时，要建立表达图像信息的一系列符号的码本，如果码本不能使每个像素所需的平均比特数最小，说明存在编码冗余；即人们用于表达某一信息所需要的比特数总比理论上表示该信息所需要的最少比特数要大，之间的差距就是信息熵冗余。：,像素间的相关性形成的冗余：在同一扫描行的邻近像素间、在同一帧的邻近行间、在活动图像中的同一位置的相邻帧像素间的灰度和色度往往相同或相近，称这相关性为像素间冗余或空间冗余。,视觉特性和显示设备引起的冗余:人类视觉系统的一般分辨率估计是26灰度等级，而图像的量化采用是28的灰度等级，称为视觉冗余。,5.1.4 图像编码压缩的技术指标,常用的图像压缩技术指标: 图像熵与平均码长图像冗余度与编码效率压缩比客观评价SNR 主观评价,图像熵：信源的平均信息量。设数字图像像素灰度级集合为（x1, x2,xk，,xM），其对应的概率分别为p1， p2，， pk，， pM。按信息论中信源信息熵定义，数字图像的熵H为,性质：（1）当M级灰度出现的概率相等时，即有最大熵值：(2)在极端情况下，当或则表明确定性信号的熵值为0（3）随机性信号的熵非负，0H(x)=log2M（4）M为2的整数次幂时在各灰度等概率的情况下，p(xi)=2-L,H(x)=L在不等概率时H(x)i）相应的码相比较，前面的ni位至少有一位以上的数字是不同的。,【例5.2】由表5.3计算该信源的Shannon编码,平均码字长度为2.92，较Huffman编码为长。,2.Fano编码步骤,（1）将图像灰度级xi其概率大小按递减顺序进行排序。（2）将xi分成两组，使每组的概率和尽量接近。给第一组灰度级分配代码“0”，第二组分配代码“1”。（3）若每组还是由两个或以上的灰度级组成，重复上述步骤，直至每组只有一个灰度级为止。,【例5.3】图5.6以表5.3的信源为例说明Fano编码。,5.2.3 算术编码,在信源各符号概率接近的条件下，算术编码是一种优于Huffman编码的方法。20世纪60年代，R.Elias提出了一种与分组码有本质差别的编码方法：算术编码（arithmetic coding）的概念,直到20世纪80年代才得以实现。基本思想：按照符号序列的出现概率对概率区间分割，用一个实数代表一个数据流的输入符号，再将这个实数转化为一定位数的二进制代码。,主要步骤：（1）首先把当前区间定义为【0,1）；（2）对输入流中的每个符号s，重复下面的两步：把当前区间分割为长度正比于符号概率的子区间；为s选择一个子区间，并将其定义为新的当前区间；（3）当把整个输入流处理完后，输出的即为能唯一确定当前区间的数字。,【例6-1】根据信源的概率分布进行算术编码。已知信源的概率分布为求二进制序列01011的编码。,举例,解：步骤如下：（1）二进制信源只有x1 = 0和x2 = 1两种符号，相应的概率为pc = 2/5, pe = 1- pc =3/5 （2）设s为区域左端起始位置，e为区域右端终止位置，l为子区的长度，则符号“0”的子区为0，2/5），子区长度为2/5 ;符号“1”的子区为2/5 ，1，子区长度为3/5 。,（3）随着序列符号的出现，子区按下列公式减少长度:新子区左端 = 前子区左端 + 当前子区左端前子区长度新子区长度 = 前子区长度当前子区长度设初始子区为0，1，步序为step，则编码过程参见实例。可见，最后子区左端起始位置,最后子区长度最后子区右端终止位置编码结果为子区起始位置与终止位置之中点 = 0.0011。所以，二进序列的算术编码为0011。,算术编码算法的计算步骤实例,算术编码不同与哈夫曼编码，给符号值分配整数码字，而是把二进制数所代表的概率空间宽度叠加到代码串中；虽然算术编码的硬件实现比哈夫曼编码复杂，但对图像的编码测试结果表明，在信源符号概率接近的条件下，算术编码效率高于哈夫曼编码，在扩展的JPEG系统中用算术编码取代哈夫曼编码，算术编码还有自适应模式，该模式适用于不便于符号概率统计的实际场合。,5.3 预测编码,预测编码的基本思想：在某种模型的指导下，根据过去的样本序列推测当前的信号样本值，然后用实际值与预测值之间的误差值进行编码。如果模型与实际情况符合得比较好且信号序列的相关性较强，则误差信号的幅度将远远小于样本信号。,图像差值幅度的概率分布,原图像幅度的概率分布大体比较均匀，而经预测编码后的差值大部分处在零附近的极小范围内，只有在图像的轮廓和边缘处出现较大的预测误差。可用较少的量化层次和比特数表示小幅度的误差信号，压缩数据；只有偶尔出现的大幅度误差信号，因为人眼对跳变的边沿误差并不敏感，也可减少量化级数。,