资源预览内容
第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
亲,该文档总共4页全部预览完了,如果喜欢就下载吧!
资源描述
数字电视原理作业四1.声音压缩的依据是什么?MPEG-1音频编码利用了听觉系统的什么特性?音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。MPEG-1音频编码主要利用了以下听觉系统的特性:层1:使用频域掩蔽特性,编码器的输出数据率为384kb/s层2:除了使用频域掩蔽特性外还利用了时间掩蔽特性,编码器的输出数据率为256kb/s192kb/s层3:除了使用频域掩蔽特性和时间掩蔽特性,还使用了立体声数据的冗余,编码器的输出数据率为64kb/s8.压缩数字视频数据量的基本原理是什么?视频数据中存在着大量的冗余, 即图像的各像素数据之间存在极强的相关性。 利用这些相关性, 一部分像素的数据可以由另一部分像素的数据推导出来, 结果视频数据量能极大地压缩, 有利于传输和存储。 视频数据主要存在以下形式的冗余。1. 空间冗余视频图像在水平方向相邻像素之间、 垂直方向相邻像素之间的变化一般都很小, 存在着极强的空间相关性。 特别是同一景物各点的灰度和颜色之间往往存在着空间连贯性, 从而产生了空间冗余, 常称为帧内相关性。 2. 时间冗余在相邻场或相邻帧的对应像素之间, 亮度和色度信息存在着极强的相关性。 当前帧图像往往具有与前、 后两帧图像相同的背景和移动物体, 只不过移动物体所在的空间位置略有不同, 对大多数像素来说, 亮度和色度信息是基本相同的, 称为帧间相关性或时间相关性。 3. 结构冗余在有些图像的纹理区, 图像的像素值存在着明显的分布模式。 如方格状的地板图案等。 已知分布模式, 可以通过某一过程生成图像, 称为结构冗余。 4. 知识冗余 有些图像与某些知识有相当大的相关性。 如人脸的图像有固定的结构, 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于脸部图像的中线上。 这类规律性的结构可由先验知识得到, 此类冗余称为知识冗余。 5. 视觉冗余人眼具有视觉非均匀特性, 对视觉不敏感的信息可以适当地舍弃。 在记录原始的图像数据时, 通常假定视觉系统是线性的和均匀的, 对视觉敏感和不敏感的部分同等对待, 从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据, 这就是视觉冗余。 人眼对图像细节、 幅度变化和图像的运动并非同时具有最高的分辨能力。 人眼视觉对图像的空间分解力和时间分解力的要求具有交换性, 当对一方要求较高时, 对另一方的要求就较低。 根据这个特点, 可以采用运动检测自适应技术, 对静止图像或慢运动图像降低其时间轴抽样频率, 例如每两帧传送一帧; 对快速运动图像降低其空间抽样频率。 另外, 人眼视觉对图像的空间、 时间分解力的要求与对幅度分解力的要求也具有交换性, 对图像的幅度误差存在一个随图像内容而变的可觉察门限, 低于门限的幅度误差不被察觉, 在图像的空间边缘(轮廓)或时间边缘(景物突变瞬间)附近, 可觉察门限比远离边缘处增大34倍, 这就是视觉掩盖效应。 根据这个特点, 可以采用边缘检测自适应技术, 对于图像的平缓区或正交变换后代表图像低频成分的系数细量化, 对图像轮廓附近或正交变换后代表图像高频成分的系数粗量化; 当由于景物的快速运动而使帧间预测编码码率高于正常值时进行粗量化, 反之则进行细量化。 在量化中, 尽量使每种情况下所产生的幅度误差刚好处于可觉察门限之下, 这样能实现较高的数据压缩率而主观评价不变。 6. 图像区域的相同性冗余在图像中的两个或多个区域所对应的所有像素值相同或相近, 从而产生的数据重复性存储, 这就是图像区域的相似性冗余。 在这种情况下, 记录了一个区域中各像素的颜色值, 与其相同或相近的区域就不再记录各像素的值。 矢量量化方法就是针对这种冗余图像的压缩方法。 7. 纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律, 但是在统计的意义上服从该规律, 利用这种性质也可以减少表示图像的数据量, 称为纹理的统计冗余。 电视图像信号数据存在的信息冗余为视频压缩编码提供了可能。11.请画出MPEG-1视频编码的原理框图,说明框图中每个模块的功能,并回答下列问题。(1)在具有运动补偿的帧间预测编码中,如果运动矢量估计得不准,产生的后果是什么?是否会产生图像失真?为什么?(2)经上述编码器压缩的图像,在解压缩之后会出现“方块效应”,产生“方块效应”的根源是什么?(3)在DCT变换之后进行Zig-zag扫描的目的是什么?帧重排分组后,无论对于哪种制式,其GOP中的各帧次序是固定不变的,如图4.24所示,然而在实现MPEG-l编码时,如果严格按各GOP中每一帧的次序编码时,删会出现一个问题,即在完成对I帧的编码后,应该马上对B帧编码,然而B帧是双向预测帧,此时还缺少一个后向参考帧(P帧)只有对两个参考帧都读出时才能对B帧进行预测编码。为解决这一矛盾,在编码前,需以GOP为单位进行帧顺序重新排列,即帧重排,这也正是MPEG编码必须以GOP为单位的重要原因。I帧编码I帧是GOP的基础,是GOP中的第一帧,以后各帧,均以I帧作为参考,I帧本身不需要运动矢量,它是运动的起始点,I帧图像数据处理的质量,直接影响到整个GOP中各帧图像质量,如果某一I帧的某些宏块在编码中出了问题,则在该GOP中各帧相关联部分都无法重构图像,这就是在几帧图像内连续在某一区域内出现“码赛克”的原因之一。但是它不应影响下一个GOP,可见I帧编码的质量是非常重要的。I帧的压缩编码采用的是帧内压缩方式,其方法与JPEG基本相同P帧编码与I帧编码截然不同,它属于帧间压缩,以它之前的I帧或P帧为参考帧进行预测编码。 首先,编码器从GOP存储器中读出重排后的P帧图像宏块数据,然后分两路传送,一路送入运动估值器,采用三步法确定宏块的运动矢量,再将运动矢量送入运动补偿预测器,它根据P帧当前编码宏块的位置和运动矢量坐标,在I帧或P帧存储器中取出与之最相近的匹配宏块,作为预测值,一路送入减法器,与P帧中当前编码宏块相减,另一路送入加法器。在减法器中求出编码像块与预测像块的差值后,送入FDCT变换器,将空域中的8*8差值矩阵转换为8*8频域系数。与I帧不同的是,P帧预测误差的FDCT系数的量化没有采用量化表,而只选择了不同的量化步长常数。(1) 残差大,质量差,会产生图像失真(2) 由于视频在压缩编码的时候用到的 DCT 变换是基于块的,以及 帧内帧间编码都是基于宏块划分的(3) ,把二维系数矩阵变为一维数组序列,然后再进行游程编码,以降低“0”的输出,最后进行赫夫曼编码,进一步降低平均码长。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号