资源预览内容
第1页 / 共52页
第2页 / 共52页
第3页 / 共52页
第4页 / 共52页
第5页 / 共52页
第6页 / 共52页
第7页 / 共52页
第8页 / 共52页
第9页 / 共52页
第10页 / 共52页
亲,该文档总共52页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第2章 视频的图像表示,目 录,2.1 图像的视觉基础 2.2 颜色模型 2.3 图像的数字化 2.4 图像格式 2.5 数字视频格式,2.1 图像的视觉基础,2.1.1 图像的概念 1.图像的基本概念 光通量;照度;亮度;视敏度;亮度适应级 2.亮度适应和区分 韦伯率实验(一个确定人的视觉系统区分亮度能力的经典实验) 实验表明:亮度区分能力在低照明情况下较差,此时韦伯率大;在背景亮度增强时改进多,此时韦伯率小。,还要说明的是,对于我们的视觉系统,感觉到的亮度并不等于光的强度,这可以由以下两个概念说明。 (1)马赫带效应:均匀亮度条带,看起来左边亮些而右边暗些。,(2)同时对比度效应:两个同样大小同样亮度的小方块,放在暗的背景中的一块看起来比放在亮的背景中的另一块看起来要亮一点。,3.图像的获取 按其亮度等级的不同:可分为二值图像(只有黑白两种亮度等级)和灰度图像(有多种亮度等级)。 按其色调的不同:可分为无色调的灰度(黑白)图像和有色调的彩色图像。 按其内容的变化性质不同:可分为静止图像和活动图像。 按其所占空间的维数的不同:可分为平面的二维图像和立体的三维图像等。 传感器的三种类型: (1)单个传感器 (2)线阵传感器 (3)面阵传感器,分辨率,2.1.2 分辨率 对于空间上或时间上两个相邻的视觉信号,人们刚能鉴别出二者存在的能力称为视觉系统的分辨率。 分辨率是影响位图质量的一项指标。 所谓“分辨率”指的是单位长度中,所表达或包含的像素数目。 分辨率直接影响到图像的质量,一般其数值越大,像点密度越高,图像对细节的表现能力越强,清晰度越高。 按应用场合不同,可将分辨率分为屏幕分辨率和输出分辨率两种,前者用每英寸的行数表示,数值越大,图形(图像)质量越好;后者衡量输出设备的精度,以每英寸的像素点数表示。,(1)图像分辨率:指图像中存储的信息量,通常用像素/英寸(pixel per inch,ppi)表示。 (2)显示分辨率:指构成画面的像素的多少,数值越大,图像也就越清晰。 以乘法形式表示, 如 1024768, 其中1024和 768 分别表示屏幕上水平方向和垂直方向显示的像素点数。 显示器的最大分辨率与显示区域的大小、显像管点距(屏幕上两个相邻同色荧光点之间的距离)、视频带宽等因素有关。 最大分辨率=显示区域的宽或高/点距。,(3)打印分辨率 :又叫做输出分辨率,通常以点/英寸(dot per inch,dpi)表示,它决定了打印机打印图像时所能表现的精细程度,也称打印精度 图像大小与分辨率之间的关系可以利用下列的计算公式加以表示: 图像的大小=图像的分辨率打印的尺寸 图像的大小/图像的分辨率=打印的尺寸 对特定的图像而言,图像的大小是固定的,所以,分辨率和打印尺寸便呈现反比的关系。,人眼的视觉特性,2.1.3 人眼的视觉特性 人眼主要有以下视觉特性: 由于人眼对亮度响应的非线性特性,在频率亮度大的区域,人眼对灰度误差不敏感,韦伯率就是对这种现象的一种描述,在这些区域量化时可粗糙些。 人眼对亮度信号的空间分辨率大于对色度信号的空间分辨率,所以在对色度信号编码前应先进行空间亚抽样,以提高压缩比。 图像边缘信息对视觉很重要,特别是边缘的位置信息,人眼容易感觉到边缘位置的变化,而对于边缘部分的灰度误差,人眼并不敏感。相反,在灰度变化较平缓的区域,灰度的少量变化就已被人眼发现。,画面切换后约100ms时间内,人眼分辨率较低,这种效应称之为掩蔽效应。由于掩蔽效应,人眼对画面中人移开后刚露出的背景分辨率也较低。典型的视角仅为5,这是边缘掩盖了邻近像素的作用,使人眼对这些像素不敏感、不精确。 视觉系统的时间和空间频率特性是相互依赖的。,2.2 颜色模型,2.2.1 颜色基础知识 1.颜色与光密不可分 随着波长由长到短,呈现的颜色依次为:红、橙、黄、绿、青、蓝、紫。 2.物体的颜色 两种不同的来源:一种是发光体所呈现的颜色;另一种是物体反射或透射的彩色光。 3.人眼对颜色的感知 三基色混合原理:任何颜色都可以通过三基色按不同比例混合得到。,RGB模型,2.2.2 颜色模型的基本概念 1.RGB模型 红、绿、蓝三基色按照不同的比例相加合成的混色称为相加混色。 红色+绿色=黄色,绿色+蓝色=青色,红色+蓝色=品红,红色+绿色+蓝色=白色。 黄色、青色、品红都是由两种颜色相混合而成的,所以它们又称相加二次色。另外,红色+青色=白色,绿色+品红=白色,蓝色+黄色=白色。所以青色、黄色、品红分别又是红色、蓝色、绿色的补色。,HSI模型,2.HSI模型 H表示色调(Hue),S表示饱和度(Saturation),I表示密度(Intensity,对应成像亮度和图像灰度)。 亮度是光作用于人眼所引起的明亮程度的感觉。 色调是当人眼看一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,决定颜色的基本特性。 饱和度是颜色的纯度,即掺入白光的程度,指颜色的深浅程度。 通常把色调和饱和度通称为色度。亮度表示某彩色光的明亮程度,而色度则表示颜色的类别与深浅程度。,人的视觉系统经常采用HSI颜色空间,它比RGB颜色空间更符合人的视觉特性。 从RGB颜色空间转换到HSI颜色空间,具体公式如下:,YUV颜色空间,3.YUV颜色空间 YUV(也称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL)。 与RGB视频信号传输相比,YUV最大的优点在于只需占用极少的频宽(RGB要求三个独立的视频信号同时传输)。 其中“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。,YCrCb颜色空间是由YUV颜色空间派生的一种颜色空间,主要用于数字电视系统中。 三者与RGB的转换方程如下: RGBYUV: 实际上也就是: Y=0.30R+0.59G+0.11B U=0.493(B-Y) V=0.877(R-Y),RGBYIQ: RGBYCrCb:,真彩色、伪彩色与直接色,4.真彩色、伪彩色与直接色 真彩色(True Color)是指在组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 伪彩色(Pseudo Color)图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当做彩色查找表(Color Look-Up Table,CLUT)的表项入口地址,去查找一个显示图像时使用的R、G、B强度值,查找出的R、G、B强度值产生的彩色称为伪彩色 直接色(Direct-Color)是通过每个像素点的R、G、B分量分别作为单独的索引值进行变换,经相应的色彩变换表找出各自的基色强度,用变换后的R、G、B强度值产生的色彩。,2.3 图像的数字化,一般情况下应包含以下两方面的内容: 图像空间位置的数字化,即图像的空间取样。通过采样把一幅完整的图像分割成无数离散像素组成的阵列,称为空间的离散化。 图像灰度的数字化,即从图像灰度的连续变化中进行离散的采样。目前使用的灰度量度有2664级、27128级和28256级,它们都是对连续变化的灰度的离散取值。,2.3.1 图像的采样,一维采样,(a),(d),(c),(b),一维采样,(g),(i),(j),(h),(e),(f),二维采样 令f(x, y)为一个有限带宽的二维连续图像函数,f(x, y)的傅里叶变换对为 。二维取样函数为 式中,x、y分别为x、y方向的取样间隔。上式是脉冲函数 在x、y方向以x、y为间隔的展开。,脉冲函数阵列,和一维采样类似,对图像f(x,y)取样,就是将f(x,y)乘以采样函数s(x,y)。采样后图像为 取样函数s(x,y)的傅里叶谱为,根据取样定义和傅里叶变换卷积定理,可得出f(x,y)、 、s(x,y)三者之间的频域关系为 u=1/x,v=1/y,展开卷积式并进一步整理,得: 由上式不难看出,取样图像 的频谱是连续图像谱在(u,v)方向上以一定间隔(1/x,1/y)的分布。若f(x,y)的频谱是有限带宽的,设uc和vc为其在u轴和v轴方向的频谱宽度,当满足1/u2uc,1/v2vc时,取样就不会出现重叠现象。,2.3.2 图像的量化,1.均匀量化 量化引入误差: 量化引入误差的方差: 可以证明,p(r)为常数时,满足下式的引入误差最小: 所以:,非均匀量化,2.非均匀量化 通常有两种方式: 基于人的视觉特性要求,对于亮度值急剧变化的部分没有必要进行过细的分层,只需进行粗量化;而对亮度值变化比较平缓的部分,就要进行较细的分层,即需进行细量化。 先计算所有可能的亮度值出现的概率分布,对于出现概率大的那些亮度值进行细量化,对于出现概率小的那些亮度值则进行粗量化,非均匀采样是指在细节多的区域就采样密一些,在平滑的区域就采样少一些。 非均匀量化是指对图像中像素灰度值频繁出现的灰度值范围,量化间隔小一些,而对像素灰度值极少出现的灰度范围,则量化间隔大一些。 两个概念: 空间分辨率:即图像的大小,空间分辨率=最大行数每行的最大像素数。 灰度分辨率:即一个像素值单位幅度上包含的灰度级,用一个字节存储一个像素值,则灰度级数为256;用4bit存储一个像素值,则灰度级数为16。,2.3.3图像的表示,可以用f(x,y)函数的离散取值的矩阵形式表示出来,矩阵行列的各个元素表示组成图像的离散像素,而代表像素的矩阵中每一元素的取值也都是图像上连续变化的灰度的离散的整数取值。 假设在像素取样和灰度级量化上都按照等间隔离散采样,并且排成一个NN的矩阵,则有 矩阵元素f(i,j)表示图像在第i行第j列的像素的灰度值。,图像根据其描述的方式,可以分为: 黑白图像:是指图像的每个像素只能是黑或者白,没有中间的过渡,故又称为二值图像。二值图像的像素值为0、1。每个像素只需用1位存储。 灰度图像:是指每个像素的信息由一个量化的灰度级来描述的图像。灰度图像没有彩色信息,只有亮度信息。 彩色图像:是指除亮度信息外,还包含颜色信息的图像。彩色图像的表示与所用的颜色空间有关。,2.4 图像格式,计算机处理的数字图像文件格式主要有矢量图形和位图图像两种形式。,BMP,2.4.1 BMP 位图(bitmap)又称为光栅图和像素图,简称为BMP。数据的存储是以像素为单位的,而一幅图像好像是一张网格,每一个网格点就形成了图像中的一位。 BMP图像文件格式是微软公司专门为Windows环境下应用图像而设计的。Windows环境下运行的图形、图像软件都支持BMP图像文件。它的扩展名为.bmp。该格式可表现从224位的色彩,分辨率也可从4803201024768。,BMP图像文件格式: 大体可分为三部分: 1.文件头:固定为54个字节 位图文件头 位图信息头 2.调色板数据:实际上是一个数组,它包 含的数组数与位图中的颜色数相同。 3.图像数据:记录位图的每一个像素值。,JPEG,2.4.2 JPEG JPEG(Joint Photographic Experts Group)是由ISO和CCITT两个组织机构联合组成的图像专家组,负责制定静态的数字图像数据压缩编码标准。 JPEG不仅适用于静止图像的压缩,电视图像的帧内图像的压缩编码也常采用此算法。 主要采用了两种基本的压缩算法,一种是采用以离散余弦变换(DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的DPCM无损压缩算法。 JEPG文件大体可以分成两个部分: 标记码(tag):给出了JPEG图像的所有信息,如图像的宽、高、Huffman表、量化表等 压缩数据,JPEG中的标记码,JPEG文件由下面的8个部分组成: 图像开始SOI(Start of Image)标记 APP0标记(Marker) APPn标记(Markers),其中n=115(任选
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号