多媒体开发与编程期末复习资料-

图形：是指由点、线、面、体等几何要素和明暗、灰度、色彩等非几何要素构成的.从现实世界中抽象出来的带有灰度、色彩及形状的图或形。图像：指当光辐射能量到物体上.经过反射或透射.或由发光物体本身发出的光能量.在人的视觉器官中所重现出的物体的视觉信息区别：图像：1由一些排列的像素组成2.数据量较大.除了可以表达真实的照片外也可以表现复杂绘画的某些细节.并具有灵活和富有创造力等特点。3显示速度快4.会失真。图形：1只记录生成图的算法和图上的某些特征点，也称矢量图。2容易进行移动、压缩、旋转、扭曲等变换。3用于表示线框型的图画、工程制图、美术字等。4占用的存储空间较小。5显示速度没有图像快。6.图形的质量较高。视频：将一系列静态影像以电信号方式加以捕捉、记录、处理、储存、传送与重现的相关技术。动画：就是运动的图画，是采用计算机动画软件创作并生成的一系列可供实时演播的连续画面，属于一种动态可视媒体元素，是一种特殊的视频。区别：视频：将若干张有联系的图像按一定的频率连续播放，当连续的图像变化超过24 桢/秒以上时，根据视觉暂留原理，人眼无法辨别单幅的静态画面，看上去是平滑连续的视觉效果，这样就形成了视频。动画：1.制作技术和手分：传统动画，电脑动画2动作的的表现形式来分：“完善动画”和“局限动画”3从间的视觉效果上分：二维动画，三维动画4播放效果：顺序动画，交互式动画5每秒播放的幅数：全动画(每秒24 帧)，半动画(少于24 帧）数据压缩编码技术：不仅可以有效减少数据的存储空间.还可以减少传输占用的时间，减轻信道的压力。多媒体数据量以几何级数在疯长，在采用新技术增加CPU 处理速度、存储容量和提高通信带宽的同时，还需研究高效的数据压缩和编码技术。衡量多媒体技术性能的基本指标是其对其数据存储设备的要求和信息处理的效率。多媒体数据库：是一个由若干多媒体对象所构成的集合，这些数据对象按一定的方式被组织在一起，可为其他的应用所共享。多媒体数据库管理系统：则负责完成对多媒体数据库的各种操作和管理功能，包括对数据库的定义、操纵和控制等这样一些传统数据库功能。多媒体通信技术：。由于传统的电信业务已不能适应社会需要，迫切要求通信与多媒体技术相结合，以便为人们提供诸如电子邮件、视频会议等更加高效和快捷的沟通途径。多媒体网络系统将多个多媒体计算机连接起来，实现共享多媒体数据，为多媒体应用系统提供多媒体通信手段。为此，多媒体网络必须要有较高的数据传输速率和较大的信道宽带，同时对对网络安全与保密提出了更高的要求。矢量图：是指用一系列计算机指令来表示一幅图，如画点、画线、画圆等。实际上是以数学方法来描述一幅图，然后变成许许多多的数学表达式，再经过编程后，用语言来表达。矢量图的优点：1当需要管理每一小块图像时，矢量图法非常有效.2目标图像的移动、缩小/放大、旋转、复制、属性的改变(如线条变化、颜色改变)也很容易做到。3可以把相同的或类似的图们存到图库中，这样不仅可以加速画的生成，而且可以减小矢量图文件的大小。4. 当图很复杂，计算机就要花费很长的时间去执行绘图指令。5彩色照片，很难用数学来描述，不能用矢量图表示，要采用位图法来表示。位图：是把一幅彩色图分成许许多多的像素，组成一个点阵矩阵，每个像素用若干个二进制位来指定该像素的颜色、亮度和属性。位图又可分为与设备有关的位图(Device-Dependent BitmapDDB)和与设备无关的位图(Device-Indepentent BitmapDIB)区别：位图文件占据的存储空间比较大。影响位图文件大小的因素：图像分辨率和像素深度（分辨率越高，表示组成一幅图的像素越多，图像文件就越大，像素深度越深，表明表达单个像素的颜色和亮度的位数越多，图像文件也越大）矢量图文件的大小：主要取决于图的复杂程度矢量图与位图相比，显示位图文件比显示矢量图文件要快矢量图和位图之间可以用软件进行转换，由矢量图转换成位图采用光栅化技术，这种转换相对容易，由位图转换成矢量图用跟踪技术，这种技术在理论上讲是容易的，但在实际中很难实现，对于复杂的彩色图像尤其如此。GDI：图形设备接口，（Graphic Device Interface）,提供画图工具，但并不是主要工具，是画图画好后的后续工作任何图形(图像在某种程度上也可看作为图形)的显示输出都离不开GDI。基于Windows 环境使用GDI 实现绘图，一般需要具备两个要素，设备描述表和绘图工具。逻辑坐标：逻辑坐标与设备无关.是内存中虚拟的坐标。一个像素为一个逻辑单位。设备坐标：图形输出时，Windows 要将逻辑坐标映射为设备坐标。在所有的设备坐标系中，单位以像素点为准，水平值从左到右增大(正方向向右)，垂直值从上到下增大(正方向向下)。有时为了程序设计的方便，习惯上将逻辑坐标所在的坐标系称为窗口。对应地，将设备坐标所在的坐标系称为视口。窗口依赖于逻辑坐标，可以是像素点、毫米或其他尺度。绘图模式：？画笔和画刷对点线的绘制和图形的填充起着很重要作用，当Windows 使用画笔画线时，它实际上是在画笔像素和目标位置处原像素之间执行一种按位布尔运算，称为光栅操作简记为ROP。由于画线操作只涉及两种像素(画笔像素和目标像素，所以这种布尔运算又称为二元光栅操作(ROP2)。前5个为重点：图像处理：(Image ProcessingIP)是指对图像进行分析、加工和处理，使其满足视觉、心理以及其他要求的一门技术。其实质是运用计算机对图像数据进行各种运算，一般包括图像数字化、图像压缩与编码、图像增强与复原、图像分割与分析等。图像处理的基本目的：提高图像的视感质量。提取图像中所包含的某些特征或特殊信息。图像数据的变换、编码和压缩.以便于图像的存储和传输。彩色图像：真彩色图像：是指图像中的每个像素值都分成R、G、B3 个基色分量，每个基色分量直接决定其基色的强度，这样产生的色彩就称为真彩色。伪彩色图像：是指为改善视觉效果，利用计算机图像增强技术对图像的灰度赋予的不同假色彩。区别：真彩色图像 (True Color Image)是指每幅彩色图像是由红(Red)、绿(Green)、蓝(Blue)三幅不同颜色的灰度图像组合而成的图像。伪彩色(Pseudo Color Image)图像的每个像素值实际上是一个索引值或代码.该代码值作为色彩查找表 (Color Look-Up TableCLUT)中某一项的入口地址，根据该地址可查找出包含实际R、G、B 的强度值。用这种方式产生的色彩本身是真的.不过它不一定反映原图的色彩。在VGA 显示系统中，调色板就相当于色彩查找表。数字图像处理的含义：是指通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理主要研究、解决以下3 个基本问题，一是寻求高效、实时、保真的图像压缩和编解码技术。二是为了提高图像的质量。三是寻求合适的图像变换理论与技术，大幅度减少计算量。数字图像处理的研究方法：(1) 直接在空间域中处理图像。(2) 在变换域中处理图像。(3) 应用数学形态学运算处理图像。图像增强：就是突出图像中的“有用”信息.剔除“无用”信息，即针对给定图像的应用场合，有目的地强调图像的整体或局部特性，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，扩大图像中不同物体特征之间的差别，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判断和识别效果，满足某些特殊分析的需要。其方法有：空间域法，频率域法（低通滤波法，高通滤波法）图像平滑：图像噪音：(1) 加性噪声，如图像传输过程中的信道噪声等。(2) 乘性噪声，如扫描图像中的噪声等(3) 量化噪声，是数字图像的主要噪声源(4) 由图像切割引起的椒盐噪声(5) 由于变换而产生误差.从而使其反变换后造成噪声。去噪方法：在空间域里，最基本的方法剔除噪声点.即先判定某点是否为噪声点若是，则对其重新赋值，若不是则原值输出。另一种是平均法，它对整个图像进行平均运算。在频率域里，也可分为噪声剔除法和平均法两类.只不过针对的是图像频谱。领域平均法：简单邻域平均（优点是算法简单.计算速度快.但其代价是会造成图像一定程度上的模糊）非加权领域平均： x,y=0,1,N-1;s 为(x,y)邻域中像素坐标的集合，其中不包括(x,y);M 表示集合s 内像素的总数。(2) 加权邻域平均？式中.a=(m-1)/2 且b=(n-1)/2分母是模板系数总和.为常数。邻域平均法的平滑效果与所采用邻域的半径(模板大小)有关。半径愈大.则图像的模糊程度越大.因此.减少图像的模糊是图像平滑处理研究的主要问题之一。为解决邻域平均法造成图像模糊的问题.可采用阈值法、K 邻点平均法、梯度倒数加权平滑法、最大均匀性平滑法、小斜面模型平滑法等。图像平滑的原理用信号处理的理论来解释.就是实现一种简单的低通滤波器。灰度突变在频域中代表了一种高频分量，低通滤波器的作用就是滤掉高频分量，从而达到减少图像噪声的目的。图像锐化和图像平滑恰恰相反.它是通过增强高频分量来减少图像中的模糊.因此又可看成广义的高通滤波。图像产生模糊的原因可从两个角度理解(1) 由平均或积分效应引起，此时可用微分处理(2) 从频谱角度来分析，图像上高频分量被削弱，此时可用高频增强。为实现图像的锐化.需增强高频分量.使图像边缘清晰。不过，边缘突出的同时图像中噪声也会被突出。因此要求原图有较高的信噪比，否则图像锐化后，图像信噪比将更低。音频格式处理是指在计算机内播放或处理音频文件时对其进行数/模转换的过程。列出了几种常见的音频格式。语音合成：是指通过机械或电子的方法产生人造语音的技术，能将任意文字信息实时转化为标准流畅的语音朗读出来，相当于给计算机装上了人工嘴巴。它涉及声学、语言学、数字信号处理技术、计算机科学等多个领域，首先要将文字序列转换成音韵序列，再由系统根据音韵序列生成语音波形，然后再通过指定设备播放出来。语音合成方法：(1) 参数合成：早期的研究主要是采用参数合成方法。贡献较大的是Holmes 提出的并联共振峰合成器和Klatt 提出的串/并联共振峰合成器。这两个合成器都能合成出非常自然的语音。由于准确提取共振峰参数比较困难，虽然利用共振峰合成器可以得到许多逼真的合成语音，但是整体合成语音的音质难以达到文语转换系统的实用要求。(2) 波形拼接：出现的基音同步叠加(Pitch Synchronous Overlap AddPSOLA)方法，使语音的音色和自然度大大提高。基于PSOLA 技术的法语、德语、英语、日语等语种的文语转换系统都已经研制成功。这些系统的自然度比以前自然度要高，并且结构简单易于实时实现，有很大的商用前景。(3) 语音数据库：合成语句的语音单元是从一个预先录下的语音数据库中挑选出来的.理论上讲只要数据库足够大，就有可能拼接出任何语句。由于合成的语音基元都是来自自然的原始发音.合成语句的清晰度和自然度都将会非常高。数据库阶段：。数据库技术的发展是由于人们对数据管理技术提出了更高的要求，减少数据冗余，提供数据共享，数据具有较高的独立性，当数据的逻辑结构改变时，不涉及数据的物理结构，也不影响应用程序，以降低应用程序研制与维护的费用。数据库管理技术的优点：1拥有专门的数据库管理软件，数据以数据库形式保存，最大限度减少