资源预览内容
第1页 / 共16页
第2页 / 共16页
第3页 / 共16页
第4页 / 共16页
第5页 / 共16页
第6页 / 共16页
第7页 / 共16页
第8页 / 共16页
第9页 / 共16页
第10页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第5章数字媒体及应用一.西文字符的编码ASCII(一ASCII=美国标准信息交换码(二标准ASCII:1.采用7个二进位进行编码2.共有128个字符,包含96个可打印字符(常用字母、数字、标点符号等和32个控制字符(三基本ASCII与扩展ASCII的比较:基本ASCII扩展ASCII相同用一个字节(8b存放不同点高位为“0”高位为“1”(四常见字符的ASCII码对照表:字符十进制大小顺序回车符(控制字符13空格(控制字符32数字094857大写字母AZ6590小写字母az97122二.汉字的编码(一GB23121.1981年我国颁布了第一个汉字编码国家标准GB231280(6763个汉字2.组成:第一部分:字母、数字和各种符号第二部分:一级常用汉字(共3755个,按汉语拼音排列第三部分:二级常用汉字(共3008个,按偏旁部首排列3.具体实现:区位码:GB2312国标字符集构成一个二维平面,它分成94行(行号称为区号、94列(列号称为位号。每个汉字的区号和位号分别用1个字节来表示。国标交换码:每个汉字的区号和位号分别加上32D(00100000B。机内码(内码:把一个汉字看作两个扩展ASCII码,在国标交换码的基础上使两个字节的最高位都等于“1”,即分别加上128D(10000000B区位码、国标码、机内码的关系4.特点:早、小、双、简(二GBK1.1995年发布2.共有21003个汉字和883个图形符号3.支持繁体字,包含了中、日、韩认同的全部CJK汉字;4.双字节编码5.向下兼容GB2312-80(三GB180301.2000年发布2.产生原因:保护我国已有的大量信息资源,既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312和GBK汉字编码标准备注:UCS/Unicode:Windows、UNIX、Linux操作系统和许多最新的软件标准都在使用UCS/Unicode。3.共有27000多个汉字(收录字符最多4.不等长编码(四BIG5:台湾地区的字符编码,不支持简体中文,与GB2312等大陆标准不兼容(五GB2312、GBK、GB18030、UCS/Unicode的比较GB2312GBK UCS/Unicode GB18030出现时间1981年1995年2000年意义最早首次支持繁体能实现全球所有不同语言文字统一编码的国际编码标准支持汉字数目最多汉字数目6763个21003个2万多汉字27484个支持繁体否是是包含CJK否是是是编码方式双字节双字节不等长编码1B、2B、3B不等长编码1B、2B、4B兼容性向下兼容GB2312不兼容向下兼容GB2312和GBK 与UCS/Unicode接轨三.文本的准备(输入文本信息输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别(一汉字的键盘输入编码(即汉字的外部码1.要求:易学、易记、效率高、重码少、容量大2.分类:数字编码、字音编码(字音编码、字形编码(五笔字形、形音编码3.注意:用不同的输入编码方法输入同一个汉字,其内码是一样的。(二联机手写汉字识别笔输入设备(三印刷体汉字识别输入扫描仪、OCR四.文本的分类(一按是否具有编辑排版格式分:1.简单文本1又称为纯文本、ASCII文本,其文件的后缀为“.txt”(文本文件2定义:由一连串用于表达正文内容的字符的编码组成,几乎不包含任何其他的格式信息和结构信息3特点:没有字体、字号的变化,不能插入图片、表格、超链接2.丰富格式文本1在简单文本中增加格式控制和结构说明信息2标记:用来说明文本的版面结构、内容组织、文字的外貌属性等3组成:正文+标记4标记语言:A.普通:RTFB.网页:HTML(超文本标记语言、XML(可扩展的标记语言5不同的文字处理软件使用的标记语言不同,Word无法打开“*.pdf”文件(二按文本内容的组织方式分:1.线性文本2.超文本1采用网状结构组织信息2可以通过导航、跳转、回溯等操作,实现对文本内容更为方便的访问3典型代表:Windows中的“帮助”文件(“*.hlp”文件(三按文本内容是否变化和如何变化分:1.静态文本:每次访问相同结果2.动态文本:文档内容变化(天气查询3.主动文本:持续更新显示文档内容(股票行情查询五.文本的编辑、排版与处理(一文本的编辑、排版1.文本编辑软件“所见即所得”(WYSIWYG2.解决文本的外观问题:使文本正确、清晰、美观例如:添加页眉和页脚、设置字体和字号、设置行间距,首行缩进3.常用排版软件:PDF Writer、PageMaker、方正飞腾(二文本处理1.对文本中所含文字信息的形音义等进行分析和处理2.例如:1字数统计2文语转换3文摘生成4文本检索A.工作原理:用户先给出查询要求,然后由文本检索系统将查询近似结果返回给用户B.分类:a关键词检索b全文检索:允许用户对文本中所包含的字或词进行查询(查全率高C.用于Web信息检索的搜索引擎大多采用全文检索,使用robot软件遍历Web上的信息资源a如Google、Yahoo、天网、搜狐和百度等bWeb信息是动态变化的,因此搜索引擎要不断的更新索引数据库3.常用文字处理软件:WPS、Microsoft Word、FrontPage、PDF Writer微软公司的网页制作软件FrontPage也是一种功能丰富、操作方便的文字处理软件,它不仅可以对字体段落进行格式编排,而且能够定义超链。(三各种输入码交换码(国标码内码字形码显示汉字打印汉字面向电子出版的最流行的软件是美国Adobe公司的Acrobat,它使用PDF格式(Portable Document Format六.文本的展现(一文本展现过程:1.对文本的格式描述进行解释2.生成文字和图表的映像3.传送到显示器或打印机输出(二文本阅读器(浏览器:Word、Acrobat Reader、IE(三字型库:1.简称字库,同一种字体的所有字符的形状描述信息的集合。2.字体VS字库:不同的字体(宋体、仿宋、楷体、黑体等对应不同的字库3.字符集VS字库:在同一个字符集下,文本的输出所使用的字库不同4.2种不同的字库:点阵描述(计算存储空间、轮廓描述(Truetype七.计算机图像(一定义:从现实世界中通过数字化设备(扫描仪获取的图(二又名:取样图像、点阵图像、位图图像(三图像数字化过程:1.扫描:将画面划分为M x N个网格,每个网格称为一个取样点。2.分色:将彩色图像取样点的颜色分解成三个基色3.取样:测量每个取样点每个分量(基色的亮度值4.量化:对取样点每个分量的亮度值进行A/D转换(四数字图像获取设备:1.例如:扫描仪、数码相机等2.基本原理:通过光敏器件(CMOS或CCD将光的强弱转换为电流的强弱,然后通过取样、量化等步骤,进而得到数字图像3.可以通过参数设置,得到彩色图像或黑白图像(五图像的主要参数:1.图像大小(图像分辨率1垂直分辨率:矩阵的行数水平分辨率:矩阵的列数2像素总数=垂直分辨率X水平分辨率A.像素:每个取样点B.像素是组成取样图像的基本单位3若图像超过了屏幕(或窗口大小,则只能显示图像的一部分,使用滚动条可看到全部图像。2.颜色空间的类型(颜色模型:1定义:指彩色图像所使用的颜色描述方法2常用的颜色模型:RGB、CMYK、HSB、YUV等(颜色模型可以相互转换3.像素深度:1黑白或灰度图像用1个矩阵表示,彩色图像用多个(一般为3个矩阵表示2定义:像素的所有颜色分量的二进位数之和3意义:决定了不同颜色(亮度的最大数目4若R4b、G4b、B4b,则最大颜色数目为4096(六图像数据量=图像水平分辨率图像垂直分辨率像素深度/8(七数字图像应用:可视电话、卫星遥感、计算机断层摄影(CT(八图像压缩1.可行性:图像中数据相关性很强,人眼的视觉有一定的局限性2.方法:1图像压缩方法很多,不同方法适用于不同的应用,一台计算机能使用多种压缩方法。2优劣评价标准:适用范围、压缩倍数的大小、重建图像的质量(有损压缩时、压缩算法的复杂程度(九常用图像文件格式1.BMP:Windows使用的标准图像格式,几乎所有Windows应用软件都支持2.TIF:大量用于扫描仪和桌面出版3.GIF:压缩比(无损压缩可调,文件特别小颜色数较少(不超过256色,常用于色彩数要求不高的场合作为插图、剪贴画等使用,支持透明背景,具有渐进显示功能,形成动画效果,适合网络传输4.JPEG:适用范围最广(国际标准、可支持有损压缩、主要应用领域之一是数码相机5.JP2:特别采用了小波分析等先进算法,比JPEG好,更适合网上传输(十图像处理1.目的:图像分析、提高图像的视感质量、图像复原和重建2.通用图像处理软件的基本功能:图像的缩放显示、调整图像的亮度与对比度等、在图片上制作文字等,并与图像融为一体3.数字图像处理软件:PhotoShop、Microsoft Photo Editor、PhotoImapact八.计算机图形(一定义:使用计算机合成制作的图(二又名:矢量图形(三建模/造型绘制景物的模型景物的视图过程:使用计算机描述真实(假象景物的结构、形状与外貌,在需要显示图像的时候,再根据其描述和用户的观察位置及光线的设定,生成该景物的图像。(四计算机图形学CG:研究如何使用计算机描述景物并生成其图像的原理、方法与技术(五过程模型/算法模型:根据景物的生成规律,并使用相应的算法来描述其规律所建立的模型(如描述树木、花草、烟火、毛发、山脉等(六使用计算机合成图像的主要优点:1.能生成实际存在的具体景物的图像和假想或抽象景物的图像2.能生成静止图像和各种运动、变化的动态图像3.图形文件中只记录生成图的算法和图上的某些特征点,数据量较小(七计算机合成图像的应用:1.计算机辅助设计、设计绘制电路图(最直接的应用2.设计制作石油开采地形图3.制作天气图等4.计算机动画(八矢量绘图软件:AutoCAD、CorelDraw、Illustrator、FreeHand、Microsoft Visio九.声音(一声音信号的数字化:1.定义:将模拟声音信号转换成二进制数字编码形式以便于计算机进行处理的过程2.过程:1取样A.声音是一种波,它由许多不同频率的谐波组成,谐波的频率范围称为声音的带宽。a全频带声音:20Hz20KHzb言语/语音:人说话的声音,约为3003400HzB.语音的取样频率8KHz、音乐的取样频率40KHz以上2量化A.本质:AD转换B.量化精度越高,声音的保真度越好,噪音越低3编码A.经过取样和量化后的声音,还必须按照一定的要求进行编码B. C. 3. 目的:减少数据量,并按某种格式将数据进行组织 IP 电话语音信号需要进行数据压缩 波形声音获取设备: 1 麦克风:将声波转换为电信号 2 声卡 A. 功能:波形声音的获取与数字化、声音的重建与播放、MIDI(乐器指令数字化接口)声音的输 入、MIDI 声音的合成与播放 B. 声卡以数字信号处理器 DS
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号