资源预览内容
第1页 / 共67页
第2页 / 共67页
第3页 / 共67页
第4页 / 共67页
第5页 / 共67页
第6页 / 共67页
第7页 / 共67页
第8页 / 共67页
第9页 / 共67页
第10页 / 共67页
亲,该文档总共67页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章 文字,1. 文字属性,在排版术语中,文字被称为字模。字模是一个传统概念。原指铸造的铅活字模型,现指印刷用字。 字模(文字)有三个属性:字体、字号、心身比。 字体:文字的书写样式 字号:字模边框的高度 心身比:字心与字身的面积比 过去铅字的心身比为98%, 照相文字心身比为92.5%。方 正书版和发排系统允许选择不 同的心身比。在其它条件相同 的情况下,采用不同的心身比 得到不同的版面效果。,基线:在排版时,同一行中的文字相对齐的线称为基线,横排时基线为文字的下边,竖排时基线为文字的左边线。 法线:通过上下边线中点的竖直线称为法线。 法线方向向上。 中线:通过左右边线中点的水平 线称为中线。 排成一行的文字也可以以中线 或以法线相对齐。,字模,中线,字身,字心,边框,法线,基线,1.1 汉字属性,汉字信息处理技术是汉字文字处理技术的基础,它体现在对汉字属性的处理过程中。汉字的属性包括汉字的字量、字频、字形、字音、字义等,对这些属性的信息化处理贯穿在汉字信息处理流程的各个阶段以及相关的技术考虑中。,1汉字的字量 在中文电脑中,选用或配备多少个汉字由所用的汉字编码字符集标准来决定。国家标准GB2312-80基本集共收录汉字6763个,其中常用字(一集字库)3755个,次常用字(二集字库)3008个。此外,国家标准的两个辅助集收录了稀用字和罕用字共16000余个。,2汉字的字频 上述汉字编码字符集中汉字的选用是建立在汉字使用频率的统计基础上。例如国标一集字库3755个汉字在通用文献中的使用频率是99.9%,加上二集字库一共6763个汉字的使用频率覆盖了通用文献应用的99.99。两个辅助集中的汉字的使用频率在万分之一以下。不过汉字的使用频率受时空的限制,在不同的时代背景下具有显著差异,在不同的专业领域中差异也很大。,3汉字的字形 在汉字的各种信息中,汉字的字形是最重要的一种。字形可以按照“汉字/部件/笔画”三个层次进行分解。汉字字形的分解方式是汉字的输入与输出技术、以及汉字字模生成的基础。,4汉字的字音 汉字的字音是汉字输入、排序的基础。此外,是汉语语音的自动识别与合成技术中处理的对象。汉语是一种单音节语言,在汉字中同音现象十分突出。最多一音达120130个字。 5汉字字义 语言的表现形式是“音”,其潜在内容是“义”,文字的表现形式是“形”,其潜在内容是“音”和“义”。每一个汉字都是多义的,对于语义歧义的处理是中文语音自动处理、机器翻译、自然语言理解等方面计算机人工智能技术发展的关键。,1.2 汉字的编码,汉字编码是一种以编码代替汉字的语言,即对汉字字形中的整字、部件或笔画分别以数字或字母代替,则字形就可以转换为一个数字串或字母串。这种转换为汉字编码。 编码要求:键数少,效率高、重码少。记忆量少、规律性强、操作简单。,1.3 汉字编码方案,1、字根代码类编码方案; 将一个字分解成若干基本单元,每个单元以字母代替,然后将这些单元按照一定规律排列起来,就是一串字母,也就是该字的编码。 2、字音代码类编码方案 利用汉字的字音对汉字进行编码。由于同音字较多,需要全部显示出来进行二次选择。,3、角形 汉字是方块字,每个汉字都可看成有4个角。对角码输入法将汉字的各种角形归纳为5种,这就是:横(一)、竖(丨)、点(丶)、叉()、角(),并分别用1、2、3、4、5五个号码表示。 4、音形结合,1.4 字形技术,计算机字形技术包括字形的信息压缩、存储、还原、缩放等一整套处理技术。 点阵字体 把一个汉字写在一张坐标方格纸上,区别有笔画处和无笔画处,空白处记作0,黑点处记为1,这样由0或1组成了这个汉字的点阵,顺序把点阵排列记录下来,形成一组数字,即为该汉字的字形信息,这就称为点阵成字。 点阵字库是把每一个汉字都分成1616或2424个点,这类点阵字库汉字最大的缺点是不能放大,一旦放大后就会发现文字边缘的锯齿。,矢量字体 矢量字体保存的是对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在显示、打印这一类字库时,要经过一系列的数学运算才能输出结果,但是这一类字库保存的汉字理论上可以被无限地放大,笔划轮廓仍然能保持圆滑,打印时使用的字库均为此类字库。, 曲线轮廓字 (True Type字和 Postscript 字 )这种字库描述采用二次或三次曲线作为基础,用特殊的手段保证在平滑过渡点的连续性。这种字库解决了前几代字模存在的问题,不仅连续性好,字形美观而且变化丰富,不易走形。更好的符合印刷及高质量输出的要求。,1.5 字形压缩技术,对精密汉字字库的存储则需要大量的存储空间。为了节省空间,往往采用字符压缩的方法来存储。 压缩点阵存储法 基本原理是把汉字字形看作是简单的笔画组成,采用矩形或其他基本图案进行编码、存储 。 压缩点阵的特点:是简单直观,硬件比较简单,平均压缩率在40左右。对分辨率高、字形尺寸较大的汉字,其适应变化能力较差。,矢量轮廓压缩法 基本原理是把汉字看成由两维构成的平面图形,每一笔画是由起点、终点位置的一条曲线组成,用矢量(直线、折线段)逼近字形笔画轮廓,记录下矢量线段的坐标、长度,然后用一组代码来描述汉字字形的信息。 曲线轮廓压缩法 为了解决矢量字体放大后的锯齿现象,一种用数学上的二次、三次曲线来代替一次曲线,并配合使用曲线和直线来描述字符轮廓的曲线字形压缩方法应运而生,即称为曲线轮廓压缩法。,1.6 字库,汉字字形在计算机中是一组数据信息将所有的字形数据集中在一起,就构成了计算机字库,它是集中存放的字形信息的地方。,Windows使用的字库也为以上两类,在FONTS目录下, 如果字体扩展名为FON,表示该文件为点阵字库,扩展 名为TTF则表示矢量字库。点阵字库文件的图标为一个 红色的“A”,矢量字库图标是两个“T”。,1.7 字形的质量和精度,组成汉字的点越多,表现的字形越美观,数据量就越大,存储、还原越难。实际应用中,字形精度要根据用途和需要合理的选取。通常屏幕显示为16*16或24*24,针式打印机为24*24或32*32,激光、喷墨打印机为40*40或64*64点阵。(下图为16*16和48*48),曲线轮廓字体的输出过程实际上是描绘路径元素和对其进行加网填充的过程。 从原理上讲,曲线字体可以被任意地的放大或缩小,不会产生除尺寸以外的变化。但当字体要在光栅设备上输出时,再精确的字体轮廓描述最终还是要扫描转换成离散的点阵表示。字体在扫描转换过程中的舍入是不可避免的,这对中等字号以上的字体或许不会造成太严重的问题,但对于小字号的字符在输出或在低分辨率设备上显示时,如果对舍入不加控制,则将造成字体还原时出现笔画不均、粘连或断笔等明显的字体失真现象。而在出版物中的正文通常使用的都是小字号,输出还原小号字时需附加小字还原时所需的控制信息,否则这种字库是不能用于印刷的。,1.8 字符的控制信息技术,Hinting技术 为了解决曲线字体还原失真现象,PostScript语言引入了控制信息技术,即Hinting技术。该方法将字体的重要几何特征预先测量并记录下来,作为字体描述的辅助信息与字体一起保存。还原时,字体辅助信息与字体轮廓描述数据一起提供给字体还原程序,还原程序则根据这些辅助信息对字体轮廓变化时的舍入进行控制,使还原出的字符能保证重要的几何特征不被破坏。,汉字True Type字体的控制信息特点 对汉字True Type字体来说,实施Hinting技术实质是解决输出时小字号汉字的掉点现象,主要问题是: 控制重要笔画的宽度。 控制重要笔画间的距离。 控制拐角间的对称性。 保证字符的结构特征。 保证笔画不丢失。 保证字体清晰。,1.9 字体,Type 1字体 该字体技术是20世纪80年代中期Adobe公司随页面描述语言PostScript的诞生而一起推出的。是一种PS字体,采用三次Bezier曲线描述字符轮廓,数据量小。 在使用时,需要PS打印机字体、至少一种屏幕字体以及ATM(Adobe Type Manager Adobe字体管理程序。可在屏幕上显示各种字号的字体和在非PS打印机上打印),TrueType字体 该字体技术最早由Apple和Microsoft公司联手推出。是页面描述TrueImage中的字形描述方法。采用B-Spline二次样条曲线描述字符轮廓。还原速度快,可以适用于任何打印机,支持跨系统。没有显示字库、发排字库之分。,Type 1字体和TrueType字体的比较。 Type 1字体采用三次Bezier曲线描述字符轮廓, TrueType字体采用B-Spline二次样条曲线描述字符轮廓。 Type 1字体的数据量比TrueType字体的数据量小。 Type 1字体的还原速度比TrueType字体的还原速度慢。 系统使用Type 1字体时必须有ATM(Adobe Type Manager)来进行管理,而Mac OS和Windows都内置了TrueType字体解释器,都支持TrueType字体。 Type 1字体是通过ATM提供给应用软件使用的,它被挂接到系统时需要额外的内存,TrueType字体由操作系统来直接管理,管理比方便。,2. 文字的字体规格,印刷体字:用于印刷排版的字。印刷体字具有美观、字形规范、笔画统一、大小一致的特点,非常方便人们的阅读。 从事文字排版工作,必须具备字体与字号知识,能够做到以下几点: 正确地识别各种印刷字体,了解各种字体基本特征及相互之间的区别。 熟悉各种出版物在正文、标题上用字的一般规则,掌握各种印刷字体的使用和搭配。 比较准确地掌握字大小的使用规则。 掌握字形的常见修饰方法。,2.1 汉字的印刷字体,1. 常见基本汉字字体 在汉字的印刷字体中,最常用的基本字体有宋体、仿宋体、楷体、黑体四种。,方正飞腾排版系统,方正飞腾排版系统,方正飞腾排版系统,方正飞腾排版系统,仿宋体字 特点:笔画比较细瘦,横竖笔画粗细一致,横笔画略向右上方倾斜,起笔和落笔都有顿角,笔锋十分尖锐。仿宋体字的风格独特,挺拔俊秀,清晰悦目,适用于排印诗词、古籍、说明注释、小标题等。,宋体字 特点:笔画的起笔和收笔都有装饰角,转折处有顿角;竖粗、横细,竖画比横画粗三分之一到五分之一。宋体字横平竖直,形态方正,饱满匀称,笔法严谨,风格独特,美观实用。 宋体是最通行的汉字印刷字体。常用于书籍报刊正文。,黑体字 特点:笔画粗细基本一致,但中间略细,两端略粗,方头方尾,转折处没有顿角。黑体字的字形端正古朴,浑厚有力,庄重醒目。是一种最为通用的标题字。,楷体字 特点:是笔画粗细均匀,流畅自然,如同毛笔书写出的。字形上朴实端正,易于认读。适用于通俗书刊、小学课本、幼儿读物、也适合排图书报刊的标题、信函等。,2. 其他汉字字体 除宋、仿宋、楷、黑四种基本字体外,电子排版系统还有许多种印刷字体可以供人们选用,如行楷、魏碑体、隶书、姚体、幼圆、彩云、舒体等。 3. 汉字印刷字体的阅读适性与印刷适性 印刷体汉字最大的特点,是印在纸张上供人们阅读的,因此必须满足两个基本要求:一是适合阅读,专业上叫“阅读适性”好;二是适合印刷,专业上叫“印刷适性”好。,2.2 印刷排版中的外文字,1. 外 文 文 字,2. 外文字体 国外的一些电子排版系统将多种不同的字体集中在一起,叫字体族。 Time字体族、Heivetica字体族、Courier字体族 现代罗马体:Times Roman,俗称白正体; 意大利体:Times Italic,俗称白斜体; 黑体:Times Bold,俗称黑正体。 字的间隔处理、合成(叠)字(Kerning)、分词(Hyphenation),2.3 印刷排版中的数字,2.4 标点符号的种类及排法,1. 标点符号的种类,全角(全身):文字排版中标点符号在版面上占一个汉字的位置。 半角(对开)占半个汉字的位置。 具体排法有下面几种形式: 开明制 仅句号、问号、叹号占一个汉字的位置(全身),其它标
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号