资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
汉字录入与编辑技术 (第四版),王式杰 邢小茹 郝 健 编,第三章 五笔字型法汉字输入,3.1 五笔字型输入法简介 五笔字型汉字输入法是一种形码。它是王永民先生在八十年代初期研制发明的一种输入法。一般用户认为它输入速度快,因为它重码少,基本上不用选字,一般用户经过几十小时的训练,输入汉字的速度可达到每分钟百字以上,但由于中国汉字具有大量的同音字,就象其它形码一样,五笔字型输入法也难以满足“听打”的要求,这是它的不足之处。在学习过程中,这种方法的记忆量较大,有一定的难度。,第三章 五笔字型法汉字输入,3.2 五笔字型输入法 3.2.1 汉字的三个层次 五笔字型输入法的研制者在对大量汉字进行分析、对比、统计后得出这样的结论:汉字的结构是由笔划(笔画)、字根和成字等三个层次构成的。 笔划 五笔字型中规定:一个连续书写、不间断的线条叫做一个“笔划”。五笔字型的研制者把众多的笔划分为了五类,分别是:横、竖、撇、捺、折,并顺序给以、的笔划代号。,第三章 五笔字型法汉字输入,字根 不同的笔划复合、连接、交叉又会形成一些相对不变的结构。这些结构经常用来组成完整的汉字,已经成为组字的固定成分。我们称它们为“字根”。在五笔字型中大多数字根就是汉字的偏旁部首,象单立人、双立人、金字旁、火字旁、三点水等。除此之外,研制者还自己规定了一些字根,经过对传统偏旁部首的精心筛选,加上研制者自行规定的字根,共得到个基本字根,并把这些字根按使用频度和手指的灵活程度,分布在英文键盘的前个键位上。利用这些字根就可以拼合成我们用到的所有汉字,这些字根是组字的依据,是组成汉字的基本零件。前面讲过的五种笔划就是五笔字型中最简单的五个字根。五笔字型的学习,就要从记住这些字根开始,而学习过程中大量的练习则是对汉字的拆分,就是将要输入的汉字拆分成这个字根中的某些字根。,第三章 五笔字型法汉字输入,成字 由笔划、字根拼合就可以得到完整的汉字。在学习字根时,同学们也能够发现,其实许多字根本身就是一个完整的汉字,可以直接使用。成字才是我们学习汉字输入的最终目标。在五笔字型的学习中,要想达到输入汉字的目的,就必须经过笔划、字根的学习阶段。,第三章 五笔字型法汉字输入,3.2.2 基本字根及其键位 五笔字型的个字根分配在键盘的前25个英文字母键上。首先将这些字根按其第一笔的笔划分为五个大类,每一类字根对应安排在五个键位上,将同一类字根所对应的键位叫做一个“区”。这样,分别得到了横起笔区、竖起笔区、撇起笔区、捺起笔区和折起笔区。也叫做区、区、区、区、区。每个区有五个键每个键叫一个“位”,每个位也都分别给以至的代号。这样做之后,这个英文字母键就都有了唯一的一个两位数字代号,其中十位数字是它所在的区号,个位数字是它所在的位号。今后在学习五笔字型中既可以用某个英文字母来称呼某个键,也可以用某个两位的阿拉伯数字来称呼它,至此每个键有了两个名字。 每个键位上都分配有不同数量的字根。每个键位上都还有一个中文字,这是这个键位上的高频字,或叫“一级简码”。为了习惯,五笔字型的研制者还为每个键位起了个汉字的键名,因此每个键就有了三种称呼方法:英文字母、两位数字和汉字。,第三章 五笔字型法汉字输入,字根排列规律 1.几乎所有字根的首笔代号都与它所在键位的区号一致(个别字根没有按这一规律安排键位,比如“车、力”)。可以利用这一特点来提高输入时的速度,减少查找键位的时间。当要使用某个字根时只到它的第一笔所在的区内去找相应的键位。 2.相当多字根的次笔代号与它所在的位号相一致。同样可以利用这一特点来提高输入速度。当使用某一字根时,按它的第一笔找到区号,在本区的五个键内再按它的第二笔代号去找它的位号,一般都可准确找到正确的键位。在初学时就按这样的思路去练习,不光动脑拆字、记字根,还去动手找键位,对于牢记字根,熟练录入往往可以收到事半功倍的效果。 3.每个区的前几个键位上都按笔划数不同的顺序排列着这种笔划的字根。比如一笔横在一区一位;两笔横在一区二位;三笔横在一区三位等。其它几个区的安排方法也是这样的,类似地你可以在二区四位找到四笔竖,在五区三位上找到三笔折的字根。这个规律也可以帮助我们记忆。,第三章 五笔字型法汉字输入,4.有些字根以与键名字根或主要字根形近或渊源一致为准而将它们放在同一键位上。比如在四区三位上就可以找到许多与“水”形近的字根。细心的读者还可以发现不少这样的情况。把这些情况记住,也有助于迅速找到应有的键位。 5.有些字根以义近为准放在同一键位上,这有些象汉语的“假借”。如传统的偏旁“单立人”与“人”放在一起;“竖心”与“心”放在一起;“提手”与“手”放在一起等。又如“言”与简体字的言字旁、“金”和简体字的金字旁就已经是意义完全相同了,因而放在同一键上。 6.个别字根特殊对待,这里大多是按其拼音分布,比如“口”的拼音是Kou,就放在了键上;“力”的拼音是Li,就放在了键上;会下象棋的人都知道繁体的“车”字与“田、甲”字形近,所以把它们放在了一起。这时可能违反了按字根的第一笔笔划分区的原则。又如,“几”,它是以与下框形近为准而放在二区五位上的但它的第一笔不是竖;“心”是因其最长的一笔为折而放在了五区一位上,大多数人书写它时第一笔是点。,第三章 五笔字型法汉字输入,3.2.3 汉字的拆分原则 汉字的三种字型结构 左右型:也包括左中右型。如果一个汉字可以很自然地被纵向划分为左、右两部分或左、中、右三部分,就说这个汉字是左右型汉字,并给以字型代码为“”。 上下型:也包括上中下型。如果一个汉字可以很自然地被横向划分为上、下两部分或上、中、下三部分,就说这个汉字是上下型汉字,并给以字型代码为“”。 杂合型;如果组成汉字的各成分之间没有明显简单的左右或上下关系,就说这个汉字是杂合型汉字,并给以字型代码“”。,第三章 五笔字型法汉字输入,3.2.3 汉字的拆分原则 杂合型的特殊规定: 1.单笔划与字根相连的汉字规定为杂合型。如:“自、尺”等字。 2.带点的汉字结构归为杂合型。如:“术、太、斗”等字。 3.含两字根且两字根相交的汉字归为杂合型。如:“东、电、本”等字。因此在区分字型时,能把汉字看成两个分离的字根,就尽量不要把它看成紧挨着或相交的若干字根。比如:“天”字就应看成“一、大”两个字根而不视为“二、人”两个字根。 4.带走之的汉字为杂合型。如:“边、远、这”等字。 5.内外型汉字为杂合型。如:“母、因、廊”等字。,第三章 五笔字型法汉字输入,末笔字型交叉识别码 把汉字的最后一个笔划叫做它的“末笔”,这个末笔自然有一个笔划代号。任何一个汉字总能归为某一类字型中,它又有了一个字型代号。以末笔代号为十位数字、以字型代号为个位数字,就可以得到一个两位数字的代码,这个代码就称为汉字的“末笔字型交叉识别码”。前面我们已经学过,在五笔字型的键盘中,个英文字母键各自都有一个两位数字的键名,把刚才得到的两位数字代码看成某个键位的键名,就可以找到一个键位。所以“末笔字型交叉识别码”实际上就是一个键位。,第三章 五笔字型法汉字输入,由于书写习惯的不同,有时同一个汉字有不同的笔顺,而执每一种笔顺的人数都相当多,因此五笔字型法对一些汉字的末笔做了硬性规定: 1.凡最后两笔为撇和点的汉字,规定末笔为“撇”。如“我、成、俄”等字。 2.凡最后两笔为撇和折的字,如“九、匕、力”等字,规定末笔为折。 3.凡包围型的汉字,末笔以被包围部分的末笔为准。如“国”字末笔为点;“回”字末笔为横;“园”字末笔为折等。 4.带走之的汉字,末笔以走之内部的末笔为准。如“连”字末笔为竖;“远”字末笔为折;“运”字末笔为点等。 记住这些规定,有利于区分末笔字型交叉识别码,习惯上也经常把末笔字型交叉识别码简称为“识别码”。,第三章 五笔字型法汉字输入,组成汉字时字根间的结构关系 在组成汉字的方式中,字根与字根间的结构关系一般有以下四种: 单:字根本身就是一个独立的汉字的情况叫做“单”。在五笔字型的全部字根中,这种情况很多。而“单”的情况又可以分为两种:一种是每个键位的中文键名(最后一个键名“纟”视为一个汉字),这种键名只有个(比如“王、土、大”等);另一种是每个键位上除键名以外的那些独立成字的字根,我们称之为“成字字根”,大约共有余个(比如“文、方、九”等),这里包括五种基本笔划。在输入这些汉字时,不必将它们拆分成更小的组字成分,也不必去考虑它们的字型分类。 散:当几个字根共同组成一个汉字时,字根与字根之间保持了一定的距离,它们既不相连又不相交,单摆浮搁着,这种情况叫做“散”的结构。比如:“汉、字、培、训、明”等字。“散”的情况是最易拆分的一种结构。,第三章 五笔字型法汉字输入,连:单笔划与某一字根相连或带点的结构叫做“连”,“连”是指两个字根刚刚挨上的情况。这时特别要注意的是带点的结构,这些“点”与其它基本字根并不一定紧挨着,它们之间可能贴紧也可能有一点距离,但在五笔字型中都规定为“连”。比如:“且、于、玉、刃、下”等字。 交:两个或两个以上的字根交叉、套迭的情况叫做“交”。如:“申、必、农、果”等字。 经常有一个汉字在组成时同时出现了上述多种结构的情况,比如“夷”字中的“一”与“弓”是散的关系,而“一、弓”与“人”又都是交的关系了。弄清汉字组字时的结构关系,才能很好地对汉字进行拆分。,第三章 五笔字型法汉字输入,汉字的拆分原则 一个汉字在输入之前首先要对它进行拆分,将它分解为基本字根,再依这些基本字根的键位按笔顺顺序输入。 显然,在拆分时我们必须遵守书写习惯,也就是说正常的笔顺不能被破坏。这是中国几千年的文化传统,也是十几亿中国人的文化习惯。但在86版的五笔字型中,有时没有很好的照顾这个习惯,引起了一些非议,这是早期五笔字型的缺陷。 既然是“拆分为基本字根”,那么前面所讲的四种结构中“单”的情况就已经不属于拆分之列。我们把其余几种情况所构成的汉字称之为“合体字”。所谓的拆分汉字实质上是对合体字的拆分。,第三章 五笔字型法汉字输入,五笔字型中的汉字拆分原则是:“取大优先、兼顾直观、能连不交、能散不连”等十六个字。 取大优先:所谓“大”是就字根中包含的笔划多少而言的。包含笔划多的字根就叫“大”于包含笔划少的字根。如果一个组字的结构成分上再加一笔就不能构成一个字根了,这时得到的这个组字成分就叫“最大字根”。在按笔顺拆分汉字时,应该保证每一次拆出的新字根都是最大的字根。这就是“取大优先”的原则。比如拆分“奉”字。按笔顺,得到第一笔是“一”,它是一个字根;继续加写一笔,得到“二”,仍是字根;再加写一笔,得“三”,还是字根,加写第四笔后,不是字根了。根据前面讲述的规则,“三”就是第一次拆出的最大字根。类似继续拆分下去(已经拆出的字根就不再考虑,按笔顺继续往下写),可以得到第二个最大字根是“人”。如此进行下去,可以把“奉”字拆分为“三、人、二、丨”等四个字根,这是这个字的正确拆法。拆分汉字时首先要执行取大优先的原则。,第三章 五笔字型法汉字输入,兼顾直观:这是保证拆分结果比较直观的意思。它往往要和“能散不连”的原则联合使用。这也是五笔字型中较难掌握的拆分原则。使用这一原则,有时不得不暂时违反书写顺序或与“取大优先”的原则产生矛盾。“国”字的字根顺序应该是“下框、王、点、一”,但这样拆分就把中国字的“大口框”分解成了两部分,有悖于汉字的字源。所以还是把它拆分成“口、王、丶”。 能连不交:这是说有些汉字既可以按“连”的结构对待,又可以按“交”的方式处理。此时就应该按“连”来拆分它而不要按“交”的关系来拆分。因为“连”的结构比“交”简单。比如“天”字。如果拆成“二、人”,两个字根间就是交的关系;拆成“一、大”,两字根间就是连的结构了所以“天”字的正确拆法是拆成“一大”。而这样拆法又违反了“取大优先”的原则(因为“二”比“一”大)。因此,汉字拆分时要综合考虑所有的拆分原则。,第三章 五笔字型法汉字输入,能散不连:当一个汉字的结构既能被看成“散”的关系又能被看成连的关系时,应该按“散”的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号