资源预览内容
第1页 / 共2页
第2页 / 共2页
亲,该文档总共2页全部预览完了,如果喜欢就下载吧!
资源描述
五笔汉字拆分的原则.五笔字型的拆分原则是“书写顺序,取大优先,兼顾直观,能连不交,能散不连”。一:取大优先:尽可能取文字中最大的字根。例 1:世:第一种拆法:一、凵、乙(误)第二种拆法:廿、乙(正)显然,前者是错误的,因为其第二个码元“凵” ,完全可以向前“ 凑”到“一”上,形成一个 “更大”的已知码元“廿”。例 2:制:第一种拆法:、一、冂、丨、刂(误)第二种拆法:、冂、丨、刂(正)同样,第一种拆法是错误的。因为第二码的“一”,作为“”后一个笔画,全可以向前“凑”,与第一个码元“”凑成“ 更大” 一点的码元 “”。总之, “取大优先”,俗称 “尽量往前凑”,是一个在汉字拆分中最常用到的基本原则。至于什么才算“大”, “大”到什么程度才到“ 边”,这要等熟悉了码元总表,便不会出错误了。 二:兼顾直观:牺牲正常的书写顺序,特例拆根。例如“国”字,按书写顺序,应取“ 冂、王、丶、一”,但这样编码,不但有悖于该字的字源,也不如使码元“ 囗” 直观易辩。我们只好违背书写顺序,按“囗王丶”的顺序编码。再如“ 戋”字,按取大优先,应取“二、匕、丶”,但没有取“ 一、戈” 直观,所以用后者。三:能散不连:能散开的字根就不要连到一起拆。 “主”字按取大优先,应取“ 亠、土 ”,但根据此规则,只能取 “丶、王”。能连不交:能连到一起的字根,就不要拆交叉的字根。 当一个字既可以视作“相连” 的几个码元,也可视作“ 相交” 的几个码元时,应取“ 相连”的。因为一般来说, “连” 比“ 交”更为“直观”,更能显现码元的笔画结构特征。例如 “天”字,取“一、大”而不取“二、人” 。五笔字型的拆分原则是“书写顺序,取大优先,兼顾直观,能连不交,能散不连”。 书写顺序:在合体字编码时,一般要求按照正确的书写顺序进行。例如: 新: 立 木 斤 (正确,符合规范书写顺序) 立 斤 木 (错误,未按书写顺序编写) 夷 一 弓 人 (正确,符合规范书写顺序) 大 弓 (错误,未按书写顺序编写) 取大优先:按照书写顺序为汉字编码时,拆出来的字根要尽可能大,即“再添一个笔画,便不能构成笔画更多的字根”为限度。例如: 世: 廿 乙 (正确) 一 凵 乙 (错误) 亲: 立 木 (正确) 立 一 小 (错误) 兼顾直观:在确认字根时,为了使字根的特征明显易辩,有时就要牺牲书写顺序和取大优先的原则。例如: 国:如按书写顺序,其字根应是“冂、王、丶、一”,但这样编码不断有违该字的字源,也不能使字根“囗” 直观易辩。为了直观,应从外到内取字根“囗、王、丶”。 能连不交:当一个字可以视作相连的几个字根,也可视作相交的几个字根时,我们认为,相连的情况是可取的。 天: 一 大 (二者是相连的) (正确) 二 人 (二者是相交的) (错误) 能散不连:如果一个结构可以视为几个基本字根的散的关系,就不要认为是连的关系。例如: 占: 卜 口 (都不是单笔画,应视作上下关系) 非: 三 刂 三 (都不是单笔画,应视作左右关系) 总之,拆分应兼顾几个方面的要求。一般说来,应当保证每次拆出最大的基本字根,在拆出字根的数目相同时, “散” 比“ 连”优先, “连”比“ 交”优先末笔字型交叉识别码对于不足四码的汉字,例如:“汉” 字拆分成“氵、又”只有 IC 两个码,因此要增加一个所谓末笔字型交叉识别码 Y 。我们举个例子来说明它的必需性。例如:“汀”字拆分成“氵、丁”,编码也为 IS, “沐” 字拆分成“氵、木” ,编码也为 IS;“ 洒”字拆分成“氵、西”编码也为 IS。这是因为“木、丁、西”三个字根都是在 S 键上。就这样输入,计算机无法区分它们。为了进一步区分这些字,五笔字型编码输入法中引入一个末笔字型交叉识别码,它是由字的末笔笔划和字型信息共同构成的。末笔笔划只有五种,字型信息只有三类,因此末笔字型交叉识别码只有 15 种如上表所示。图 1 从表中可见, “汉”字的交叉识别码为 Y, “字”字的交叉识虽码为 F, “沐、汀、洒”的交叉识虽码分别为 Y、H、G。如果字根编码和末笔交叉识别码都一样,这些汉字称重码字。对重码字只有进行选择操作,才能获得需要的汉字。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号