对方块汉字的新认识.docx

上传人:scccc 文档编号:13850739 上传时间:2022-01-25 格式:DOCX 页数:22 大小:46.68KB
返回 下载 相关 举报
对方块汉字的新认识.docx_第1页
第1页 / 共22页
对方块汉字的新认识.docx_第2页
第2页 / 共22页
对方块汉字的新认识.docx_第3页
第3页 / 共22页
对方块汉字的新认识.docx_第4页
第4页 / 共22页
对方块汉字的新认识.docx_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《对方块汉字的新认识.docx》由会员分享,可在线阅读,更多相关《对方块汉字的新认识.docx(22页珍藏版)》请在三一文库上搜索。

1、文档来源为:从网络收集整理.word 版本可编辑.欢迎下载支持第二章 对方块汉字的新认识汉字的三个层次汉字的五种笔划汉字的三种字型字根的选取汉字的结构分析末笔字型交叉识别单体结构拆分原则 汉字的拆分方块汉字给人的第一印象就是笔划形态多变,字型错综复杂,数在中华民族漫长的历史变革中,汉字的确切数量谁也无统 计 。 国 家 标 准 信 息 交 换 用 汉 字 编 码 字 符 集 ( 基 本 集 )GB231280)中,有6763个汉字。汉汉汉个汉字 个汉字( 1)国家标准GB2312( 80)字集6763-(2)台湾 BIG5 字集13053 ( 3)简体+繁体 15432-(4)大字符集 GBK

2、?集21003首先对汉字的结构规律进行深入地研究和分析。第一节 汉字的三个层次笔划、字根、单字汉字起源于象形文字,直到后来,汉字楷化之后,才形成了“笔。所谓“笔划”就是在书写汉字时,不间断地一次连续写成的一“笔划”也有人写作“笔画”。自从接触汉字以来,就意识到,一个完整的汉字,既不是一系列2文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持不同的笔划的线性排列,也不是一组组各种笔划的任意堆积。 而是由 若干笔划复合连接交叉所形成的相对不变的结构, 绝大多数都是我们 部首查字法的字典中部首的图形,我们把这种图形称作“字根” 。一 般地说,字根是有形有义的,在多数情况下也叫做构字基本单位

3、 (部 件、字元、码元)。这些基本单位经过拼形组合,就产生出众多的汉 字。可见,汉字可以划分为三个层次:即笔划、字根、单字。也就是 说,由若干笔划复合连接交叉形成相对不变的结构组成字根;再将字根按一定的位置关系拼合起来就构成了汉字。因此,我们说字根是构 成汉字的最重要的单位,字根是汉字的灵魂。“五笔字型”方案的基本出发点之一是遵从人们的习惯书写顺序,以字根为基本单位来组字编码、拼形输入汉字。#第二节 汉字的五种笔划横、竖、撇、捺、折汉字笔划是不间断地一次连续写成的一个线条。对成千 上万的汉字及其字根加以分析,只考虑笔划的运笔方向,不 计其轻重长短,将汉字的笔划划归为横、竖、撇、捺、折五 种。为

4、便于记忆和应用,根据其使用频率的高低, 依次用1、 2、3、4、5作为代号,见下表。代号笔划名称笔划走向笔划及其变形1横左f右2一 一产文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持2竖上一下1 13撇右上f左下4捺左上右下、 、5折带转折乙-7 力从表中可以看由,除基本笔划外,还对汉字的具体形态 结构中的笔势变形进行了归类,其理由是:在汉字的具体形 态结构中,其基本笔划横、竖、撇、捺、折常因笔势和结构 上的匀称关系而产生某些变形,或者一带笔而变成钩(左 钩),如“ I ”变为“ 1 ”等,或走向多了一些转折,变成了“V、2”等。另外,一些基本笔划的大小、长短有时也有 不一致(如

5、上表中笔划及其变形的第二列)。但是这些都是次要的方面,其共性在于运笔方向及一笔连续写成都仍然具 有基本笔划的形态特征。五种笔划在组成汉字时,笔划间的关系可分为以下四 种:1、 单:即五笔划自身;2、 散:组成字根的笔划之间有一定距离,如: “三、 八、等;3、 连:组成字根的笔划之间是相连的,如: “厂、人、 尸、弓”等;4、 交:组成字根之间的笔划是相互交叉的,如: “十、 力、又、车”等。当然还会有混合的情况,即一个汉字的各笔划间,有 连又有交或散,例如:“雨”、“禾”等。掌握上述笔划间的关系,对非基本字根的拆分和“识 别码”的选取是非常有用的。练习1、汉字的笔划分为哪几类?各种笔划是如何

6、归并的? 2、把下列汉字按书写顺序拆成单笔划,并分出哪些是散型字根戋士犬丁早川甲竹手月八儿文文 辛米小了刀巴幺门也心一二十寸石西 止卜力贝几由夕广弓广立0 第三节汉字的三种字型研究汉字的字型,是研究由字根构成汉字时,字根之间在汉字中所处的位置关系。成千上万的方块汉字,可以分为 三种类型:左右型、上下型、杂合型。按照各种类型拥有汉字的多少从1到3给以代号,如下表所示字型代号字型字例1左右江河 北 刘 谁 种2上下多 学花 草 青 看3杂合因 凶重乘天边且表中,杂合型又叫独体字,左右、上下两种类型又称合 体字。两部分合在一起的汉字叫双合字,三部分合在一起的 汉字叫三合字。一般合体字只分到三合字一级

7、, 其原因是“五7文档来源为:从网络收集整理.word 版本可编辑.欢迎下载支持笔字型”汉字编码方案取四码,由于二、三合体字的字根较少,不足四码(印信息量不足),2-6个字根排列在一个字键上,离散不开,容易造成重码,所以才有必要补加一个字型信息。而对于由四个部分以上组成或者可以拆分成四个部分的汉字,其信息量已足够,就不必再考虑字型信息了。三种字型的划分是基于对汉字整体轮廓的认识,指的是整个汉字中字根之间排列的相互位置关系。搞清这一点,对于确定多字根的汉字的类型是十分重要的,下面分别予以说明。一型:左右型汉字在左右型汉字中,包括两种情况:1 、 在双合字中,两个部分分列左右,整个汉字中有着明显的

8、界限,字根间有一定的距离,如: “杜、明、现、但、咽、枫”等。 “咽”和“枫”的右边也都是各由两个字根构成,显然这两个字根之间是杂合型关系,但整个汉字属于左右字型。2 、 三合字中,整个字的三个部分从左到右排列;或者单独占据一边的部分与另外两部分呈左右排列,如: “侧、别、说”等,都属于左右型。二型:上下型汉字上下型汉字也包括两种情况:1 、 双合字中,两个部分分列上下,在整个汉字中有着明显的界限,各部分间有一定的距离,如: “军、节、晋、愚”等。2 、 三合字中,三个部分分上下排列,或者占一层的部分与另外两个部分分作上下排列;如: “意、想、花”等。三型:杂合(单体、内外、包围型)汉字三型汉

9、字是指组成整字的各个部分之间没有简单明确的左右或上下关系者。如: “困、周、斗、飞、秉、函、本、丹、戌、边”等。汉字的图形特征,可以用来作为识别汉字的一个重要依据。如说: “口”、 “巴”左右排列为“吧”,上下排列为“邑”等。 由此, 我们还可以把三种字型叫做字根的三种排列方式。在向计算机输入不足四码的汉字时,除了键入组成汉字的字根之外,有时还必须键入字根的排列方式,即补充一个字型信息。练习1、 汉字分哪几种字型?2、 为以下汉字标出字型代号:扒艾笆备柏泵卞厕叉场床笛讹封挂荤霍剂连疗码美闷票浅肋好声宋圆钏君尔弗竿冈匡缶第四节字根的选取我们说过,由若干笔划交叉连接而成的相对不变的结构,就叫字根。

10、但是字根并不像汉字那样,有公认的标准和一定的数量。哪些结构算字根,哪些结构不算字根,历来没有严格的界限。不同的研究者,不同的应用目的,其筛选的标准和选定的数量差异很大。例如,我们可以把“里”选作为一个字根,但是,也可以把它拆分为: “曰”和“土”、 “甲”和“二”等两个字根,也有人把它拆成“田”和“土”两个字根。在汉字拼形编码的研究中,所选字根多数是一些传统的汉字部首。但由于某种需要,有时也选用一些不是部首的笔划结构作为字根,甚至于硬造出一些“字根”来。相反,有些虽然是传统部首,但鉴于它们组字很少或者其本身便于拆分成几个部分,在制定编码方案时也未必选取,例如: 在 “五笔字型”方案中,“足、鱼

11、、木、羊、皮、麻、户”都 不选作基本字根。在“五笔字型”方案中,我们把那些组字能力很强(组字频度高),而且在日常汉语文字中出现次数很多(实用频度高)的字根,称作基本字根。而把所有落选的非基本字根一律按“单体结构拆分原则”,拆分成彼此交连套迭的几个基本字根。这样,我们就可以说:一切汉字都是由“基本字根”组成的了。这里,把优选出的 125 种基本字根,按照其起笔代号,分为五个大区,再考虑键位设计的需要,每区又分为五个位,命名区号和位号(十位数位为区号,个位数位为位号),以1155共二十五个代码表示,如五笔字型键位图所示。这样就建立起了“五笔字型”汉字编码方案的字根总表,今后凡是提到字根,一律指的是

12、这125 种基本字根。也就是说,只有这125 种基本字根才有资格参加编码,其它任何形态的笔划结构,都要全部理解为是由这125 种基本字根组成的。因此,这125 种基本字根既是组字的依据,又是拆字的依据,是对任何汉字及词汇编码的“基本构件”。这125 种字根中又可分为键名字、笔划和基本字根三种,它们都统称为基本字根。练习1、五笔字型中是如何优选字根的?2、五笔字型方案的字根总表是如何建立的?3、 五笔字型方案中,基本字根的含义是什么?它们是如何分区归位的?4、背诵25 个键名汉字,并注意它们与英文字母的对应关系。第五节汉字的结构分析10文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持

13、一切汉字都由基本字根拼合而成的,包括许多没有资格 入选为基本字根的单体结构,这些单体结构并不一定都是汉 字,如:“帝、夫”,也全部是由基本字根与基本字根或基本 字根与单笔划,按照一定关系组成的。基本字根在组成汉字 时,按照它们之间的结构关系也可以分为四种类型。1、单:基本字根本身就单独成为一个汉字。如: “八、 用、斤、广、车、马、雨”等称为 成字字根,它 们的取码有专门的规定,不需要判别字型。2、散:指构成汉字的基本字根之间的相互位置关系, 分别归属于左右、上下之一;换句话说,只有散 结构才有左右、上下可言,这为我们区分字型带 来了极大的方便。3、连:指一个基本字根连一个单笔划。如:“厂下连

14、“主”成为“生”,“厂下连“十”成为“千”, “少”下连“、”成为“久”等。其中单笔可连前也可连后。值得提醒的是:这种情况下的单笔 与字根之间,不能当作散的关系,其字型代号仍 为“3”型。连的另一种情况是“带点结构”。例如:“勺、术、太、 主”等字中,点的远、近、连或不连,为了使问题简化, 我们规定,一个基本字根之前或之后的孤立点,一律视 作与基本字根相连。则带点结构其字型代号也归于“3”4、交:是指几个基本字根交叉套迭之后构成的汉字。如:“农”是由一和“女”,“韦”是由“二、P、I ”,“夷”是由“一、弓、人”交叉构成的 等等。字根组字中,还有一种情况就是混合型,如“丙”字,包括了五种基本笔

15、划,可以看由:相交结构都属于“3”型汉字。这样,以上可概括为五笔字型的“ 543” 特征,即5种笔划、4种关系(笔划间的4 种关系和字根组字时的 4种关系)、3种字 型。练习1、按照组成汉字的字根之间的位置关系, 汉字分为哪几种类型?它们各自的字型代号是什么?2、请将下列汉字按单、散、连、交归类,弁写出各自的字 型代号。汗早夯户幻勾固剂忌笺见市井库君卡刊里气泉冉杀申好农立目刃丘产玉下面应讲字根键位图(第三章),学完字根键位图后再回来学习 下面的末笔字型交叉识别码。#第六节末笔字型交叉识别在前面讲述笔划代码和字型代码时,都分别提及,为了 离散重码,有些汉字在键入其字根后,还要键入它的末笔划 代码

16、;有的汉字在键入字根之后,还有必要键入它的字型代 码。五笔字型方案中, 把这两种代码(代号)合并成一组, 以末笔代号为区号,字型代号为位号,成为一个“末笔字型 交叉识别码”。不管一个字需要的是末笔识别还是字型识别, 都将“末笔字型交叉识别码” 一起加给它,让二者各起各的 作用。我们知道,在“五笔字型”中,笔划分五种,字型分 三种,那么,末笔笔划和字型配合交叉的可能性就有5 X 3=15种。这样,重码率就可大大降低。“末笔字型交叉识别码”如下表所示Sir左右型1上下型2杂合型3横i11G12F13D竖221H22J23K撇331T32R33E捺441Y42U43I折551N52B53V值得注意的

17、是:追加“末笔字型交叉识别码”,绝大多数是针对二合字和三合字而言的(其中常用汉字极多)。追加“末笔字型交叉识别码”后,码长从 2位加到3位或从3 位加到4位,这相当于把它的原码长扩大了15倍,“房间”多了,就能“各就各位”,冲突(重码)的机会就少了。这 正是五笔字型方案键位少、 有很好的规律性而重码也很少的 根本原因所在,请参考下面的例子汉:43 54 41 (ICY )即Y为第4区第1位末笔代号4 (区)、字型代号1 (位)字:45 52 12 (PBF)末笔代号1 (区)、字型代号2 (位)华:34 55 12 22 (WXFJ )耒笔彳t号2(区)、字型代号2(位)同:25 11 23

18、13(MGKD )末笔代号1(区)、字型代号3(位)本:14 11 13(SGD) 末笔代号1 (区)、字型代号3 (位)东:15 43 43(AII ) 乐 末笔代号4 (区)、字型代号3 (位)特殊规定:五笔字型用于识别的末笔有如下特殊规定1、对于“刀、九、力、匕”,为了保持一致和照顾直观, 规定,凡是这四种字根当作末字根而又需识别时,一律用它 们向右下角伸得最长最远的笔划“折”来识别。如:14文档来源为:从网络收集整理.word 版本可编辑.欢迎下载支持“仇”: WVN , N-51“花”: AWXB , B-52 等。但是,“刀”本身作为汉字时,其末笔却是“厂 O2、所有包围型汉字中的

19、末笔,规定取被包围的那一部分结构的末笔。如:“国”末笔应取“、”,“远”末笔应取“乙”,“边”末笔应取“乙”。3、 “我、戋、成”等字的这种最末是一点和一撇结尾的汉字,其末笔规定均为“厂O练习1、为什么要使用末笔字型交叉识别码?2、末笔字型交叉识别码是怎样编码的?3、说出末笔字型交叉识别码的使用场合及原因。4、给下列汉字标注末笔字型交叉识别码。待单旦等钧冬杜弗赶汇击君兰枚闷农市勺讨旺昔乡羊鱼庄坠耷忏迁耒缶隽雯奋仅灭齐泉冉仁声青私需用“识别码”的常用汉字有 400 多个,下面列出,供参考。艾凹扒叭笆把坝柏败拌钡备泵卞铂仑草厕叉盆场倡扯尘驰尺斥愁仇臭触床闯辞囱歹待丹单旦悼笛刁翟钓冬抖斗杜肚妒兑讹尔

20、耳伐令犯坊妨肪仿飞吠奋封伏弗付父讣改甘杆竿赶秆冈杠皋告汞钩勾苟辜咕沽蛊故固刮挂圭闺旱汗夯亨弘户幻皇回卉汇荤昏霍击讥伎剂忌佳贾钾笺肩奸茧贱见秸却戒巾仅京惊井竞炯洒巨句卷抉诀钧君卡揩刊看扛抗元孔哭苦库匡19框矿旷亏奎坤垃兰雷泪厘 里礼栗利粒隶连凉晾疗吝 漏芦庐虏掠仓玛码蚂吗买 麦忙冒枚眉美闷孟苗灭闽 牡亩尿捏聂涅牛农弄奴疟 呕拍判刨匹票迫粕扑仆奇 齐乞企气泣讫扦仟浅羌巧 茄怯芹青琼丘囚蛆去泉冉 壬仁刃戎茸冗汝腮杀晒汕 扇尚勺舌申声升圣什矢屎 市谁私宋诵酥粟岁她坍叹 讨套汀廷童头秃徒吐推驮 洼九万亡枉旺忘妄唯未位 蚊纹紊问沃芜吾毋捂午伍勿悟昔硒矽汐虾匣闲香乡翔享泄屑芯锌忻刑杏兄汹朽玄穴血训丫岩阎厌唁

21、秧佯羊仰舀耶页曳沂艺邑异翌音尹应拥佣痈蛹尤铀油酉幼余鱼予吁誉驭元圆钥云孕宰皂责扎札轧闸债盏栈章丈仗瘴正汁仔自走足阻植值址置痔钟仲诌肘住爪庄壮状椎坠谆卓啄孜第七节单体结构拆分原则汉字结构分析中,讲了由基本字根通过连或交的关系形成“单体结构”的过程,这是一个正过程。现在要讲怎样把任意一个单体结构拆分成为几个基本字根,即组字的逆过程 拆字。一、拆分时注意以下两种结构:1 、连笔结构:拆成单笔与基本字根。如:“自”拆成文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持 与“目”,“天”拆成“一”与“大”,中拆成与“耳” 等。2 、交叉结构或连交混合结构:按书写顺序拆分成几个 已知的最大字根,

22、以增加一笔不能构成已知字根来决定笔划 的分组。如“朱”只能拆成“匕小”;而不能拆成“牛 八”, 因为次一笔“ I ”连到“匕”上构成的“牛”已不再是基本 字根了;也不能拆成“匕I小”,这样就把“朱”中的笔 划“ I ”给割断了,且非最大字根。说明:属于连笔结构时,就不能按第2条进行拆分,因为这样往往失去直观性。如:“生”不能拆成“ 1 土”,也不能拆成“匕| , 一”,因这些都极不直观,只能拆成“/上”。二、在具体拆分过程中,需掌握以下四 个要点:1 、能散不连:如果一个单体结构可以视为几个基本字 根的散的关系,就不要视为连的关系。这样,常常有较好的 直观性。如:“午”:六H十(都不是单笔划,

23、应视作上下关系), “占”:卜口 (都不是单笔划,应视作上下关系), “非”:三M三(都不是单笔划,应视作左右关系) , “严:一 I厂(后两部分不是单笔划,应视作上下关系)20文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持实际上,连只存在于单笔与基本字根之间,此外一般不存在连的关系。2 、兼顾直观:拆字的目的是为给汉字编码(输入的字 根),从键盘上组字(键入字根)。如果拆的字根有较好的直 观性,就便于联想记忆,给输入带来方便。为照顾直观性,“羊”拆成“、户|下”就比拆成“ M二1 ”直观得多。再 如:“自”:J目“生” :J主“舟” :J舟I3 、能连不交:指的是一个单体结构能

24、按连的关系拆分的,就不要按交的关系拆分。“于”可按连的关系拆分成 “一 十”,就不要按“二 I ”相交的关系拆分。再如:“天”:一大(不能拆成“二人”,否则相交),牛:I (不能拆成“ 1一 I ”,否则相交),不 同于“牛”。“丑”:乙士(不能拆成“刀二”,否则相交)。4 、取大优先:指的是在各种可能的拆法中,保证按书 写顺序每次都拆由尽可能大的字根,也叫“能大不小”。如:“尺”拆成“尸而不拆成“ I二II人。再如:“夷”:一弓人“平”:一口“无”:二儿“重” :J 一日土不难看由“取大优先”的含义,从中可以引伸由一层意 思,就是:在可能的几种拆分方法中,以拆由的字根数量少 的那种拆法优先。例如“缶”可拆成 一 十或“1 山”,但这两种拆法都没有拆成“ 匕山”的字根数目少,因 此,后一种拆法是对的。总之,拆分应当兼顾上述四个方面的要求,一般说来, 首先应当保证每次拆由最大的基本字根,在拆由字根数目相等的条件下,“散”比“连”优先,“连”比“交”优先。对于常见非基本字根()的拆法汇总在下表中,以 使读者能尽快掌握拆分方法。练习1、单体结构拆分的原则是什么?举例说明之。2、拆分以下低频结构,弁说明整字属于什么类型? 申呆电重千于牛矢未 太尤龙万天夫元书片 专义长乐东冈飞左车22

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1