汉字的数量 汉字的数量并没有准确数字,日常所使用的汉字约为几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,简体与繁体的统计结果相差不大。 历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已自然消亡或被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。 汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。 另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。 在汉字计算机编码标准中,GB2312收录简体汉字6763个,GBK收录简体、繁体及日语、韩语汉字20912个,Big5收录繁体汉字13053个,而Unicode的中日朝统一汉字基本字集则收录汉字20902个,另有两个扩展区,总数高达七万字。(来自互联网)汉字简体与繁体有什么差异,不要笼而统之地说,要科学地分析一下,才利于我们下决心。繁体与简体之间的差异,从数量上讲,不是整个体系,是一小部分。精确地说就是2235个简体跟其所对应的繁体之差异。除此之外,剩下的汉字字形是相同的。也可能有几个不相同。从书法上讲,都是楷书,简体字里取自草书的也楷化了。两者笔画平直相同,组装起来都成方块。那么,两者的不同点在哪里呢?用我的话来说,是组装一个整体字的“部件”不相同。说个不恰当的比喻,相对繁体来说简体是“偷梁换柱”,用草棚代替砖瓦房。搭草棚比盖砖瓦房要省,所以写简体字比写繁体字来得快,这是很自然的嘛。 组成汉字的基本元素是笔画,总共六个,其中有两个还可以作字用,一个是“一”,另外一个是“乙”(乙是折的代表,折还有几种,不列举)。笔画合成的字,可以独立使用,也可以作为“部件”与另一个字组合成新字。汉字组合的方法不同于英文,汉字是构成,组装式的;英文是串成,穿珠式的。汉字在组装时,有的字的笔划重叠。如繁体“飞”字,是双“翅”合一个升字,居中升字的一横跟“翅膀”一横重叠。单“翅”的“飞”是不能升空的。 英文走出本国也有变异的情况在。近来用英文的各国互派留学生时,接受方提出要考英文,看他学的是哪一国英文。这不奇怪,是国与国之间的事,很正常。汉字变异出在国内,繁体区和简体区的交流出现障碍,这就不正常了。 现在,我们把问题拉回来,仔细地看看每个字的差异。 比如“贝”字,就是简化得很好的一个字。其中“部件”四笔划变成两笔“人”,涵义未变,而且强化了“贝”表示价值。以表示价值,人做主体不是更有价值。不仅单字叶合涵义,连它作为形符或者声符参与组合出来的字都很叶合,涵义没有变异。例如“赐赠,贵费”(共87个),可以说它是个效益很大的简体字。第一篇文章举的几个作偏旁的字都具有这样的效益,它们都有资格活下去,留在社会上。 “见”字就没这资格了。它少了两笔,抠掉了眼睛(目),无目怎么见。何况这个字还要带着目去组合别的字。作“部件”的资格都没了。 上段用了一个“叶”字,是动词词性,是用来品评诗歌音乐的专用字。却被拿来代替繁体“叶”,简直是驴唇不对马嘴,不伦不类。此字之繁体字是与“碟、谍、蝶”为伍的人人都很熟悉的,一见就记住的字。而“叶”字与它毫不相干。听说有位大人物当时就骂,老朽就不改姓,所以他签名一直用繁体。说实话,这是一个用不着简化,简化后会产生不少负效益的字。 “医”字简化成这样,倒也符合现实。今天的“医”,只有医术,没有医道(请医生大人恕罪)。煎药熬汤、针灸按摩,简化掉了,留下的只是开刀。医生由“文化”向“武化”发展不是吗?(再一次请求宽怒)。那么造成这种状况怪谁呢,要怪造字的。因为意念是力量,文字是意念的表象。我为什么要批评那个“惊”字,就是这个道理。 “鱼”字和“龟”字简得好,前者要跟许多字配对组合,产生新字表达鱼类个体,有很大效益。后者几乎是个“单身汉”不跟别的字配对产生新字。虽然它近似简化字“电”(此电字应繁过来),可不是电子产品。为什么说“鱼”字简得好呢,还有一个理由,它由“红烧鱼”变成大活鱼。因为汉字偏旁垫底里,三点表水,四点表火,还表飞禽走兽的四肢,比如“汗”啦,“热”呀,“熟”了以及“马、鸟、羔”等等。这是约定俗成,或者说是潜规则吧。 “过”字为什么简得不好呢?因为繁体“过”的声符已经简化,而且声符的外形没走样,很成功。由它组合的字又很多,集成一个“群体”,如“锅、窝、埚”等等,再单独拿出“过”字改头换面成为一个新产品,人们又要重新认识,没有必要。再说“寸步行之”不比“曲折前进”确切。 “时”字又为什么不好。因为弄错了一个概念。古代计时的沙漏是放在偏殿角落的小房子里的,看日影移动距离计时是在户外,所以选择“寺”为声符是对的。干吗要丢掉“土地”?笔画少的“寸”和“又”很得宠,遇到简化不了的就派它去,它接替了许多“部落首领”(偏旁加部首)的位置,好威风啊。 再来看“准”字,这是比“贝”简得更有价值的字。分析这个字我要多说几句。 “准”字的声符“隹”,同椎音,义象表示鸟,还是“锥、椎、骓”的声符。当“隹”的义象外延表同类物时,如鹰、隼,这时“隹”的读音就变异了。于是“准”字派生出来。“准”字的形符用两点是不得已。繁体字的准是“淮”字下加一个“十”字,这种组合是有问题的。所以说,繁体字不是十全十美。 问题在哪儿呢?先引一个与“准”密切相关的概念。 人类表示思想与情感有许多方法,如“恣态”“声音”“符号”“语言”“文字”等。在中国,比如一个人对于某一事的赞同,他可以点一下头,这是姿态的表示;或发一声“呃”,这是声音的表示;或说一句“可以”,这是语言的表示,在纸上划出一个正号“+”,这是符号的表示;写出一个“准”字,这是文字的表示。古装戏里的皇帝常说“准奏”。 “但是,感叹的声音并不能代表语言,符号也不能代表文字……动物与人类常用“声音”与“姿态”表意,野蛮的人类间用符号”。——陈梦家语。 问题很清楚了。繁体准字是文字与符号的结合(“+”字是古代犯人画押用的符号),文明与野蛮同在。而简体字去掉“+”号与野蛮决裂,具有划时代意义。不要小看这个字,这可是汉字进化的标志性“建筑”。如果汉字作为非物质文化遗产,向联合国教科文组织申报,就用简体字“准”。那个繁体的准万万使不得。它关乎民族自尊,国格人格的大问题。 “灾”字也是简体字里化得很好的字。内隐的意较为实际,改变了繁体灾字的水火组合,水火无情的构思。避免与上善若水奥林匹克火的神圣相悖。 就写到这里吧,还有许多许多字要逐个审查,无论是繁体还是简体,让学者专家们去订正吧。