中国:世界上有多少汉字?
详细回答:
汉字总数已经超过8万
2001年9月,新华社发布最新统计信息。目前汉字总数已经超过8万个,而常用字只有3500个。虽然常用词数量变化不大,但词库总数有所增加。近年来,汉语词典收录的汉字总数从5万多个增加到8万多个。但历代日常书面语中常用的异体字数量一般控制在3000到4000个,并没有超过最初的甲骨文。选取当代常用字作为学习和使用汉字的重点,是历代汉字整理和教学的重要内容。历史上的三字经、千字文都是用当时常用的文字编写的识字课本。
现代汉语用字也符合这个规律。据统计,叶圣陶的小说《倪焕之》有138330个字,使用的异体字只有3039个。老舍小说《骆驼祥子》有107360个字,只用了2413个不同的汉字。《毛泽东文选》(第1 ~ 4卷)包含659928个字,仅用了2981个异体字。可见,常用词是客观存在的。它们是学习和使用汉字时应该注意的重点。)
有“汉字杰作”评价的《康熙字典》在书的后面有一个补遗,“收录所有生僻字,然后附上工具书,包括完全没有声音或意义的字”,收录了四万多个汉字。1994出版的《汉字海》收录了87019个汉字,而已经通过专家鉴定的北京国安咨询设备公司的《汉字字体》收录了91251个带出处的汉字,据说是目前国内最全的字体。与庞大的汉字库形成鲜明对比的是,历代日常书面语中常用的异体字数量一般控制在三四千个。甲骨文的数量没有超过原始文字。国家1988公布的《现代汉语常用词表》共收录了2500个常用词和1000个次常用词,总共只有3500个词。
生僻字逐渐被淘汰
国家语委语言文字应用研究所原副所长纪恒泉认为,一个国家的文字总量有增有减,但基本文字的数量是相对固定的。汉字有很多,可以分很多层次。我国有2500多个常用汉字。只要我们掌握了它们,我们就能熟练地阅读现代汉语书面语。《毛泽东文选》五卷本中使用的汉字只有2000多个。《小学语文教学大纲》规定,学生要认识3000个汉字,掌握1800个以上的汉字,就可以“识字”。电脑字库中的汉字总数刚刚超过2万。王永民在学习“吴彼字体输入法”时,将《现代汉语词典》中的1.2万多个汉字逐一分解合并成上百个偏旁部首,再与电脑相关键连接,基本满足了日常需要。
纪恒全说,文字是历史文化的载体,传递着一定的信息,不同社会阶段使用文字的特点也不同。随着社会的发展,一些文字逐渐被淘汰。从现代汉语的角度来看,人们需要一种更简单的方式来表达自己的感情。“汉字有四万多个,甚至九万个,恐怕很多人一辈子都记不住。汉字里有很多生僻字,就算你自己记住了,交流的时候对方不懂也没用。”就这样,很多生僻字逐渐从常用字中被淘汰。推广使用规范汉字,可以减少不必要的交流障碍,大大减轻学习读写、印刷排版和计算机汉字记忆的负担。
九万个汉字从何而来
汉字有五千年的历史。早在新石器时代晚期的彩陶上,就出现了图画和符号,这就是汉字的前身。现在能看到的最早的成熟汉字是商代刻在动物骨头和龟甲上的甲骨文。当时用了4600多字。
随着社会的发展,为了表达新事物,语言也在发展。九万字的背后,是社会生活的不断进步。由于汉字历史悠久,这些字构成了汉字库的主体,主要体现在国家编纂的字集上,包括《说文解字》、《康熙字典》、《汉语大词典》、《汉语词海》。在语言本身的发展过程中,不可避免地会出现大量的异体字和不规范字。就像孔乙己曾经坚持“茴香”二字有四种写法一样,汉字中的异体字是汉字家族不断壮大的重要原因。在20世纪50年代,我们国家列出了一份异体字清单,但这项工作尚未结束。随着汉语拼音的提出,这项工作没有进行到底。中国社会科学院研究生院语言系教授巢纪舟先生对此进行了解释。
随着与外界接触的扩大,一些外来词开始进入我们的语言系统,如沙发、经济、迷你裙等。汉字系统中也有外来词,但数量很少。人们常说“2008”,却很少说“2008”。“”明显不同于构词成分为左右的汉字,它来源于阿拉伯字母。另外,有些国家,比如韩国、日本,过去用汉字,后来用汉字的偏旁部首造了一些新词。前者还是汉字家族,也会收在汉字库里。这些字符属于国际标准字符集汉字,也是一个庞大的汉字库的一部分。目前,字体整理中一般会收录新加坡、越南、马来西亚等周边国家的汉字。
同时,字库还将收集古今姓氏和上述字集、字典、字书不能收录的名字。刘先生认为,由于我国人口多、面积大,很多地方文字、方言字、人名也是汉字字库的组成部分,早已编入字典,包括台湾省、香港等地,已整理出约40余本地方文字字典。比如澳门有个当岛。现在很多人洗头后都喜欢用水来固定发型。“啫喱水”是一个香港术语,也逐渐被大家接受。
数汉字是做什么的?
据参与编纂《新华字典》和《现代汉语词典》的中国社会科学院语言研究所研究员刘庆龙先生介绍,收集整理如此大的字体,不仅是为了日后参考,也是为了印刷汉字、整理古籍、编纂辞书、整理和研究国内外汉字,更是为我国地图上制作人名、证件清单和标注地名提供了一个高水平的字体工具。90年代初,国家制作了包含20902个字的国家标准字表,但在使用过程中发现字表远远不够,目前正在进行补充工作。
整理汉字库的原因:一是为了满足国际要求建立国际文字的需要,做一个国际通用字库,方便国际文字的交流。目前,国际ISO国家标准委员会正在征集各国字符;二是适应计算机输入法的发展,扩展计算机字体。目前,信息产业部计算机标准化研究所也在进行汉字字库的统计整理工作,已整理出近7万字;第三,汉字发展过程中的字体变形,使得有些字看起来和汉字不一样,需要整理统一。
世界上有多少个汉字?这个问题恐怕目前谁都很难解释。
最早的书法书籍是东汉许慎编纂的《说文解字》,有9353个汉字。《说文解字》的出现使汉字的书写有了统一的标准和规范,许慎因此被历代学者尊为“汉字圣人”。
南北朝时期,南梁顾编纂的《片玉》收字16917。这本书经过唐宋修订,收字增至22726字。宋代丁度等人编纂的《广韵》收字53525字,是我国古代用字最多的字典。清代张玉书编纂的《康熙字典》收字47035字。辛亥革命后,欧阳普存主编的《汉语大词典》收字48000余字。
近几年出版的《汉语大词典》收录了56000多个汉字,是迄今为止汉字数量最多的词典。新编纂的《汉字之海》告诉人们,汉字有近9万个。该书因收入前缀8.6万,被大众媒体称为新世界之最。