您在這裡

漢字總量是多少

中國漢字總量是多少,大家沒有一個統一的說法。有「總彙漢字之大成」評價的《康熙詞典》,在書後附有《補遺》,「盡收冷僻字,再附《備考》,又有音無義或音義全無之字」,收錄的漢字是4萬多個。1994年出版的《中華字海》收入了87019個漢字,而已經通過專家鑒定的北京國安咨詢設備公司的漢字字庫,收入有出處的漢字91251個,據稱是目前全國最全的字庫。與龐大的漢字庫形成鮮明對照的是,曆代日常書面語常用的不同的漢字數量一般都控制在三四千個。數量上并沒有超過最初的文字甲骨文。國家在1988年公布的《現代漢語常用字表》選收了2500個常用字、1000個次常用字,總共隻有3500字。

國家語言文字工作委員會語言文字應用研究所前副所長紀恒铨認為,一個國家的文字總量有增有減,但基本字的數量則比較固定。漢字有很多,可以分做很多層面。中國常用漢字有2500多個,隻要掌握了它們,就可以熟練閱讀現代漢語書面語了。《毛澤東選集》5卷本,使用的不同漢字也不超過2000多個。小學語文大綱規定學生應該認識3000個漢字,如果掌握了1800多個漢字,也就可以脫盲了。

紀恒铨說,文字是曆史文化的載體,傳達著一定的信息,不同社會階段文字适用特點也不同。随著社會發展,一些文字就被逐漸淘汰了。從現代漢語角度,人們傳情達意需要更簡便的方式,「4萬甚至9萬多漢字,恐怕許多人一輩子也記不完。漢字中的生僻字很多,即使自己記住了,如果交流時對方不懂,還是沒用」。許多生僻字就是這樣逐漸被淘汰出常用字。

随著社會的發展,為了表現新的事物,語言也在發展,9萬漢字的背後是社會生活的不斷進步,由於中國文字積澱的曆史長,這些字就構成了漢字庫的主體,主要體現在包括國家編撰的《說文解字》、《康熙詞典》、《漢語大詞典》、《中華字海》的收字上。在語言文字本身的發展過程中,不可避免地還出現了大批的異體字和不規範字,就像孔乙己曾經堅持「茴」字有四種寫法一樣,漢字中的異體字是漢字家族日益壯大的一個重要原因。在50年代,國家曾經做過一個異體字整理表,然而工作還未結束,随著漢語拼音化方案的提出,這項工作沒有進行到底。中國社會科學院研究生院語言系教授晁繼周先生這樣解釋。

據中國社會科學院語言研究所研究員、參與了《新華詞典》和《現代漢語詞典》編纂工作的劉慶隆先生介紹,做這樣一個大的字庫收集整理工作,不但備查備用,還可供國内兩岸四地及國外進行漢字文本印刷、古籍整理和研究适用,而且為人名名錄及證件制作、中國地圖地名标注提供了水平很高的字庫工具。90年代初,國家制作過一個包含20902個字的國家标準字庫表,但在使用過程中發現這個字表還遠遠不夠使用,目前補充工作還在開展中。

整理漢字庫的原因,劉慶隆認為一是适應國際上要求建立國際字标的需要,做成一個國際通用的字庫以方便國際文字的交流,目前國際ISO國标委員會正在收集各國文字;二是适應計算機輸入法的發展、擴大計算機字庫的需要。目前信息産業部的計算機标準化研究所也正在進行漢字字庫的統計整理工作,已經整理出來近7萬字;第三,漢字發展過程中的字體變形使得一些字看起來已經不像漢字,需要整理以便統一。 據日前通過專家鑒定的北京國安資訊設備公司漢字字庫,收入有出處的漢字91251個。專家說,這是目前收入漢字最全的字庫。

據了解,在國安字庫問世前,收入漢字最多的為1994年出版的《中華字海》,共收漢字87019個,其中重複字320個。國安字庫除包括國家和國際标準的全部字符集漢字外,還涵蓋了《說文解字》全部楷定字及《康熙詞典》、《漢語大詞典》(收字54678個,這是目前收字最多的詞典)、《中華字海》的全部收字,并覆蓋80年代台灣教育部門整理的全部漢字。同時還專門收集了上述字集、詞典、字書所不能包括的古今姓氏、地名用字。專家們認為,國安字庫不僅可供國内兩岸四地及國外進行漢字文本印刷、古籍整理、辭書編寫、漢字整理和研究使用,而且為人名名錄及證件制作、中國地圖地名标注提供了水平很高的字庫工具。 漢字是語素文字,總數非常龐大随着時代的推移,詞典中所收的字數越來越多。1990年徐仲舒主編的《漢語大詞典》,收字數為54678個。1994年冷玉龍等的《中華字海》,收字數更是驚人,多達85000字。《中華字海》一類字書裡收錄的漢字絕大部分是“死字”,也就是曆史上存在過而今天的書面語裡已經廢置不用的字。

發表新回應

Plain text

  • 不允許使用 HTML 標籤。
  • 自動將網址與電子郵件地址轉變為連結。
  • 自動斷行和分段。