漢字?jǐn)?shù)量
漢字的數(shù)量并沒有準(zhǔn)確數(shù)字,大約將近十萬個(gè)(北京國安咨訊設(shè)備公司漢字字庫收入有出處漢字91251個(gè)),日常所使用的漢字只有幾千字。據(jù)統(tǒng)計(jì),1000個(gè)常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字時(shí)已到99%,簡(jiǎn)體與繁體的統(tǒng)計(jì)結(jié)果相差不大。
歷史上出現(xiàn)過的漢字總數(shù)有8萬多(也有6萬多的說法),其中多數(shù)為異體字和罕用字。絕大多數(shù)異體字和罕用字已被規(guī)范掉,除古文之外一般只在人名、地名中偶爾出現(xiàn)。此外,繼第一批簡(jiǎn)化字后,還有一批“二簡(jiǎn)字”,已被廢除,但仍有少數(shù)字在社會(huì)上流行。
漢字?jǐn)?shù)量的首次統(tǒng)計(jì)是漢朝許慎在《說文解字》 中進(jìn)行的,共收錄9353字。其后,南朝時(shí)顧野王所撰的《玉篇》據(jù)記載共收16917字,在此基礎(chǔ)上修訂的《大廣益會(huì)玉篇》則據(jù)說有22726字。此后收字較多的是宋朝官修的《類篇》,收字31319個(gè);另一部宋朝官修的《集韻》中收字53525個(gè),曾經(jīng)是收字最多的一部書。
另外有些字典收字也較多,如清朝的《康熙字典》收字47035個(gè);日本的《大漢和字典》收字48902個(gè),另有附錄1062個(gè);臺(tái)灣的《中文大字典》收字49905個(gè);《漢語大字典》收字54678個(gè)!吨腥A字海》,收字85000個(gè)。臺(tái)灣的異體字字典收錄106230個(gè)漢字是收錄漢字最多的字典.
在漢字計(jì)算機(jī)編碼標(biāo)準(zhǔn)中,最大的漢字編碼是臺(tái)灣地區(qū)的CNS11643,5.0版全字庫可供查詢的字共87,047個(gè)中文字、10,771個(gè)拼音文字及894個(gè)符號(hào)。臺(tái)港民間通用的大五碼收錄繁體漢字13053個(gè)。GB18030是中華人民共和國現(xiàn)時(shí)最新的內(nèi)碼字集,GBK收錄漢字簡(jiǎn)體、繁體及20912個(gè),而早期的GB2312收錄簡(jiǎn)體漢字6763個(gè)。而Unicode的中日朝統(tǒng)一表意文字基本字集則收錄漢字20902個(gè),總數(shù)亦高達(dá)七萬多字。
初期的漢字系統(tǒng)字?jǐn)?shù)不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經(jīng)歷了逐步復(fù)雜、字?jǐn)?shù)大量增加的階段。漢字?jǐn)?shù)量的過度增加又引發(fā)了漢字學(xué)習(xí)的困難,單一漢字能表示的意義有限,于是有許多單一的漢語意義是用漢語詞語表示,例如常見的雙字詞。漢語書寫的發(fā)展多朝向造新詞而非造新字。殷墟的甲骨文更早、與漢字起源有關(guān)的出土資料。這些資料主要是指原始社會(huì)晚期及有史社會(huì)早期出現(xiàn)在陶器上面的刻畫或彩繪符號(hào),另外還包括少量的刻寫在甲骨、玉器、石器等上面的符號(hào)。可以說,它們共同為解釋漢字的起源提供了新的依據(jù)。
鄭州大學(xué)博士生導(dǎo)師王蘊(yùn)智認(rèn)為:中國最早的刻劃符號(hào)出現(xiàn)在河南舞陽賈湖遺址,距今已有8000多年的歷史。 對(duì)這些原始材料做一番全面的整理,從而爬梳排比出商代文字之前漢字發(fā)生、發(fā)展的一些頭緒。 然而情況并不那么簡(jiǎn)單,除了已有鄭州商城遺址、小雙橋遺址(該遺址先后發(fā)現(xiàn)10余例商代早期朱書陶文)的小宗材料可以直接和殷墟文字相比序之外,其它商以前的符號(hào)則零星分散,彼此缺環(huán)較多,大多數(shù)符號(hào)且與商代文字構(gòu)形不合。還有一些符號(hào)地域色彩較重、背景復(fù)雜。
正式形成于中原地區(qū),王蘊(yùn)智認(rèn)為,漢字體系的正式形成應(yīng)該是在中原地區(qū)。漢字是獨(dú)立起源的一種文字體系,不依存于任何一種外族文字而存在,但它的起源不是單一的,經(jīng)過了多元的、長(zhǎng)期的磨合,大概在進(jìn)入夏紀(jì)年之際,先民們?cè)趶V泛吸收、運(yùn)用早期符號(hào)的經(jīng)驗(yàn)基礎(chǔ)上,創(chuàng)造性地發(fā)明了用來記錄語言的文字符號(hào)系統(tǒng),在那個(gè)時(shí)代,漢字體系較快地成熟起來。
據(jù)悉,從考古發(fā)掘的出土文字資料來看,中國至少在虞夏時(shí)期已經(jīng)有了正式的文字,如考古工作者曾經(jīng)在山西襄汾陶寺遺址所出的一件扁陶壺上,發(fā)現(xiàn)有毛筆朱書的“文”字。這些符號(hào)都屬于早期文字系統(tǒng)中的基本構(gòu)形,可惜這樣的出土文字信息迄今仍然稀少。
大約在距今六千年的半坡遺址等仰韶文化遺址的陶器外壁,已經(jīng)出現(xiàn)刻劃符號(hào),共達(dá)五十多種。它們整齊規(guī)劃,并有一定規(guī)律性,具備簡(jiǎn)單文字的特征,可能是我國文字的萌芽。
在距今約四五千年的大漢口文化遺址晚期和良渚文化遺址的陶器上,發(fā)現(xiàn)有更整齊規(guī)則的圖形刻劃,是早期的圖形文字。
20世紀(jì)80年代初,在河南登封夏文化遺址發(fā)掘出的陶器上,發(fā)現(xiàn)了更完備的文字。這是被學(xué)者們確認(rèn)的迄今為止我國有確切時(shí)代的最早的文字。
有人統(tǒng)計(jì)過十三經(jīng)(《易經(jīng)》、《尚書》、《左傳》、《公羊傳》、《論語》、《孟子》等13部典籍),全部字?jǐn)?shù)為589283個(gè)字,其中不相同的單字?jǐn)?shù)為6544個(gè)字。因此,實(shí)際上人們?cè)谌粘J褂玫臐h字不過六七千而已。
文言文定義
當(dāng)人們使用“古代漢語”這個(gè)術(shù)語時(shí),在不同的語境中賦予了它三個(gè)不同的含義:古代的漢語、上古漢語和文言。古代漢語首先是指“古代的漢語”。這就是說,鴉片戰(zhàn)爭(zhēng)以前漢族人所使用的語言都可以泛稱為古代漢語。古人的口語,我們是聽不到了,甲骨文,從甲骨文算起,這樣的古代漢語大約有三千多年的歷史。跟任何事物無不發(fā)展變化一樣,語言也是不斷發(fā)展變化的。三千多年來,漢語有了很大的變化。根據(jù)漢語語法、詞匯和語音變化的情形,學(xué)者將古代漢語分為三個(gè)發(fā)展時(shí)期:上古期、中古期和近代期。上古期是指西元3世紀(jì)以前,即歷史上商、周、秦和兩漢時(shí)期;中古期是指西元4世紀(jì)到西元12世紀(jì),即歷史上的六朝、唐和宋時(shí)期;近代期是指西元13世紀(jì)到19世紀(jì),即歷史上的元、明、清時(shí)期。
yjbys為你推薦以下內(nèi)容:
5.