漢字信息量是最大的。
研究表明:漢字作為一個(gè)復(fù)雜的文字符號(hào)系統(tǒng),其信息熵很高。研究的基本方法是:逐漸擴(kuò)大漢字容量,隨著漢字容量增大,信息熵的增加趨緩;漢字增加到12370以后,不再使信息熵有明顯的增加。我國科學(xué)家指出:漢字的容量極限是12366個(gè)漢字,漢字靜態(tài)平均信息熵的值(平均信息量)是9.65比特。通過數(shù)理語言學(xué)中著名的齊普夫定律(ZIPF’SLAW)核算,這是當(dāng)今世界上信息量最大的文字符號(hào)系統(tǒng)。聯(lián)合國五種工作語言文字的信息熵的比較如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差別不大。漢字的信息量最大。
漢字對(duì)拼音文字的這種信息熵優(yōu)勢是什么概念?簡單的比喻就是十進(jìn)制數(shù)與二進(jìn)制數(shù)的差別。十進(jìn)制數(shù)字系統(tǒng)需要人記憶0-9,10個(gè)符號(hào),二進(jìn)制只需要記憶0和1兩個(gè)符號(hào)。十進(jìn)制乘除要記憶9X9表,二進(jìn)制只需要學(xué)會(huì)與、或、非的簡單邏輯。但是,人類在日常生活中為什么不使用二進(jìn)制數(shù)字系統(tǒng)呢?因?yàn)槟菢雍芾速M(fèi),一個(gè)數(shù)字“7”表示成二進(jìn)制就成了“111”,記個(gè)大數(shù)不把人累死?反過來,人類為什么不用十六進(jìn)制,或更高的進(jìn)制呢?一方面是人腦智力的限制,另一方面,十六進(jìn)制也未必能大幅度提高信息熵。這種信息熵反映在文字上,就是聯(lián)合國文件中,中文版本一定是最薄的。這就是漢字字符集信息熵高的優(yōu)勢。
漢字的以上五個(gè)方面的特點(diǎn),無疑會(huì)使其在閱讀心理方面較拼音文字具有相當(dāng)大的優(yōu)勢,使?jié)h字的書面語在感知、理解的各個(gè)方面都有較高的速度和效率,能夠?qū)崿F(xiàn)閱讀速度、理解速度、記憶速度的協(xié)調(diào)發(fā)展,快速閱讀,也是中國為何能崛起的天然因素,漢語不失,華夏永存。
詩詞
拜新月 (唐)李端
開簾見新月,便即下階拜。
細(xì)語人不聞,北風(fēng)吹裙帶。
問劉十九 (唐)白居易
綠蟻新醅酒,紅泥小火爐。
晚來天欲雪,能飲一杯無。
瀑布 (唐)施肩吾
豁開青冥顛,瀉出萬丈泉。
如裁一條素,白日懸中天。
題西施石 (唐)王軒
嶺上千峰秀,江邊細(xì)草春。
今逢浣紗石,不見浣紗人。
劍客 (唐)賈島
十年磨一劍,霜刃未曾試。
今日把示君,誰有不平事?