基于語料庫的同義詞“持續(xù)”、“連續(xù)”的辨析
摘 要:文章以同義詞“持續(xù)”和“連續(xù)”為例,通過使用語料庫,運用搭配理論和語義韻理論,展示了語料庫技術(shù)在同義詞辨析方面的重要作用。
關(guān)鍵詞:語料庫;持續(xù);同義詞辨析;連續(xù)
關(guān)于同義詞辨析,傳統(tǒng)方法是借助于“同義詞辨析詞典”等參考書,這一方法的缺點在于:舉例不充分,闡述難理解。隨著計算機技術(shù)的突飛猛進,大型語料庫的建立為同義詞辨析提供了新的方法和途徑。
一、語料庫在詞匯研究中的運用
(一)語料庫的運用
語料庫就是一定規(guī)模的真實語言樣本的集合,有三個特性:一是收入語料庫的語言材料應(yīng)當取自真實文本;二是語料庫應(yīng)是機器可識別和讀取的;三是語言材料經(jīng)過適當標注和加工處理。通過對語料庫檢索統(tǒng)計,可以發(fā)現(xiàn)同義詞在不同語域中的詞頻分布差異,計算出詞語搭配的相互信息值,通過觀察檢索行中所呈現(xiàn)的同義詞搭配特征,就能揭示出它們不同的類聯(lián)結(jié)、搭配關(guān)系和語義韻等語言特征。
(二)相關(guān)理論
1、搭配理論
“所謂搭配關(guān)系,就是指詞與詞之間的橫組合關(guān)系,即什么詞經(jīng)常與什么詞組合在一起。詞的意義在特定的搭配關(guān)系中常常具有特定的意義。”搭配指個別詞項之間習慣性的同現(xiàn)。例如“布”作名詞時與“匹”、“料”搭配,作動詞時與“置”、“分”搭配。搭配通常分為詞匯搭配和語法搭配。詞匯搭配存在于名詞、動詞、形容詞和副詞之間的搭配關(guān)系中,如我們常說“吃面”,而不說“喝面”,因為根據(jù)“面”的詞義,與“吃”特征比較匹配。
2、語義韻理論
一定的詞項會習慣性地吸引某一類具有相同語義特點的詞項,構(gòu)成搭配。由于這些具有相同語義特點的詞項與關(guān)鍵詞項在文本中高頻共現(xiàn),后者就被“傳染”上了有關(guān)的語義特點,整個語境內(nèi)就因此彌漫了某種語義氛圍,這就是語義韻。
二、“持續(xù)”在語料庫中的搭配考察
選定國家語委現(xiàn)代漢語語料庫作為考察數(shù)據(jù),因為它語料規(guī)模很大,時間跨度大,語料收錄廣泛,是一個大型通用的現(xiàn)代漢語平衡語料庫;同時在數(shù)據(jù)處理功能上,完成了詞語切分和詞性標注。
(一)“持續(xù)”的搭配情況
在語料庫中收集并整理得到有效語料700例,“持續(xù)”后面的搭配詞語可分為三類:形容詞、動詞和名詞,另有個別詞項為副詞和助詞以及零搭配等。這樣得到“持續(xù)”的搭配情況:“持續(xù)+VP”、“持續(xù)+NP”和“持續(xù)+AP”。
1、持續(xù)+VP
在這一情況中,“VP”主要有性狀動詞、動作動詞、趨向動詞和關(guān)系動詞。其中性狀動詞所占比例最高,出現(xiàn)頻率最高的是“發(fā)展”一詞,其他如“增長、不降、不退、振興、好轉(zhuǎn)、貶值”等表事物變化或消失義的動詞。其次是動作動詞,如及物動詞“開發(fā)、保護”等,不及物動詞“循環(huán)、創(chuàng)新”等。
2、持續(xù)+NP
在這一情況中,“持續(xù)”與表時間的名詞的搭配占絕對比例,高達77%。如“持續(xù)(一定/很長/的/一段)時間”、“持續(xù)時間+(為/可達)+數(shù)量時間名詞”、“持續(xù)時間+(比較/最/越/也)+長/短”等等。
3、持續(xù)+AP
在這一情況中,“持續(xù)” 借助其他成分限制或修飾后面的詞語,如“持續(xù)(偏/走)+高”,這類詞語大多是性質(zhì)形容詞,如“高漲、異常”等。
(二)“持續(xù)”搭配詞的語義色彩傾向
通過研究發(fā)現(xiàn),“持續(xù)”的語義韻呈現(xiàn)中性傾向。其搭配詞語多表示中性色彩和積極色彩。在VP類詞語中,語義韻呈現(xiàn)積極傾向,如“振興、發(fā)展”等;在NP類詞語中,語義韻呈現(xiàn)中性傾向,因為NP中占絕對比例的表示時間類的詞都是中性詞,屬于客觀反映。
三、“連續(xù)”的語料庫考察
(一)“連續(xù)”的`搭配情況
在語料庫中收集并經(jīng)過整理得到有效語料771例。“連續(xù)”的搭配詞語主要是動詞和名詞,形容詞只有4例。另有個別搭配詞項為助詞、零搭配和后接成分等。這樣得到“連續(xù)”的搭配情況:“連續(xù)+VP”、“連續(xù)+NP”。
1、連續(xù)+VP
在這一搭配中,“VP”主要有性狀動詞、動作動詞和關(guān)系動詞等幾類。其中動作動詞所占比例最高,以及物動詞為主,如“觀測、出現(xiàn)”等。
2、連續(xù)+NP
在這一搭配中,名詞性成分可以分為三類:時間類、專名類、普通類。時間類NP可做狀語、定語或謂語,如“連續(xù)幾天、連續(xù)多年”等。專名類主要是指“連續(xù)”后接名詞屬于專業(yè)術(shù)語,如“~函數(shù)、~點”屬于數(shù)學術(shù)語,“~介質(zhì)”屬于物理術(shù)語等。普通類NP以抽象名詞為典型搭配,如“低溫、生活”等。
(二)“連續(xù)”搭配詞的語義色彩傾向
經(jīng)研究,在VP類詞語中,語義韻呈現(xiàn)中性傾向,如“觀測、出現(xiàn)”;在NP類詞語中,語義韻亦然,因為NP中占絕大多數(shù)的時間類和專名類詞全部為中性詞,屬于客觀反映?偟目磥,在“連續(xù)”的搭配情況中,近絕大部分的詞都呈中性色彩。
四、結(jié)語
用語料庫進行搭配分析提供了一種新穎直觀的同義詞辨析方法,經(jīng)研究,“持續(xù)”和“連續(xù)”在搭配形式和語義韻特征上都存在差異。“持續(xù)”可以搭配動詞性、名詞性和形容詞性成分,而“連續(xù)”后面卻不能搭配形容詞性成分;與“持續(xù)”搭配的詞語有中性傾向和積極傾向,而與“連續(xù)”搭配的詞語只有中性傾向。
參考文獻:
[1] 楊節(jié)之.語料庫搭配檢索與英語同義詞辨析[J].外語電化教學,2007(116)
[2] 翟紅華,方紅秀.國內(nèi)語義韻研究綜述[J].山東外語教學,2009(2)
[3] 楊巖勇.基于語料庫的同義詞辨析[D].廣州:暨南大學碩士學位論文,2007(5)
[4] 王文斌.英語詞匯語義學[M].杭州:浙江教育出版社,2001
[5] 衛(wèi)乃興.語料庫數(shù)據(jù)驅(qū)動的專業(yè)文本語義韻研究[J].現(xiàn)代外語,2002(2)
【基于語料庫的同義詞“持續(xù)”、“連續(xù)”的辨析】相關(guān)文章:
3.基于IT技術(shù)的持續(xù)審計的內(nèi)部審計中的實現(xiàn)論文
5.基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計
8.日語助詞的辨析