- 相關(guān)推薦
一種基于經(jīng)典領(lǐng)域本體構(gòu)建方法的改進研究
語義網(wǎng)是現(xiàn)在的熱門研究課題,而組建語義網(wǎng)的基石是領(lǐng)域本體的構(gòu)建。如果沒有一個完善的本體,整個語義網(wǎng)的構(gòu)建也只能是一座空中樓閣。所以本體構(gòu)建在語義網(wǎng)研究中具有十分重要的地位。本體構(gòu)建的探討主要包括三個方面,即本體構(gòu)建方法、本體描述語言、本體構(gòu)建工具。其中本體構(gòu)建方法對本體構(gòu)建過程的實施具有指導(dǎo)性的意義,直接決定了本體對知識的表示和邏輯推理能力。如果沒有一個好的構(gòu)建方法的指導(dǎo),就很難保證本體構(gòu)建的規(guī)范化,進而對基于本體的后續(xù)應(yīng)用也會產(chǎn)生巨大影響。
一、經(jīng)典本體構(gòu)建方法分析
國內(nèi)外的研究小組根據(jù)各自的項目提出了很多本體構(gòu)建方法,經(jīng)典的本體構(gòu)建方法有骨架法、評價法、METHONTOLOGY法、Bernerasetal(KACTUS)方法等等。骨架法對構(gòu)建框架和各階段的指導(dǎo)方針有參考價值而且有本體評估的步驟,但是每一步卻沒有具體的方法和技術(shù):評價法提出了本體獲取的新方法,明確提出了需求的問題,但是沒有文檔化過程和步驟的說明;METHONTOLOGY法有本體評估步驟,詳細描述了相關(guān)技術(shù)工具、知識來源,但是沒有具體的本體評估方法;Bernerasetal方法主要針對應(yīng)用驅(qū)動的本體開發(fā),但缺乏具體支持技術(shù)和本體評估、文檔化過程,不適合從無到有的本體構(gòu)建。
二、本體構(gòu)建方法的改進探索
針對現(xiàn)有本體構(gòu)建方法的缺點,一些學(xué)者做了一些有益探索。筆者在其他學(xué)者研究的基礎(chǔ)上,結(jié)合自己的想法提出了一種
新的本體構(gòu)建方案,具體步驟如下:
(一)領(lǐng)域本體需求分析。這個階段主要是要明確領(lǐng)域本體構(gòu)建和應(yīng)用目的、領(lǐng)域與范圍、表示方法、用途以及使用者等。
(二)考慮本體復(fù)用。明確要開發(fā)的領(lǐng)域是否存在有現(xiàn)成的本體。如果不存在己有本休,則轉(zhuǎn)入第(三〉步:如果存在現(xiàn)成本體,則需要進一步分析己有本體是否滿足需求,不滿足項目需求則轉(zhuǎn)入第(三)步,倘若滿足需求則進入第(五)步。
(三)分析本體結(jié)構(gòu),列出領(lǐng)域重要術(shù)語。這一階段可以采用半自動的方法從主題詞表、敘詞表、領(lǐng)域文獻庫或者關(guān)系數(shù)據(jù)庫中抽取關(guān)鍵術(shù)語和概念并加以整理,通過這一過程可以完成大部分的術(shù)語匯總,然后通過入工搜集或者本體的動態(tài)學(xué)習(xí)機制擴充完善術(shù)語。
(四)定義類和類層次關(guān)系。這一步可以細分為兩個小步驟即定義類和定義類層次關(guān)系。
1.定義領(lǐng)域本體中的類。在步驟(三)中羅列出的大量的概念和術(shù)語處于一種混亂無組織并且彼此之間沒有關(guān)聯(lián)的狀態(tài),需要通過一定的邏輯規(guī)則對它們進行分類,形成不同的子領(lǐng)域。此外還需要對這些概念和術(shù)語的重要性進行評估,摒除那些超出領(lǐng)域范圍的概念和術(shù)語,盡可能簡潔和準(zhǔn)確的表達出領(lǐng)域知識。
2.定義類之間的層次關(guān)系。建立類之間的層次關(guān)系一般有自頂向下、自底向上、綜合法等幾種方式。自頂向下定義類層次即首先定義領(lǐng)域中綜合性,概括性的類,然后逐步細化擴展自最細小的類。自底向上正好相反即先從最小類的定義開始,然后逐步向上級類定義。綜合法是首先定義許多非常顯而易見的概念,然后分別對它們進行恰當(dāng)?shù)臍w納和細化,從一些頂層概念著手,將它們與一些中級概念關(guān)聯(lián)起來。在具體的項目實施中可以根據(jù)實際情況采用合適的方法。
(五)本體的檢驗和評價。由于領(lǐng)域知識的復(fù)雜性,領(lǐng)域邊界的模糊性,不同領(lǐng)域之間往往存在著交叉,本體的構(gòu)建很難一步到位?梢愿鶕(jù)Gruber所提出的五條指導(dǎo)原則來檢驗和評價本體。如果不符合要求則返回第(三)步重新進行本體分析并加以適當(dāng)?shù)男拚,直至達到要求為止。此過程需要迭代進行。
(六)本體的存儲。本體建設(shè)完成后,需要存儲本體。本體的存儲可以采用。吼文檔形式或者存儲為關(guān)系數(shù)據(jù)庫形式。。吼格式存儲比較簡單,但是當(dāng)文檔數(shù)量比較大時用關(guān)系數(shù)據(jù)庫存儲本體就比較方便,可以根據(jù)實際情況進行選擇。
三、結(jié)束語
隨著語義網(wǎng)研究的深入,本體構(gòu)建方法也將逐漸成熟。而從各個項目工程中總結(jié)出來的方法,并不能適合每個項目的要求,需要根據(jù)項目的情況加以修改。本文總結(jié)了一些主要的經(jīng)典本體構(gòu)建方法的特點,提出了一種迭代的具有本體進化特性的本體構(gòu)建方案,同時也試圖利用主題詞表、敘詞表、領(lǐng)域文獻庫等現(xiàn)有資源通過半自動的方式抽取專業(yè)術(shù)語及其等級關(guān)系,以減輕在沒有本體復(fù)用情況下本體構(gòu)建的工作量。下一步的研究將通過實踐來檢驗這一模型,以期使這個本體構(gòu)建模型更加完善化和相對通用化。
【一種基于經(jīng)典領(lǐng)域本體構(gòu)建方法的改進研究】相關(guān)文章:
學(xué)科領(lǐng)域知識本體建設(shè)方法研究10-03
基于本體的概念設(shè)計知識管理研究08-12
淺談基于語義web的高校畢業(yè)生就業(yè)信息服務(wù)系統(tǒng)本體構(gòu)建研究10-19
專利資產(chǎn)評估方法的改進研究09-03
基于本體的市場準(zhǔn)入知識獲取技術(shù)的研究與實現(xiàn)05-15
基于改進的Ostu閾值的運動目標(biāo)分割方法07-26
基于環(huán)境視角的創(chuàng)業(yè)研究框架構(gòu)建06-26
基于網(wǎng)格的聚類方法研究07-13
一種改進的粒子濾波算法的研究10-05