- 相關(guān)推薦
基于語義Web的旅游信息服務(wù)的研究與應(yīng)用
摘 要 本文提出了一種基于語義Web的旅游信息服務(wù)應(yīng)用的新架構(gòu),并給出了實(shí)現(xiàn)此服務(wù)應(yīng)用的構(gòu)建方法。該方法通過本體來增強(qiáng)服務(wù)描述語義,利用OWL本體描述語言來表示旅游本體的語義信息,通過基于本體的描述邏輯的推理有效地實(shí)現(xiàn)旅游信息的語義化查詢和智能化服務(wù)。
關(guān)鍵詞 語義Web;本體;OWL;推理
1 引言
近年來,Web的發(fā)展日新月異,已經(jīng)成為一個(gè)巨大的全球化信息資源庫。網(wǎng)絡(luò)信息資源數(shù)量飛速增長,網(wǎng)絡(luò)信息資源組織呈現(xiàn)多種模式并存的局面。專家學(xué)者們?cè)趪L試了多種提高網(wǎng)絡(luò)信息資源組織質(zhì)量,改進(jìn)檢索效率的措施之后,正嘗試綜合運(yùn)用不同層次的元數(shù)據(jù)模型來構(gòu)建語義Web,使Web文檔的語義能清晰地體現(xiàn)出來,并為檢索程序所理解。而傳統(tǒng)的旅游信息系統(tǒng)是在數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)上發(fā)展起來的,歐洲在這方面有許多成功的例子,比較著名的有奧地利帝羅爾信息系統(tǒng),瑞士阿彭策爾信息系統(tǒng)等[1]。這些系統(tǒng)功能強(qiáng)大,涵蓋了旅游業(yè)的食、宿、行、導(dǎo)、購游等各項(xiàng)服務(wù)功能,但隨著旅游服務(wù)信息和服務(wù)需求信息的幾何級(jí)數(shù)的速度增長,基于傳統(tǒng)的旅游信息查詢已不能適應(yīng)當(dāng)前旅游者對(duì)旅游信息的快速多變化的需求增長,在此基礎(chǔ)上,本文結(jié)合目前語義Web技術(shù)的新發(fā)展,提出了一種基于語義web的旅游信息服務(wù)的新構(gòu)建,其在Web系統(tǒng)中增加機(jī)器可理解的語義內(nèi)容,實(shí)現(xiàn)了語義信息的推理查詢,有效地提高了旅游信息查詢的廣度和準(zhǔn)確度。
2 語義Web的相關(guān)技術(shù)
2000年Berners_Lee在XML2000會(huì)議上正式提出Sematic Web[2],它的基本思想就是通過在Web信息的創(chuàng)作和發(fā)布中嵌入機(jī)器可閱讀的、代表某類知識(shí)的標(biāo)注,使Web上的數(shù)據(jù)不僅被機(jī)器顯示,而且能夠被機(jī)器理解,使網(wǎng)絡(luò)中盡可能多的信息都具有語義的表達(dá)。語義Web的體系結(jié)構(gòu) [2]包括有七層,自下而上各層功能逐漸增強(qiáng)。
2.1語義Web中的本體
本體是對(duì)共享的概念化進(jìn)行形式的顯式規(guī)范說明[3]。通俗地講,本體是用來描述某個(gè)領(lǐng)域甚至更廣范圍內(nèi)的概念以及概念之間的關(guān)系,使得這些概念和關(guān)系在共享的范圍內(nèi)具有大家共同認(rèn)可的、明確的、唯一的定義。通過構(gòu)造領(lǐng)域本體知識(shí)庫為信息源提供必要的語義信息,使系統(tǒng)對(duì)領(lǐng)域的概念、概念之間的聯(lián)系及領(lǐng)域內(nèi)的基本公理知識(shí)有一個(gè)統(tǒng)一的認(rèn)識(shí),進(jìn)一步實(shí)現(xiàn)Web信息的智能化推理,提高系統(tǒng)的智能性和精確性。目前本體已經(jīng)被廣泛應(yīng)用于語義Web 、智能檢索、信息集成等領(lǐng)域[4]。
2.2 語義Web的本體建模語言
2004年,W3C提出OWL作為對(duì)本體描述的語言。它有三個(gè)表達(dá)能力遞增的子語言:OWL Lite、OWL DL和OWL Full ?紤]到實(shí)際應(yīng)用在知識(shí)表達(dá)能力和推理能力較強(qiáng)和保證推理的可判定性兩個(gè)方面的要求,選擇OWL DL作為本應(yīng)用的本體表示語言。
2.3 本體的構(gòu)建工具
目前的本體構(gòu)建工具有Ontolingua[5],WebOnto[6],OntoSaurus[7],Protege_2000[8],WebODE[9],OntoEdit[10]等。借助這些工具,可以把精力集中在旅游本體信息的組織上,而不必了解本體描述語言的復(fù)雜語法細(xì)節(jié),避免了很多錯(cuò)誤的發(fā)生,更方便我們對(duì)本體的構(gòu)建。本應(yīng)用中,我們采用Protege2000作為該旅游信息本體的構(gòu)建工具。Protege2000是美國Stanford大學(xué)開發(fā)的本體編輯器,它用Java開發(fā)是一個(gè)開源的項(xiàng)目,以O(shè)WL插件的形式支持OWL格式的本體,此OWL插件用Jena包支持OWL文檔的讀取。
2.4 推理的應(yīng)用
Jena是一個(gè)為語義網(wǎng)應(yīng)用設(shè)計(jì)的一個(gè)Java API,專門用來構(gòu)建語義網(wǎng)的應(yīng)用軟件,它為RDF、RDFS和OWL提供了一個(gè)可編程實(shí)現(xiàn)的環(huán)境。推理功能是Jena中的一個(gè)重要子系統(tǒng),用來實(shí)現(xiàn)本體信息的智能推理。
3 語義Web的旅游服務(wù)應(yīng)用實(shí)例
圖1的本體信息中,實(shí)箭頭表示實(shí)例,虛箭頭表示屬性關(guān)系,其中有部門機(jī)構(gòu)、省市、旅游景點(diǎn)、旅店等四個(gè)本體的部分信息,當(dāng)有一游客需要了解桂林的景點(diǎn)名山時(shí),傳統(tǒng)的做法是建立數(shù)據(jù)庫系統(tǒng)進(jìn)行管理,但基于關(guān)鍵字的查詢有時(shí)是不能滿足的,此時(shí)系統(tǒng)可能通過旅游景點(diǎn)的實(shí)例信息七星公園和象山公園來找到駱駝山和象鼻山,由于獨(dú)秀峰并不存在于景點(diǎn)的具體實(shí)例中,此時(shí)就查詢不到獨(dú)秀峰。然而我們知道廣西師大內(nèi)有一座獨(dú)秀峰,同時(shí)獨(dú)秀峰也是旅游景點(diǎn)的一個(gè)子類,則可以認(rèn)為廣西師大也作為一景點(diǎn)實(shí)例。通過語義Web,利用Jena推理機(jī)進(jìn)行語義查詢,返回獨(dú)秀峰作為查詢結(jié)果提交給用戶。同時(shí),當(dāng)要查找桂林市內(nèi)旅店時(shí),不僅可以通過旅店的實(shí)例查詢到帝苑酒店和桂林賓館,此外,廣西師大內(nèi)設(shè)有學(xué)校招待所,而招待所同時(shí)也是旅店的一個(gè)子類,所以認(rèn)為廣西師大也可作為旅店實(shí)例,并把學(xué)校招待所也作為查詢結(jié)果返回給用戶。而且當(dāng)我們要統(tǒng)計(jì)桂林市區(qū)內(nèi)的旅游景點(diǎn)時(shí)由于廣西師大和旅游景點(diǎn)并無直接實(shí)例關(guān)系,借助傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)無法得出獨(dú)秀峰也是秀峰區(qū)的一個(gè)旅游景點(diǎn)。而通過構(gòu)建語義Web,我們知道廣西師大內(nèi)獨(dú)秀峰是一旅游景點(diǎn)子類,自然也認(rèn)為廣西師大屬于旅游景點(diǎn),同時(shí)廣西師大又位于秀峰區(qū),通過本體和Jena推理機(jī)的應(yīng)用可以方便的查找到秀峰區(qū)下有一景點(diǎn)為廣西師范大學(xué),這樣利用語義Web可以更全面更準(zhǔn)確的查找到更多相關(guān)的旅游信息。
4 基于語義Web的旅游服務(wù)系統(tǒng)
4.1 基本功能結(jié)構(gòu)
系統(tǒng)包括如圖2所示7個(gè)基本功能模塊。
信息統(tǒng)計(jì)分析:如指定范圍的旅游景點(diǎn)數(shù),旅游景區(qū)的分布,各旅游景區(qū)的旅游流情況,旅游景區(qū)的分類等。
語義描述模塊:負(fù)責(zé)對(duì)指定的信息資源(如非結(jié)構(gòu)化、半結(jié)構(gòu)化、結(jié)構(gòu)化)將相關(guān)領(lǐng)域的本體類、語義屬性、語義關(guān)系以及語義規(guī)則用OWL進(jìn)行旅游信息的語義描述。
語義提取模塊:本應(yīng)用選取指定的幾個(gè)有名的旅游信息網(wǎng)站作為輔助信息源,結(jié)合語義描述模塊對(duì)其中旅游信息進(jìn)行語義提取,將最終結(jié)果轉(zhuǎn)化為OWL格式文件。
語義存儲(chǔ)模塊:主要負(fù)責(zé)將OWL所描述的信息資源與Protege構(gòu)建的旅游本體庫一起存儲(chǔ)到MySql數(shù)據(jù)庫中。
語義查詢模塊:主要負(fù)責(zé)基于語義的旅游信息查詢。
語義輸出模塊:主要負(fù)責(zé)將旅游信息本體類、語義屬性、語義關(guān)系及由此推理得到的隱藏信息以一定的方式呈現(xiàn)給用戶?赏ㄟ^與本體類、語義屬性定義的子系統(tǒng)的接口以及推理查詢子系統(tǒng)的接口來獲得。
系統(tǒng)維護(hù)管理模塊:主要是系統(tǒng)本體數(shù)據(jù)庫建立、編輯與更新,以及系統(tǒng)的界面修改和文件管理等。
4.2 基于語義的推理查詢
基于語義Web的旅游信息服務(wù)應(yīng)用最重要的一個(gè)功能就是在系統(tǒng)中使用了基于本體的語義推理查詢,由于使用本體作為檢索系統(tǒng)的語義核心,充分利用其在知識(shí)表示和語義描述上的特性和優(yōu)點(diǎn),將語義處理結(jié)合到應(yīng)用模型中去,利用Jena推理機(jī)結(jié)合自定義的規(guī)則庫進(jìn)行更廣泛的推理,很好的實(shí)現(xiàn)信息查詢的智能化;谡Z義的推理查詢可實(shí)現(xiàn)如下子查詢:
周邊信息查詢:查詢從指定地點(diǎn)周邊指定距離內(nèi)的旅游資源、公共服務(wù)設(shè)施及企事業(yè)單位。用戶可以對(duì)某一地點(diǎn)對(duì)其周邊指定范圍內(nèi)的指定資源類別進(jìn)行查詢分析,如對(duì)桂林市區(qū)“漓江”周邊“2000米”范圍內(nèi)的“四星級(jí)的景點(diǎn)”進(jìn)行查詢分析,得到了七星公園、象山公園、伏波山、疊彩山等4條查詢結(jié)果,點(diǎn)擊其中一條即可顯示出其相關(guān)旅游信息。
最近信息查找:查詢離指定地點(diǎn)最近的旅游資源、公共服務(wù)設(shè)施及企事業(yè)單位。用戶可對(duì)某一地點(diǎn)查詢距離其最近的一類指定資源類別,并顯示其查詢結(jié)果和相關(guān)旅游信息。如我們要查詢距離“廣西師大”最近的“四星級(jí)景點(diǎn)”,推理查詢后得到“伏波山”1條查詢結(jié)果。
高級(jí)查詢:系統(tǒng)提供給用戶多種選擇信息進(jìn)行自動(dòng)匹配并推理查找出條件相符的各類信息。由于本應(yīng)用中的各種查詢都要利用部署在接口與本體之間的推理機(jī),通過推理機(jī)對(duì)查詢的語言進(jìn)行規(guī)范統(tǒng)一的處理后,根據(jù)本體中內(nèi)容之間的邏輯關(guān)系推理出備選的答案。
4.3 系統(tǒng)實(shí)現(xiàn)
4.3.1系統(tǒng)模型架構(gòu)
本系統(tǒng)采用B/S模式,所用軟件包均是基于 Java環(huán)境的開源項(xiàng)目,具有很好的移植性和開放性。該系統(tǒng)利用“旅游信息本體庫”為用戶提供基于本體的語義信息檢索,采用可視化的界面和多種方式的查詢?nèi)肟冢瑢?shí)現(xiàn)基于語義的智能信息查詢。系統(tǒng)模型架構(gòu)如圖3所示。
用戶端界面作為系統(tǒng)的門戶,包括信息錄入、顯示和查詢等操作,它為用戶通過瀏覽器訪問信息系統(tǒng)提供了一個(gè)基于Web的接口。用戶通過瀏覽窗口提交服務(wù)請(qǐng)求給HTTP服務(wù)器,HTTP服務(wù)器從消息中解析出查詢請(qǐng)求,轉(zhuǎn)發(fā)請(qǐng)求給服務(wù)器端的Web服務(wù)器,Web服務(wù)器把請(qǐng)求交給Servlet服務(wù)器組件,調(diào)用javaBean通過內(nèi)部推理機(jī),搜索本體數(shù)據(jù)庫中的信息。Web服務(wù)器把推理查詢的結(jié)果遞交給HTTP服務(wù)器,再由HTTP服務(wù)器把結(jié)果包裝成SOAP消息發(fā)送給用戶。
4.3.2本體信息數(shù)據(jù)庫
本體數(shù)據(jù)庫中存儲(chǔ)的是相關(guān)的旅游本體信息,是整個(gè)系統(tǒng)的基石。
圖4中對(duì)旅游領(lǐng)域相關(guān)的非結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化信息進(jìn)行語義實(shí)體和語義關(guān)系的抽取,結(jié)合構(gòu)建好的領(lǐng)域本體庫一并置入語義本體數(shù)據(jù)庫中。我們將語義本體庫存儲(chǔ)在MySql關(guān)系數(shù)據(jù)庫中,使用關(guān)系數(shù)據(jù)庫的表結(jié)構(gòu)來存儲(chǔ)本體庫中的三元數(shù)據(jù)。由于“旅游本體庫”是用Protege作為工具開發(fā)的,因此本體庫最初的存儲(chǔ)方式是OWL文件,這里需要利用OwlFile2DB類來將本體數(shù)據(jù)庫裝載到數(shù)據(jù)庫中去。基于數(shù)據(jù)庫的本體存儲(chǔ)方式比文件存儲(chǔ)方式能處理更大的本體庫模型,而且不需要顯式的保存數(shù)據(jù)模型,效率更高,但是需要復(fù)雜的數(shù)據(jù)庫配置。但對(duì)于大多數(shù)應(yīng)用來說,數(shù)據(jù)庫方式是必要的。所以本應(yīng)用采用了這種方式。
4.3.3推理查詢模塊
應(yīng)用中的本體信息查詢是基于語義Web技術(shù)的發(fā)展,考慮到查詢用戶的特性以控制查詢過程,通過使用一些描述邏輯語言,對(duì)大量的領(lǐng)域信息和網(wǎng)絡(luò)資源使用邏輯表述進(jìn)行唯一規(guī)范化的合理解析,并使用語義精確方法與本體數(shù)據(jù)庫中的術(shù)語相關(guān)聯(lián),利用本體庫中的術(shù)語及術(shù)語之間的關(guān)系來建立用戶查詢界面,系統(tǒng)將用戶的選擇包含到查詢串中,對(duì)本體數(shù)據(jù)庫中的旅游信息進(jìn)行語義查詢我們還需要利用Jena推理機(jī)來實(shí)現(xiàn)此功能。首先,把圖1中所有用到的與旅游相關(guān)的概念、關(guān)系和實(shí)例用Protege工具構(gòu)建好,以O(shè)WL的形式存儲(chǔ)到MySql數(shù)據(jù)庫中。對(duì)于選定的一些輔助網(wǎng)絡(luò)資源,通過本體發(fā)現(xiàn)、本體映射等方法進(jìn)行語義實(shí)體及語義關(guān)系的發(fā)現(xiàn)和抽取并將結(jié)果以O(shè)WL的形式存儲(chǔ)到語義本體數(shù)據(jù)庫中。第二,根據(jù)查詢需要構(gòu)造本體規(guī)則庫:如:
Rule1:(?x hasHill ?y),(?y isSubClassOf ?z) (?x isSubClass ?z)
Rule2:(?x hasHill ?y),(?x locateIn ?z) (?Y locateIn ?z)
Rule3:(?x hasHotel ?y),(?y isSubClassOf ?z) (?x isSubClassOf ?z)
Rule1說明如果某部門機(jī)構(gòu)x內(nèi)有一座山y(tǒng),而y屬于旅游景點(diǎn)z,則x也屬于旅游景點(diǎn)z的子類。Rule2說明如果某部門機(jī)構(gòu)x內(nèi)有一座山y(tǒng),x位于城區(qū)z,則y也位于城區(qū)z。Rule3說明如果某部門機(jī)構(gòu)x設(shè)有招待所y,而y屬于旅店z,則x也屬于旅店z。第三,把建立好的規(guī)則庫放入Jena推理機(jī)中,基于前面建立的本體信息數(shù)據(jù)庫進(jìn)行推理,可以很方便的推理查詢出更多更精確的旅游信息。
本應(yīng)用系統(tǒng)利用本體把語義信息加入到檢索中,實(shí)現(xiàn)了描述邏輯推理過程的優(yōu)化,實(shí)現(xiàn)了語義Web的推理查詢方法。實(shí)際應(yīng)用表明,該方法能夠以一種明確的、形式化的方式來表示領(lǐng)域知識(shí),促進(jìn)知識(shí)共享的實(shí)現(xiàn)和智能性檢索技術(shù)的應(yīng)用。
5 結(jié)束語
基于語義Web的系統(tǒng)構(gòu)建是未來網(wǎng)絡(luò)發(fā)展的必然趨勢(shì)。我們知道本體是語義Web中最關(guān)鍵的技術(shù),它使得Web上的信息共享和重用成為可能。但當(dāng)前的本體編輯工具發(fā)展得還不成熟。要使得本體編輯工具得到更廣泛的應(yīng)用,還應(yīng)在界面化、功能完善、推理支持和與其它的開發(fā)工具結(jié)合上更進(jìn)一步。同時(shí)本體集成、映射方法還很不成熟。雖然語義Web技術(shù)的研究取得了很大的發(fā)展,但是Intenet上基于本體的語義的應(yīng)用卻不能得到很好的實(shí)現(xiàn),使得信息的共享查詢不能很好的在各個(gè)領(lǐng)域中得以交融,這些都有待我們做更進(jìn)一步的深入研究。
參考文獻(xiàn)
[1] 黃怡然,黃杏元.基于Internet的旅游信息系統(tǒng)研究[J].計(jì)算機(jī)應(yīng)用研究,2000,15(1):114-117
[2] Lee T B,Hendler J,Lassila O.The semantic Web[J].Scientific A merican,2001,284(5)
[3] Gruber T.A translation approach to portable ontology specifications[J].Knowledge Acquisition Acquisition,1993,5:199-200
[4] Deng ZH,Tang SW,Zhang M,Yang DQ,Chen J.Overviewof ontoloty[M].Acta Scientiarrum Naturalium Universitatis Pekinensis,2002,38(5):730-738
[5] Farquhar A,F(xiàn)ikes R,Rice J. The Ontoling server:A tool for collaborative ontology construction[J]. Int’l Journal ofHuman-Computer Studies,1997,46(6):707-727
[6] Duineveld AJ,Stoter R,Weiden MR. Wonder tools? A comparative study of ontological engineering tools[J]. Int’l Journal of Human-Computer Studies,2000,52(6):1111-1133
[7] Swartout B,Ramesh P.Toward distributed use of large scale ontologies[C].In:Proc.of the AAAI Symp. on OntologicalEngineering. 1996.http://ksi.cpsc.ucalgary.ca/ KAW /KAW96/swartout/Banff_96_final_2.html
[8] Noy NF,F(xiàn)ergerson RW,Musen MA. The knowledge model of protégé-2000:Combinining interoperability and flexibility[C]. In:Dieng R,Corby O,eds. Proc. of the EKAW2000. Heidelberg:Springer-Verlag,2000. 17-32
[9] Arpirez JC,Corcho O,. WebODE:A scalable ontological engineering workbench[C]. In:Gil Y,MusenM,Shavlik J,eds. Proc. of the K-CAP 2001.New York:ACM Press,2001. 6-13
[10] Sure Y,Angele J,Erdmann M,Staab S,Studer R,Wenke D. OntoEdit:Collaborative ontolo-gy engineering for the semantic Web[C].In:Horrocks I,Hendler JA,eds. Proc. of the ISWC 2002. Heidelberg:Springer-Verlag,2002. 221-235
【基于語義Web的旅游信息服務(wù)的研究與應(yīng)用】相關(guān)文章:
Web Workers加速移動(dòng)Web應(yīng)用07-01
WEB教程標(biāo)準(zhǔn)應(yīng)用標(biāo)簽10-19
平面設(shè)計(jì)中色彩語義的應(yīng)用07-25
Web Service的開發(fā)與應(yīng)用基礎(chǔ)07-12
Web服務(wù)中的異常處理09-17
基于信息化下的品牌管理提升策略研究08-02
基于web的辦公自動(dòng)化系統(tǒng)推薦10-02