亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

計(jì)算機(jī)網(wǎng)絡(luò)畢業(yè)論文-基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)

  • 相關(guān)推薦

計(jì)算機(jī)網(wǎng)絡(luò)畢業(yè)論文-基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)

摘要:利用網(wǎng)格、集群系統(tǒng)、XML等技術(shù)對(duì)分散的Web信息資源按地區(qū)按專業(yè)從邏輯上進(jìn)行了有效的組織和管理,設(shè)計(jì)了一個(gè)基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)構(gòu),為用戶高效地獲取面向?qū)I(yè)內(nèi)容的信息資源提供了一種。 


  關(guān)鍵詞:網(wǎng)格計(jì)算,集群系統(tǒng),XML, Agent, Web   

  1、引言

  近年來,互聯(lián)網(wǎng)得到了迅速的,網(wǎng)上信息資源愈來愈龐大,且信息具有量大、分散、異構(gòu)等特性,因此,傳統(tǒng)的Web信息檢索工具開始暴露出它性能低下的一面,具體體現(xiàn)在現(xiàn)有的信息檢索工具對(duì)用戶的要求常常是找出了幾千甚至上萬條記錄,根本無法從中再細(xì)找,或者找到的內(nèi)容和要找的內(nèi)容不是一個(gè)專業(yè)領(lǐng)域的,造成信息無效的現(xiàn)象。但隨著人們信息意識(shí)的增強(qiáng),對(duì)信息內(nèi)容及信息服務(wù)的需求也在不斷的演變和發(fā)展,對(duì)獲取信息的專業(yè)化、實(shí)效性等方面有了新的要求。如何針對(duì)專業(yè)領(lǐng)域中特定的用戶群為他們提供專業(yè)的、度身量造的信息服務(wù),使用戶在盡可能短的時(shí)間內(nèi)有效的找到最需要的信息內(nèi)容是大家普遍關(guān)注的一個(gè)。本文利用網(wǎng)格計(jì)算、集群系統(tǒng)、XML等技術(shù)設(shè)計(jì)了一個(gè)基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)構(gòu),它能將地理位置分散的、異構(gòu)的信息按地區(qū)按專業(yè)內(nèi)容從邏輯上進(jìn)行合理的組織和管理,為用戶快速、有效地獲取自己所需要的信息提供了一種方法。

  2、基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)構(gòu)的設(shè)計(jì)

    網(wǎng)格計(jì)算是近年來國(guó)際上興起的一種重要信息技術(shù),其目的是將網(wǎng)上各種資源組織在一個(gè)統(tǒng)一的大框架下,為解決大型復(fù)雜計(jì)算、數(shù)據(jù)服務(wù)和各種信息服務(wù)提供一個(gè)方便用戶使用的虛擬平臺(tái),實(shí)現(xiàn)互聯(lián)網(wǎng)上所有資源的全面連通,實(shí)現(xiàn)信息資源的全面共享。

    為解決不同領(lǐng)域復(fù)雜計(jì)算與海量信息服務(wù)問題,人們以網(wǎng)絡(luò)互連為基礎(chǔ)構(gòu)造了不同的網(wǎng)格,他們?cè)隗w系結(jié)構(gòu),要解決的問題類型等方面各不相同,但網(wǎng)格計(jì)算至少需要具有三種基本功能:資源管理、任務(wù)管理、任務(wù)調(diào)度。本文設(shè)計(jì)的信息檢索體系結(jié)構(gòu),圍繞網(wǎng)格計(jì)算的基本功能及信息檢索的特點(diǎn),主要有以下三個(gè)層次組成:見圖1

 。1) 網(wǎng)格結(jié)點(diǎn):結(jié)點(diǎn)是網(wǎng)格計(jì)算資源的提供者,本系統(tǒng)主要是由一系列的集群系統(tǒng)組成,它們?cè)诘乩砦恢蒙鲜欠植嫉模瑯?gòu)成了一個(gè)分布檢索群體,作為信息共享的基礎(chǔ)結(jié)構(gòu)平臺(tái)。集群系統(tǒng)負(fù)責(zé)整個(gè)集群范圍內(nèi)的信息管理,維護(hù)和查詢。 
 。2) 網(wǎng)格計(jì)算中間件:中間件是信息資源管理和用戶任務(wù)調(diào)度、任務(wù)管理的工具。它是整個(gè)網(wǎng)格信息資源管理的核心部分,它根據(jù)用戶的信息請(qǐng)求任務(wù),在整個(gè)網(wǎng)格內(nèi)負(fù)責(zé)信息資源的匹配、定位,實(shí)現(xiàn)用戶任務(wù)到集群系統(tǒng)的映射。
 。3) 網(wǎng)格用戶層:主要為用戶提供接口,支持用戶對(duì)所需要的信息資源進(jìn)行描述、創(chuàng)建、提交等。

  本系統(tǒng)的主要思想是在邏輯上將地理位置分散的、異構(gòu)的信息劃分、組建成多個(gè)集群系統(tǒng),集群系統(tǒng)對(duì)集群內(nèi)的資源進(jìn)行管理和任務(wù)調(diào)度,再利用網(wǎng)格中間件對(duì)各集群系統(tǒng)進(jìn)行管理,從而形成對(duì)整個(gè)網(wǎng)格資源的管理,并對(duì)用戶的信息需求進(jìn)行統(tǒng)一的管理和調(diào)度。這種管理模型既可以尊重各個(gè)集群系統(tǒng)的本地信息管理策略,又可利用中間件在全局意義上對(duì)網(wǎng)格信息資源進(jìn)行管理。

  2.1  集群系統(tǒng)的設(shè)計(jì)

  由于Web信息資源數(shù)量十分龐大,用戶在利用現(xiàn)有搜索引擎檢索信息時(shí)面臨一個(gè)海量數(shù)據(jù)的查詢問題,往往造成在消耗巨大的通信資源后依然存在資源查不準(zhǔn)、查不全的問題;趩我幌到y(tǒng)映射的Web服務(wù)器集群系統(tǒng)能把若干服務(wù)器用局域網(wǎng)連接成一個(gè)整體,并使其從客戶端看來就如同一臺(tái)服務(wù)器在服務(wù),這使得在邏輯上合并、組織地理位置分布的信息資源成為可能。因此本文首先考慮采用分布協(xié)作策略,將Web信息資源按地區(qū)按專業(yè)內(nèi)容分割,一方面使信息資源數(shù)量相對(duì)縮小,便于數(shù)據(jù)的組織、管理和維護(hù),另一方面按專業(yè)內(nèi)容易于制定一個(gè)公用的XML規(guī)范,便于集群內(nèi)各類信息資源的描述,從而可建立一個(gè)基于XML的面向?qū)I(yè)內(nèi)容的信息集成系統(tǒng)。集群系統(tǒng)的具體結(jié)構(gòu)見圖2。

  集群服務(wù)器主要由接口Agent,基于專業(yè)內(nèi)容的XML信息集成系統(tǒng)、資源服務(wù)Agent、資源發(fā)布Agent等組成。其中接口Agent根據(jù)任務(wù)提供的接口參數(shù)登記、接收、管理各種信息資源請(qǐng)求任務(wù),并提供安全認(rèn)證和授權(quán)。資源服務(wù)Agent根據(jù)信息資源請(qǐng)求任務(wù),利用XML信息集成系統(tǒng)提供的數(shù)據(jù),為用戶提供實(shí)際的資源檢索操作,并將檢索結(jié)果信息發(fā)送給用戶。資源發(fā)布Agent用于向網(wǎng)格中間件提供本地信息資源的邏輯數(shù)據(jù)及接口參數(shù)。

  下面主要說明基于專業(yè)內(nèi)容的XML信息集成系統(tǒng)的構(gòu)造方法:

  XML(the eXtensible Markup Language)是 W3C于1998年宣布作為Internet上數(shù)據(jù)表示和數(shù)據(jù)交換的新標(biāo)準(zhǔn),它是一種可以對(duì)信息進(jìn)行自我描述的語言,它允許開發(fā)人員通過創(chuàng)建格式文件DTD(Document Type Definitions)定制標(biāo)記來描述自己的數(shù)據(jù),DTD規(guī)范是一個(gè)用來定義XML文件的語法、句法和數(shù)據(jù)結(jié)構(gòu)的標(biāo)準(zhǔn)。 XML使用普通文本,因此具有跨平臺(tái)的優(yōu)點(diǎn),XML的優(yōu)點(diǎn)在于

 。1)簡(jiǎn)單、規(guī)范性:XML文檔基于文本標(biāo)簽,有一套嚴(yán)謹(jǐn)而簡(jiǎn)潔的語法結(jié)構(gòu),便于計(jì)算機(jī)、用戶理解;
 。2)可擴(kuò)展性:用戶可以自定義具有特定意義的標(biāo)簽,自定義的標(biāo)簽可以在任何組織、客戶、應(yīng)用之間共享;
 。3)自描述性:自描述性使其非常適用不同應(yīng)用間的數(shù)據(jù)交換,而且這種交換是不以預(yù)先定義一組數(shù)據(jù)結(jié)構(gòu)為前提,因此具有很強(qiáng)的開放性;
 。4)互操作性:XML可以把所有信息都存于文檔中傳輸,而遠(yuǎn)程的應(yīng)用程序又可以從中提取需要的信息。XML數(shù)據(jù)是不依賴于某個(gè)特定的平臺(tái)的應(yīng)用,因此它為基于特定專業(yè)內(nèi)容的表達(dá)提供了一種極好的手段,可以作為表示專業(yè)內(nèi)容的語言。

  目前人們研制Web信息集成系統(tǒng)其基本方法可分成兩類:存入倉(cāng)庫(kù)法(the ware-housing approach)和虛擬法(the virtual approach),可使用這兩類方法利用XML在數(shù)據(jù)組織和交換方面的優(yōu)越性,采用格式文件DTD和XML文檔表示基于專業(yè)內(nèi)容的集成模式和集成模式與資源之間的映射,建立基于XML的Web信息集成系統(tǒng),其結(jié)構(gòu)與獲取信息的工作過程參見[2]。


  2.2  網(wǎng)格中間件的設(shè)計(jì)
  圖3所示的網(wǎng)格中間件的主要功能是
(1)消除不同用戶與集群系統(tǒng)之間數(shù)據(jù)表達(dá)的差異,使信息資源數(shù)據(jù)對(duì)用戶來說是透明的;
(2)管理、維護(hù)Web上分布的各集群系統(tǒng),網(wǎng)格中間件以關(guān)系數(shù)據(jù)庫(kù)方式記錄所有集群系統(tǒng)及其所包含的專業(yè)的邏輯信息,對(duì)關(guān)系數(shù)據(jù)庫(kù)的操作可維護(hù)集群系統(tǒng)的分布式邏輯,使本結(jié)構(gòu)在可變性和擴(kuò)充性上具有柔性;
(3)接受用戶的信息請(qǐng)求任務(wù),能快速定位于滿足要求的集群系統(tǒng),通過對(duì)關(guān)系數(shù)據(jù)庫(kù)的查詢實(shí)現(xiàn)用戶信息請(qǐng)求任務(wù)與集群系統(tǒng)的對(duì)應(yīng)關(guān)系。

  內(nèi)部主要功能模塊說明如下:
 。1)接收Agent模塊:主要用于登記、接收、管理各種信息資源請(qǐng)求任務(wù),并提供安全認(rèn)證和授權(quán)。
  (2)關(guān)系數(shù)據(jù)庫(kù)及數(shù)據(jù)服務(wù)Agent: 關(guān)系數(shù)據(jù)庫(kù)記錄了所有集群系統(tǒng)及其所包含的專業(yè)內(nèi)容的邏輯信息。數(shù)據(jù)服務(wù)Agent提供集群系統(tǒng)對(duì)關(guān)系數(shù)據(jù)庫(kù)的使用權(quán)限和對(duì)數(shù)據(jù)記錄的增加、刪除、檢索和修改等操作。
  (3)格式轉(zhuǎn)換Agent模塊:提供用戶信息資源請(qǐng)求文檔與各集群系統(tǒng)中文檔的格式轉(zhuǎn)換功能。由于XML是自定義的,各用戶對(duì)同一數(shù)據(jù)有不同的表示(對(duì)信息資源描述存在差異)由于XML文檔中這種格式差異體現(xiàn)在與之相關(guān)的DTD/Schema上,因此經(jīng)過格式轉(zhuǎn)換,可使信息資源的格式對(duì)用戶是透明的。
 。4)XML文檔Agent模塊:提取格式轉(zhuǎn)換后的XML文檔中各個(gè)標(biāo)簽,通過查詢網(wǎng)格中間件中的關(guān)系數(shù)據(jù)庫(kù),實(shí)現(xiàn)用戶信息請(qǐng)求任務(wù)與集群系統(tǒng)的對(duì)應(yīng)關(guān)系,并得到滿足條件的集群系統(tǒng)的相關(guān)信息,獲取各集群系統(tǒng)的接口參數(shù)。
  (5)發(fā)送Agent模塊:將轉(zhuǎn)換過的信息資源請(qǐng)求XML文檔發(fā)送到相應(yīng)的集群系統(tǒng)中。
其中Agent技術(shù)是解決分布式智能的關(guān)鍵技術(shù),Agent是指能夠自主地、連續(xù)地在一動(dòng)態(tài)變化的、存在于其它系統(tǒng)中運(yùn)行的、且不斷于環(huán)境交互的實(shí)體。在系統(tǒng)中引入Agent可使系統(tǒng)具有人的特征,代表用戶完成用戶的任務(wù),并能動(dòng)態(tài)適應(yīng)環(huán)境的變化更好地滿足用戶的需求,提高信息檢索的能力。

  3、工作過程

  要使本體系結(jié)構(gòu)具有高協(xié)作性和互操作性,用戶、網(wǎng)格中間件、集群系統(tǒng)以及其它Agent等實(shí)體之間的通信是整個(gè)系統(tǒng)運(yùn)轉(zhuǎn)的關(guān)鍵。由于XML為基于特定專業(yè)內(nèi)容的表達(dá)提供了一種極好的手段,XML是一種元語言,其嚴(yán)格的定義和規(guī)則集使人和機(jī)器都能更容易的閱讀文檔,因此本文將XML集成到各部分的通信語言中,在用戶發(fā)出的信息檢索請(qǐng)求文檔、網(wǎng)格中間件、集群系統(tǒng)之間的通信均利用XML定義,這樣做增強(qiáng)了通信的語義信息和靈活性并可以在多種平臺(tái)使用,并且基于XML的通信語言其通信內(nèi)容的表達(dá)比其它方法更容易開發(fā)語法分析器。

  具體的工作過程如下:

(1)請(qǐng)求、定位過程:由網(wǎng)格用戶層向網(wǎng)格中間件發(fā)送用戶的信息檢索請(qǐng)求文檔,描述網(wǎng)格接口參數(shù)、信息請(qǐng)求內(nèi)容等,在接受Agent進(jìn)行身份確認(rèn)及權(quán)限確認(rèn)后,經(jīng)文檔格式轉(zhuǎn)換Agent模塊、文檔分析Agent模塊、發(fā)送Agent模塊處理后,定位于某些特定的集群系統(tǒng)服務(wù)器。

(2)應(yīng)答、處理過程:集群系統(tǒng)服務(wù)器經(jīng)驗(yàn)證、調(diào)用資源服務(wù)Agent對(duì)信息集成系統(tǒng)進(jìn)行查詢后,將查詢結(jié)果信息傳輸給用戶。

  4、 結(jié)語

  本文利用網(wǎng)格、集群系統(tǒng)、XML在數(shù)據(jù)組織、交換、共享方面的優(yōu)勢(shì),對(duì)大量分散、異構(gòu)的面向?qū)I(yè)內(nèi)容的信息資源提供了一種有效組織和管理方法;并通過網(wǎng)格中間件,實(shí)現(xiàn)了信息資源的數(shù)據(jù)格式轉(zhuǎn)換與快速定位,提高了信息檢索的效果。本文僅提出了一個(gè)體系結(jié)構(gòu)設(shè)計(jì),對(duì)更為復(fù)雜的實(shí)際問題的適用性,還有待進(jìn)一步的完善和改進(jìn)。

 。

[1]  洪學(xué)海,許卓群,丁文魁. 網(wǎng)格計(jì)算技術(shù)及應(yīng)用綜述[J]. 計(jì)算機(jī),2003,30(8):1-5.
[2]  孟小峰. Web數(shù)據(jù)管理綜述[J]. 計(jì)算機(jī)研究與,2001,38(4):385-395.
[3] 葉修洪,陳根才. 基于XML的數(shù)據(jù)交換的研究和實(shí)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用研究,2000,17(12):25-27. 

【計(jì)算機(jī)網(wǎng)絡(luò)畢業(yè)論文-基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)】相關(guān)文章:

基于web的異地并行設(shè)計(jì)與制造系統(tǒng)研究06-02

基于J2EE的遠(yuǎn)動(dòng)系統(tǒng)Web實(shí)時(shí)曲線的研究05-11

畢業(yè)論文的撰寫內(nèi)容與要求01-03

畢業(yè)論文答辯內(nèi)容概要04-14

基于知網(wǎng)的翻譯研究方向碩士畢業(yè)論文寫作06-25

經(jīng)濟(jì)信息管理專業(yè)畢業(yè)論文范文09-23

關(guān)于計(jì)算機(jī)網(wǎng)絡(luò)的畢業(yè)論文11-03

基于信息安全的企業(yè)經(jīng)濟(jì)信息管理論文06-26

物流專業(yè)畢業(yè)論文11-03

信息技術(shù)碩士畢業(yè)論文提綱范文06-12