淺析教育資源網(wǎng)格分布式檢索子系統(tǒng)的研究與設計

時間：2024-09-22 00:07:35 計算機應用畢業(yè)論文我要投稿

相關推薦

　　論文關鍵詞:資源網(wǎng)格　分布式　資源檢索

　　論文摘要:在資源網(wǎng)格系統(tǒng)中,資源往往處于不同地區(qū)、不同結構的資源節(jié)點上,使用傳統(tǒng)的集中式的檢索機制無法勝任大量異構資源的檢索和發(fā)現(xiàn)。為了解決這個問題,研究設計了一個以XML為基礎的分布式檢索子系統(tǒng)。該系統(tǒng)通過同構的XML文件對不同資源節(jié)點上的本地資源進行描述,生成該節(jié)點上本地資源的描述XML文件,并以此為基礎,對多節(jié)點的大量資源文件實現(xiàn)了分布式的檢索。
　　
　　目前,隨著現(xiàn)代信息技術在教育領域的廣泛應用,各地的中小學都擁有大量各種各樣的教學資源,包括教學課件、教學案例、精品課程教學視頻和各類輔助教學軟件等,但這些資源往往只能在有限的地域內尤其是校內才能訪問,互相之間發(fā)現(xiàn)和共享資源都十分困難,形成了許多的“信息孤島”,限制了不同學校、不同地域的信息交流和資源共享。因此,如何實現(xiàn)不同學校、不同地域之間的資源共享,提高資源的利用效率,避免同類資源的重復開發(fā),是目前中小學教育信息化建設迫切需要解決的問題。
　　大量資源被分布在不同區(qū)域的不同資源節(jié)點上,每個節(jié)點對其所擁有資源的描述和存儲方式各有不同,有的通過各種數(shù)據(jù)庫,有的則通過一些資源描述文件來組織其本地資源,加之各種數(shù)據(jù)庫、描述文件之間往往是異構的,其各自的資源檢索機制也是多種多樣[1]。顯然,在這種下,使用傳統(tǒng)的集中式的檢索機制無法勝任大量異構資源的檢索和發(fā)現(xiàn)。網(wǎng)格作為一種日益流行的分布式計算平臺,為教育資源的共享提供了一種有效的解決方案。在網(wǎng)格的環(huán)境下,分布在不同地域、不同主機上的資源可以通過松散耦合的方式實現(xiàn)共享,其中資源的、存儲機制與傳統(tǒng)的集中式的資源組織方式有著很大的不同。
　　XML是一種開放標準、簡單易用的,它支持國際化,與平臺、工具、數(shù)據(jù)庫、協(xié)議、編程語言無關,并且XML文件是基于文本的,易讀易寫,也易于在網(wǎng)絡中。本文正是利用了XML語言的這些優(yōu)點,通過同構的XML文件對不同資源節(jié)點上的本地資源進行描述,生成該節(jié)點上本地資源的描述XML文件,并以此為基礎,對多節(jié)點的大量資源文件進行分布式的檢索。
　　
　　一、分布式檢索子系統(tǒng)的體系結構分析
　　在教育資源網(wǎng)格的體系結構中,對資源的存儲和管理一般被分散在若干個具有不同結構的子節(jié)點上,本文定義這種節(jié)點為一個資源節(jié)點。資源節(jié)點一般位于一個較小的教學部門內,存儲了該部門一定數(shù)量的教學資源,并以web服務的方式供用戶和其它資源節(jié)點訪問。但不同資源節(jié)點的資源組織方式往往不同,有的是通過數(shù)據(jù)庫,有的是通過一些描述文件,而且數(shù)據(jù)庫的種類和結構也有很大的差別,這就導致不同資源節(jié)點之間資源共享和發(fā)現(xiàn)都十分困難。
　　在以上所描述的環(huán)境中,用戶如果想訪問這些資源,需要登陸每一個資源節(jié)點進行檢索和下載,但因為資源節(jié)點分布廣泛,數(shù)量眾多,用戶要盡快的檢索到自己所需要的全部資源存在一定的難度。分布式資源檢索策略可以有效的解決這一問題,該策略的思想是當用戶登陸任何一個資源節(jié)點的時候,這個節(jié)點除了要檢索自己本地的資源以外,還又作為一個客戶端,自動地去連接其它資源節(jié)點并發(fā)出檢索請求,將檢索結果進行合并和匯總后返回給用戶[2]。
　　
　　二、本地資源的XML描述
　　在教育資源網(wǎng)格系統(tǒng)中,資源通過各種協(xié)議由資源發(fā)布人上傳至資源節(jié)點。資源發(fā)布人在上傳過程中,需要指定資源的標題、所屬年級、學科、作者等描述信息,這些信息往往是資源檢索的依據(jù)。因此,本地資源的XML描述文件需要記錄以上的資源信息。為了實現(xiàn)所有資源的統(tǒng)一組織,這個XML文檔在不同的資源節(jié)點上應該是同構的。
　　根據(jù)以上的思想,需要對XML文檔進行統(tǒng)一規(guī)范。在一個資源節(jié)點的XML描述文檔中,XML頭部顯式定義文檔使用UTF-8作為編碼方式,以廣泛地支持各種字符集。XML文檔以allresource作為根元素,表示該元素下的子元素描述了該資源節(jié)點全部資源的信息。allresource元素下包含至少一個resourceitem元素,表明了該資源節(jié)點下的一個資源項。在resourceitem元素之下,又分別定義了該資源的各種描述信息,包括標題、所屬年級、學科等。
　　在每一個資源節(jié)點上,只需一個節(jié)點管理程序,該程序會隨著其所屬本地資源的變動維護一個XML文檔,它的作用實質上是充當一個資源發(fā)言人的角色。其他站點只要通過這個XML文檔,就可以得到這個資源節(jié)點所管理的所有資源的信息,包括資源的描述信息和資源的地址信息。因此,對資源的檢索過程也就轉化為對這個XML文檔內容的檢索過程。
　　
　　三、基于XPath的本地資源檢索
　　通過以上論述,對一個資源節(jié)點的檢索過程可以通過檢索其資源描述的XML文檔內容來完成。XPath是一門在 XML 文檔中查找信息的語言,它可以用來在 XML 文檔中對元素和屬性進行遍歷,使用路徑表達式來選取XML文檔中的節(jié)點或者節(jié)點集,可以通過XPath語言構造資源檢索語句。
　　在 XPath中,有元素、屬性、文本、命名空間、處理指令、注釋和根節(jié)點七種類型的節(jié)點。在遍歷過程中,XML 文檔是被作為節(jié)點樹來對待的。樹的根被稱為根節(jié)點,在根節(jié)點下,路徑表達式可以通過類似Windows操作系統(tǒng)文件夾的形式構造。
　　通過XPath語言構造出的資源檢索語句需要返回XML文檔的資源描述中所包含的用戶所提供的檢索字符串中的資源項。在上文資源描述的定義規(guī)范中,對資源項的具體信息描述,如標題、所屬年級、學科等,都是以子元素的形式位于該資源項元素之下,因此,要想獲得該資源項元素,需要對已經(jīng)查找到的包含用戶檢索字符串的元素進行軸路徑查找,以向上回溯獲得該元素的父節(jié)點,即所要返回的資源項元素。
　　
　　四、基于Java RMI的分布式檢索機制
　　在本文所描述的分布式資源共享的下,如果僅僅使用本地資源檢索,用戶需逐個登陸多個服務器以檢索所需要的資源,“信息孤島”的局面依然沒有解決,不能滿足分布式檢索子系統(tǒng)的要求。本文提出一種分布式檢索的機制,用戶登陸任意一臺服務器提交資源檢索字符串后,該服務器除在本地進行檢索之外,還將字符串檢索命令以洪泛的方式提交給它所知道的所有資源節(jié)點服務器。所有得到該命令的服務器分別在自己的XML資源描述文檔中查找是否包含用戶所需要的資源,如果有,則將該資源的描述信息和地址信息以結果集的形式返回給命令的發(fā)起服務器。由發(fā)起服務器負責將多個服務器返回的結果集進行合并、排序等操作,最后返回給用戶。
　　基于以上思想,分布檢索子系統(tǒng)可以采用Java RMI技術來實現(xiàn)。Java RMI是Java的一組支持開發(fā)分布式應用程序的API。RMI使用Java接口定義了遠程對象,集合了Java序列化和Java遠程方法協(xié)議。由于J2EE是分布式程序平臺, RMI機制可以實現(xiàn)程序組件在不同操作系統(tǒng)之間的,這樣就使原先的程序在同一操作系統(tǒng)的方法調用,變成了不同操作系統(tǒng)之間程序的方法調用。發(fā)起服務器將檢索命令提高的過程就可以看作是發(fā)起服務器對遠程服務器本地資源檢索方法的一次調用,通過RMI方法特有的JRMP協(xié)議,實現(xiàn)兩臺服務器命令的提交和結果集的返回。
　　
　　五、分布式檢索的緩存策略和流程設計
　　引入分布式的檢索機制后,由于要對用戶的查詢請求使用洪泛的方式交付給每一個服務器處理,網(wǎng)絡的流量負擔會加重,造成檢索延遲的增大,影響到查詢效率。但資源節(jié)點服務器擁有的資源項相對固定,在一段時期內對服務器進行特定字符串檢索往往會返回同樣的結果。因此,采用在本地服務器中保存常用字符串檢索結果的緩存策略,會提高資源檢索的速度,降低網(wǎng)絡流量的壓力。為了獲取當前各資源節(jié)點的最新信息,還需要引入相應的超時和更新機制,限定緩存的生命周期,對緩存進行周期性的更新。
　　在緩存策略中,什么樣的字符串應該被緩存是首先要解決的問題。本文采用的是人工定義的方法,根據(jù)經(jīng)驗定義一些字符串作為緩存項,主要是分類檢索的各個子項[3],如按年級分類檢索的子項“高一”、“高二”,按學科分類檢索的子項“語文”、“”等。因為這些字符串相對比較固定且在網(wǎng)格的首頁設有鏈接,被檢索的幾率較高。
　　為好緩存并定時地創(chuàng)建、更新緩存項,在每一個服務器本地定義了一個XML文檔,該文檔描述了這臺服務器所有檢索緩存的字符串名稱、緩存更新的時間以及該字符串的類型信息。其中,字符串名稱不僅表示檢索時所對應的字符串,還表示該字符串檢索結果緩存在本地所保存的文件名;字符串的類型由type屬性決定;為方便地進行日期比較和時間差計算,緩存更新時間用該緩存項最后的更新時間與1970年1月1日之間的毫秒數(shù)來表示。
　　用戶提交檢索命令之后,檢索子系統(tǒng)首先讀取caches.xml文檔,檢查是否含有相應的緩存項的記錄。如果沒有,將其作為普通的字符串提交給分布式檢索引擎進行檢索。如果有,讀入該緩存項,提取出該緩存項的時間信息。如果該緩存最后更新時間與當前時間的差t大于規(guī)定的超時時間閾值tmax,則認定該緩存項超時,將該字符串提交給檢索引擎進行檢索,當結果集返回合并后,更新本地緩存文件,并更新caches.xml的相應更新時間信息。如果判定本地緩存項沒有超時,則直接讀入以字符串名命名的該緩存項的XML文件,作為結果集返回給用戶。
　　本文設計并實現(xiàn)了一個基于XML的分布式檢索子系統(tǒng),該系統(tǒng)使用XML文檔作為一個資源節(jié)點的資源描述文件,并使用Java RMI技術實現(xiàn)了分布式、多服務器的檢索。為提高檢索效率,降低網(wǎng)絡流量,還引入了緩存策略。該系統(tǒng)符合教育資源網(wǎng)格系統(tǒng)的要求,有效的解決了不同地域、多種異構教育資源的共享問題。　　
　　
　　參考文獻:
　　[1]高宏卿,王曉東.基于網(wǎng)格技術的校園網(wǎng)應用研究.應用研究,2005,(9).
　　[2]Rahman R M,Barker K, Alhajj R. Replica Placement Design with Static Optimality and Dynamic Maintainability[C]//Proceedings of the 6th IEEE International Symposium on Cluster Computing and the Grid.[S.1.]:IEEE Press,2006.
　　[3]吳雄奇,曾文華.基于虛擬組織的網(wǎng)格文件資源共享模型[J].計算機技術與發(fā)展,2007,17(3):1-4.□

【淺析教育資源網(wǎng)格分布式檢索子系統(tǒng)的研究與設計】相關文章：

搜索引擎檢索子系統(tǒng)的設計與實現(xiàn)ASP+SQL11-23

探析CBR在因特網(wǎng)教育資源檢索中的應用03-20

基于CPRI標準的分布式基站研究與設計03-07

淺析和諧實踐教育模式研究03-18

基于內容的圖像檢索研究11-20

北蟲草專利檢索策略研究03-14

計算網(wǎng)格資源管理優(yōu)化技術和相關算法研究03-19

新型的完全分布式P2P-SIP網(wǎng)絡資源定位方法研究03-07

淺析半剛性連接鋼框架結構的研究與設計03-01

亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

淺析教育資源網(wǎng)格分布式檢索子系統(tǒng)的研究與設計