計算機的現(xiàn)代信息檢索技術進展綜述論文
摘 要:隨著計算機技術的改革和信息爆炸時代的到來,我們每個人都在面對大量的信息選擇問題。如何對有用信息進行檢索、評價和利用,這是需要研究的問題。主要對計算機信息檢索技術的發(fā)展及相關問題進行了研究。
關鍵詞:計算機;信息檢索;智能化;信息資源
在現(xiàn)代社會中,在世界的許多地方都有信息化的影子。當計算機技術和網(wǎng)絡技術被大量應用于信息領域的時候,電子化和數(shù)字化文獻信息的數(shù)量劇增,隨之而來的是信息管理方面的問題。信息檢索技術在多個領域均有應用,尤其是在教育領域,其應用非常廣泛。
1.計算機信息檢索技術的發(fā)展研究
通過對計算機信息檢索系統(tǒng)發(fā)展歷程進行分析,發(fā)現(xiàn)其發(fā)展過程可分為3個時期:
、1971年之前的信息檢索系統(tǒng)。
在這個時期,信息檢索主要采用的是一些傳統(tǒng)的批處理檢索方式,這種方式數(shù)據(jù)存儲和數(shù)據(jù)通信能力不高。
、谶@個時期的.標志性事件是1971年之后的聯(lián)機情報檢索系統(tǒng)。這個時期,信息檢索的主要特征是可以通過聯(lián)機對數(shù)據(jù)庫進行管理。
雖然數(shù)據(jù)庫聯(lián)機檢索功能比較完善,但是其數(shù)據(jù)通信能力很一般。
、圻@一時期的標志是IT的出現(xiàn)。在IT出現(xiàn)之后,系統(tǒng)一般使用的是分布式的網(wǎng)絡化管理。信息資源不僅具有數(shù)字表達的形式,還有多媒體的形式,規(guī)范化和結(jié)構(gòu)化難度較大,內(nèi)容特征抽取比較煩瑣,并且其對用戶界面要求比較高。
計算機信息檢索技術的這些特點,使信息處理的模式出現(xiàn)了巨大的變革。
信息結(jié)構(gòu)從結(jié)構(gòu)化到非結(jié)構(gòu)化,系統(tǒng)功能從單純信息檢索到綜合信息管理和服務等,這些變革促進了信息檢索技術的進一步發(fā)展,且能夠滿足更多用戶對信息利用的需要。就目前情況來看,計算機信息檢索技術主要發(fā)展方向有2個:
①傳統(tǒng)信息檢索向全文文本、多媒體、多載體、多原理等新型信息檢索的發(fā)展;②信息資源的網(wǎng)絡化和分布化。在第一個發(fā)展方向中,信息檢索的方式新型化突出,能夠?qū)崿F(xiàn)自動抽詞、自動檢索和數(shù)據(jù)挖掘等大量的新功能,能夠使管理和組織信息的能力得到提升;在第二個發(fā)展方向中,信息資源主要是集中于“廣度”上發(fā)展,使資源的檢索范圍更加廣闊。
2.計算機信息檢索應用中的問題及對策
信息檢索,英文譯為“InformationRetrieval”。通過信息檢索,能夠?qū)崿F(xiàn)信息的存儲和組織、存取。信息檢索的關鍵是文本信息的索引和檢索。在信息檢索的發(fā)展歷程中,我們了解到其經(jīng)歷了多個發(fā)展階段,發(fā)展的趨勢是越來越智能化。在科學技術飛速發(fā)展的今天,信息檢索的對象也越來越多,不僅包括文獻和數(shù)據(jù)等文本信息,還包括圖形圖像、聲音和視頻等媒體信息,這些都是信息檢索研究的范疇。現(xiàn)在,信息檢索實現(xiàn)了從網(wǎng)絡化到智能化的發(fā)展,信息檢索的對象從以前的封閉到現(xiàn)在的開放,從以前的穩(wěn)定、一致到現(xiàn)在的動態(tài)和分布廣泛,都是一大進步。當互聯(lián)網(wǎng)越來越普及時,我們需要面對的信息資源的數(shù)量越來越多,如果想要在最短的時間內(nèi)獲得自己所需的信息,就會給計算機信息檢索帶來巨大的困難。但隨著技術的發(fā)展,這絕對是可以實現(xiàn)的。圖1所示為智能信息檢索形式的框架圖。
2.1 檢索中存在的問題
2.1.1 語言的問題
目前,在很多計算機的信息檢索過程中,由于使用的是自然語言標引和檢索,會出現(xiàn)查詢不準確的現(xiàn)象。尤其是在互聯(lián)網(wǎng)信息時代,檢索需求逐漸難以滿足人們?nèi)找嬖鲩L的信息檢索需求。
2.1.2內(nèi)容的問題
當前,網(wǎng)絡信息資源變得越來越豐富,檢索的內(nèi)容是否準確,能不能展現(xiàn)查詢的網(wǎng)絡信息資源,這是一個問題。我們在對信息檢索的時候,檢索內(nèi)容不符合自己要求的情況很普遍。所以,為了增加檢索量,同時保證查詢方式的單一性,就需要做很多工作。
2.1.3對象的問題
在信息檢索的過程中,不同人的信息檢索需求是有差異的。怎么對這些信息檢索需求進行分類,從而使用戶的使用個性化凸顯,并且還能夠確保準確性,這些都是需要改進的對象。
2.2檢索中存在問題的相應對策
2.2.1語言智能化
所謂的“語言智能化”,也就是當我們通過自然語言向信息檢索系統(tǒng)輸入關鍵詞之后,可檢索處理和歧義分析,在知識層面或者說概念層面上輔助查詢,通過系統(tǒng)給我們的一些智能化提示,幫助我們獲得效果最好的檢索結(jié)果。
2.2.2內(nèi)容具體化
在信息檢索系統(tǒng)中,需要使內(nèi)容分析的能力得到提升。
在這個過程中,應當對與檢索內(nèi)容沒有關系的信息進行篩除,這樣不僅可以使標題和全文成為檢索點,還可以通過聲音、圖像等進行檢索。
2.2.3技術智能化
現(xiàn)在,我國已經(jīng)出現(xiàn)了一些智能化的檢索技術,不僅包括自動標引、自動文摘技術,還包括自動跟蹤、自動漫游等智能化技術。這些檢索技術正在逐漸得以改善和優(yōu)化。近年來,“智能瀏覽器”和“知識共享智能體”等概念已被提了出來。
3結(jié)束語
目前,信息檢索技術的發(fā)展方向是多功能化和智能化。當信息檢索技術在飛速發(fā)展時,傳統(tǒng)的信息獲取方式發(fā)生了巨大的改變。作為21世紀的人們,只有掌握現(xiàn)代信息技術,掌握信息檢索技術,才能跟上社會發(fā)展的步伐。
【計算機的現(xiàn)代信息檢索技術進展綜述論文】相關文章: