亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

網絡信息資源的組織原則研究--對DC元數據的探討

時間:2023-03-02 17:16:14 MBA畢業(yè)論文 我要投稿
  • 相關推薦

網絡信息資源的組織原則研究--對DC元數據的探討

引言
  
  現在人們已經進入網絡時代,人們查詢信息的手段越來越趨向于網絡化,然而網絡信息的提供者只注重信息的內容,而忽視了網絡信息資源的描述問題。這使得搜索引擎無法提取網絡信息資源的核心內容,從而導致查全率和查準率低。一種現象隨之產生,即在互聯網上總能找到(甚至只能找到)不需要的東西。網絡信息資源被準確而合理的描述是其被有效利用的前提和基礎,尤其對龐大的網上資源而言。因此,只有對網上的信息資源進行整體上的有效組織、管理和個體上的充分揭示和描述,才能從根本上解決查找、利用上的困難,提高查全率和查準率。但是,網上的信息資源不同于傳統(tǒng)的文獻資源的各種特點,要求創(chuàng)立有別于傳統(tǒng)書目著錄組織方式的新工具——元數據,就在這一背景下產生了。
  元數據,即關于數據的數據,用來描述網絡信息資源、加強對網上信息資源的組織和利用的網絡數據集合。而都柏林核心元數據集(Dublin Core Element Set,簡稱DC)是其中發(fā)展比較成熟而又比較成功的一種元數據。DC 元數據計劃的創(chuàng)建,是通過網絡信息資源的提供者對資源屬性信息的描述,并對其內容進行編目、定位,來幫助人們盡快地在網上發(fā)現所需要的有效信息資源。因此,DC 元數據資源描述方案又稱為網上資源的編目。
  
  1 DC 元數據的發(fā)展和規(guī)范
  
  1995 年3 月由OCLC ( Online Computer Library Center)和NCSC(National Center for SuperComputing Application)在美國俄亥俄州的都柏林鎮(zhèn)聯合召開了第一屆DC 元數據研討會,目的是尋求一套見解有彈性、非專業(yè)圖書館人員也可輕易掌握和使用的信息資源著錄格式,以提高網絡信息資源的開發(fā)利用率。會議結果產生了13 個元數據項,因為開會地點在柏林,因此成為柏林核心集,簡稱DC。1995 年至今,OCLC 與各有關機構聯合舉行了8 次DC 研討會,每一次研討會都推出一些具體的研究成果,1996 年9 月24 日~25 日,第三屆元數據研討會將原有的13 個元數據項擴充為15 個,1999 年12 月22 日,經過第七次會議討論,形成了DC 修飾詞1.0 工作方案,經過幾年的研究探討,DC 被譯成25 種語言,并被許多國家納入國家標準中,成為描述電子信息的一個部分。因此DC 的影響正逐步擴大,有望在不久的將來成為各國都能接受的國際標準[1]。
  DC 是在網絡環(huán)境中描述文件類對象所需要的最小元素集。其中15 個元數據項可以分為[2]:
 。1)Title:標題項,由資源作者或出版者給出的被描述資源的名稱。
 。2)Subject:主題詞或關鍵詞項,一般是描述資源的主題和內容的關鍵詞或短語。
 。3)Description:描述項,資源的文本描述,包括文獻類對象的文摘或視頻的內容描述。
 。4)Source:來源項,用來唯一標識被描述資源的來源。若當前的資源為其原始形式,來源項元素可以不用。
 。5)Language:語言項,被描述資源內容的描述語言。
 。6)Relation:關聯項,被描述資源與其他資源之間的關系。
 。7)Coverage:時空范圍項,被描述資源空間或時間特性。空間范圍物理區(qū)域,來自規(guī)范詞表的地名或全稱。時間范圍指資源內容,而不是資源產生的時間(由日期Date 元素表示)。時間描述采用與日期Date 相同的格式或者采用規(guī)范列表中的時間范圍描述。
 。8)Creator:作者或者創(chuàng)建者項,對創(chuàng)造資源知識內容負主要責任的個人或機構。
 。9)Publisher:出版者項,負責發(fā)行被描述資源的組織。
 。10)Contributor:其他參與者項,指沒有在Creator 元素中列出的對被描述資源的創(chuàng)作做出了共獻的其他人或組織,其貢獻次于創(chuàng)建者。
  (11)Rights:版權管理項,被描述資源的版權聲明和使用范圍。
  (12) Date:發(fā)布日期項,被描述資源公開發(fā)布的日期。
 。13)Type:類型項,被描述資源屬性的范疇或類型,通常從資源類型列表中選取。
 。14)Format:格式項,被描述資源的數據格式,用于注明需要什么軟件或硬件來顯示和執(zhí)行這一資源。為了提高互操作性,格式值應該從格式列表中選取。
 。15)Identifier:標識項,能夠唯一標識描述資源的字符或數字。
  這簡單的 15 個元素由于具有可延伸性、可選擇性和可重復性等特點,可根據不同行業(yè)的需求對其進行改編,達到描述信息的完整性、可靠性和檢索效率高的目標。從DC 元數據的元素結構及著錄規(guī)則可以看出有如下特點:
 。1)結構簡單。只有15 個基本元素,且根據DC 的可選擇原則,還可進一步簡化著錄項目。
 。2)通俗易懂。非編目人員根據元素的含義易學易會。制作者可根據DC 的標準標引自己的網頁、出版物等,提高標引的質量和效率。
 。3)可擴展性?梢耘c其他元數據如RDF(Resource Description Framework),USMARC等連接使用,以彌補自身的不足,提高DC 在不同元數據系統(tǒng)中的互操作性。
 。4)可選擇性。根據行業(yè)不同,選擇不同的元素進行描述,如對地圖、天體、藝術品、多媒體等的描述,由于它們各有其特點,在描述時可選擇Description(內容描述)、Relation(關聯)項來解決。
 。5)可重復性。解決了多創(chuàng)造者、多版本、多語種等的著錄問題。如一個主頁是由多部門協作完成和維護,或由幾個語種揭示,DC 通過它的可重復性即可解決。
 。6)可修飾性。根據對不同資源信息描述的需求,對元素可修飾。如對動態(tài)的網頁進行描述時,DC 可通過創(chuàng)作時間、修改時間、有效時間等修飾性來解決。
  (7)信息描述的靈活性。既可用規(guī)范化中的規(guī)范化詞標引,也可用關鍵詞標引。
  在實際應用中,僅僅依靠這15 個基本元素的描述能力是有限的,因而必須加以限定和進行若干子元素的規(guī)范描述。有關DC 限定詞及子元素的定義目前正在發(fā)展之中,在1997年3 月的第四次DC 研討會上確定了DC 附加的三個限定詞:模式體系(Scheme)、語種描述(Lang)、屬性類(Type)。
 。1)Scheme 模式體系:用來指明元素值得選取遵從已有的或正在討論中的某個體系結構中的合法值,如分類發(fā)表、主題詞或各類代碼值。如一個Subject 字段應從LCSH(Libraryof Congress Subject Heading)中取值。Scheme 限定詞對應用軟件或應用人員能提供一個處理線索,以使被限定元素能更好的使用。
 。2)Lang 語種描述:指明元素值描述字段所使用的語種,而不是資源本身的語言。由于網絡上的多語種問題越來越突出,這個限定詞變得越來越重要。迄今為止,英語被假定為網上的語言,但這一現象正在改變,確定資源本身和資源描述的語言問題變得極為重要。
 。3)Type 屬性類型:指明目前元素的值是元素何種類型的值,一般以子元素限定的方式來描述。
  
  2 DC 元數據的描述對象和描述原則
  
  DC 元數據把它描述的對象稱為“資源”,這種資源既可能是物質的實體也可能是抽象的實體,比如:當描述創(chuàng)建者時,DC 就是一個人、或者一個團體、或者一個服務機構——這就是物質實體;當描述日期時,DC 就是時間上的一個點(或一個段)——這就使一個抽象的實體;當描述覆蓋范圍時,DC 就是一個地區(qū)或國家——這就使一個物質實體。當描述主題時,DC 可能是一個抽象實體的抽象概念,也可能是對一個物質實體的主題或人等等,所有這些描述對象都稱作“資源”?梢姡珼C 元數據描述的對象——資源指任何可以標識的東西[3]。
  一條元數據可以由一個或多個關于一個或多個資源的元數據描述組成,這個原則超越了以前的簡單DC 紀錄只能有一條描述的限定,一條DC 元數據就是一個元數據描述集合,并可以采用任何一種編碼語言來陳述,比如XHTML meta tags, XML, rdf/XML 等。這個原則同時規(guī)定每一個DC 元數據描述只能描述一個資源,也就是所謂“1:1”原則(one-to-oneprinciple)。
  
  3 從 MARC 到DC
  
  3.1 MARC 的產生
  MARC 是圖書館為適應計算機技術在圖書館編目的運用而產生的,圖書館歷來依賴目錄提供館藏信息服務,圖書館目錄與圖書館是分不開的,最早的圖書館目錄是書本式的目錄,這些目錄只能提供簡單的少量檢索點,而且因為是手工操作,出版時間長,更新不容易,有很大的局限性。因此,當計算機開始應用后,MARC 格式應運而生。MARC 是MachineReadable Catalogue,稱為機讀目錄,可以把人們能夠識別的書目信息,使計算機也能識別,計算機同時將信息反饋給人類,成為人類所需要的各種書目產品[4]。
  
  3.2 MARC 的局限性
 。1)這種方式只是用于圖書館,而且工作很繁瑣。MARC 字段非常復雜,即使現在大部分圖書館都是進行聯機編目工作,也要花費很多時間來添加本館自定義字段。
 。2)編目人員需要經過專門的訓練及長期的實踐,對編目人員的素質要求很高,不僅要懂得一兩門外語,而且要對計算機操作非常熟悉,編目工作是一項繁重又耗腦力的工作,必須是嚴謹的人員才能勝任這項工作。
 。3)MARC 的著錄需要在專門的軟件系統(tǒng)環(huán)境中使用,不適應現在的互聯網環(huán)境。它適用于完整的、靜止的信息內容的處理。但是,現在的信息資源不僅僅限于書本式的信息,網絡資源發(fā)展迅速,動態(tài)的多媒體信息資源日益增加,如果這些資源沒有很好的進行組織和整理,它就會泛濫成災,形成信息污染[5]。
 。4)MARC 的修訂程序相當復雜,而且修改的進程非常緩慢。
  
  3.3 DC 元數據
  雖然 MARC 正在不斷地發(fā)展,它進行的網絡信息資源編目是受控編目,編目數據質量較高,但是編目速度慢,成本高。面對這個問題,許多信息技術界的研究者設計了元數據格式來描述電子信息資源。盡管MARC 也是元數據的一種格式,但是目前人們研究的較多的是偏重于電子資源和網絡資源的應用。DC 元數據就是針對網絡信息資源組織與整理問題而由圖書館和信息界提出來的解決方案之一[6]。
  
  4 DC 元數據的發(fā)展趨勢
  
  4.1 對網絡信息資源的影響
  4.1.1 網絡信息資源的特點
  由 DC 元數據的描述原則可以分析得出網絡信息資源的特點:包羅萬象,分布廣泛,數量大,類型多,動態(tài)快速增加,可利用性和可靠性不斷地變化,信息源分散無序。這些特點也決定了網絡信息資源更迭和消亡都無法預測,同時,由于網絡上存在的大量信息垃圾、信息病毒、信息孤島,使得很多網絡信息資源本身并不具備利用的環(huán)境和價值。這種種特點使得傳統(tǒng)的文獻組織方式和檢索手段幾乎無能為力。  
  4.1.2 未來網絡信息資源的組織原則
  網絡的出現改變了人們交流的方式,也改變了傳統(tǒng)的文獻類型,網絡信息資源以一種迅猛發(fā)展的態(tài)勢沖擊著我們組織、描述文獻資源的方式和方法,成為了一種無法忽視和回避,又難以解決的問題。在網絡時代,要解決檢索網絡信息資源的種種障礙,除了在技術上不斷發(fā)展以外,還應從源頭上去規(guī)范網絡信息,由信息提供者和信息機構對網絡信息資源做深層次的加工與開發(fā)工作,使一般的網絡信息檢索者能夠在這種重新開發(fā)的階梯上找到自己真正想要的信息,達到檢索的目的。因此,在組織網絡信息資源時應堅持以下原則:
  (1)信息共享
  網絡世界沒有了時空的間隔,如果還按照傳統(tǒng)的工作模式,各自為陣、各自收集、加工、處理、提供檢索,那樣既不利于收集也不利于利用。因為沒有任何一個信息機構有實力可以收集完整所有的信息資源。多個信息機構聯合不失為一個實現信息共享的好辦法。
 。2)提供遠程服務
  目前,各個學科的發(fā)展都非常迅速,信息資源及信息資源的創(chuàng)建者和使用者構成了一個龐大的、不斷發(fā)展變化且極具活力的群體,信息機構要更好地擔負起資源組織者的角色,就必須及時吸收這些專業(yè)的成果,才能夠使經過整合后的信息資源具有更高的使用價值,否則即使擁有再先進的技術和手段,也無助于提高信息機構在網絡信息資源流動鏈中的作用。而組織信息的目的在于提供服務,網絡的發(fā)展已成為不可阻擋的趨勢,因此未來信息機構在服務上更多的以提供遠程服務為目標,提供盡可能完備的檢索途徑,方便人們通過各種計算機終端進行檢索。
 。3)適合用戶的檢索習慣
  信息資源的組織是為了更好的利用,然而DC 元數據系統(tǒng)還不很完善,人們還習慣于使用MARC 格式進行標引的情況下,應充分挖掘MARC 標引系統(tǒng)的潛力以適應網絡信息資源檢索的需要。近年來,MARC 格式一直處于不斷的升級過程中,特別增設字段為電子文檔建立超鏈接,并對相關字段進行了個別調整,擴充了原有字段的內涵。MARC 還特別增加了856 字段,即電子地址檢索方式字段,856 字段著錄網絡信息資源的獲取方式及獲取的必要信息,通過它可實現書目紀錄與網絡信息資源的鏈接。增加了856 字段后,使編目工作進入了一個新的階段,其超文本的鏈接方式,擴展了機讀目錄的功能,為讀者檢索信息資源提供了更為快捷、高效的途徑。
  
  4.2 MARC 與DC 并存是圖書館信息資源組織的發(fā)展趨勢
  4.2.1 復合圖書館是未來圖書館的新模式
  目前大多數圖書館都存有數以萬計的MARC 格式的書目數據,在當前以及可以遇見的將來,傳統(tǒng)的印刷型文獻仍然是圖書館信息資源的重要組成部分和讀者服務的重要物質基礎。紙質文獻出版業(yè)將在相當長的時期內與數字化信息的出版發(fā)布共同繁榮。DC 元數據格式雖然發(fā)展迅速,但尚未形成國際公認的標準,不同的元數據有其發(fā)揮作用的不同領域。MARC 與 DC 的并存將是今后一段時期內圖書館信息資源組織的發(fā)展趨勢。
  4.2.2 實現 MARC 與DC 的相互轉換
  對 MARC 和 DC 兩種元數據格式的探討,目的是通過研究,找出一個在應用上最能發(fā)揮效益的資源處理方法。目前有關DC 元數據格式向標準 MARC 格式轉化的理論已取得很大的突破,這使得 MARC 與DC 間相互轉換成為可能。從理論上講,從DC 到 MARC的格式轉換并不是件難事,任何一種結構化的數據都能轉換成另一種數據結構,但是這種轉換不可避免地會造成一定程度的數據損失。目前許多學者在研究 DC 格式與 USMARC 格式的轉換,編制了一些詞表反映二者之間的關系,U N I M A R C 和 U S M A R C 與 D C間映射已有成果面世,并有系統(tǒng)投入實際運作之中[7]。
  
  5 結語
  
  隨著 Internet 的發(fā)展以及網絡資源和技術越來越廣泛的應用,數字圖書館的數量在網上不斷增多正如紙介質圖書館中的圖書、期刊等收藏需要編目一樣,數字圖書館的數字收藏(digital collection)同樣需要著錄和標引,以便用戶能夠準確快速地找到自己所需的信息。DC元數據是解決網絡信息資源無序化問題的一次有效的嘗試和研究,特別是由OCLC 牽頭組織則意義更是重大而深遠。網絡信息資源的組織與整理工作已不是單由圖書館界就能完成的,更不是單純地利用圖書館傳統(tǒng)的編目理論就能勝任的。DC 元數據是在充分吸收了圖書館界所具有的編目、分類、文摘等經驗的基礎上,同時積極利用了計算機、網絡界的自動搜索、編目、索引、檢索等研究理論與成果所發(fā)展起來的,是當今國際圖書館界和網絡界的研究熱點之一。

網絡信息資源的組織原則研究--對DC元數據的探討

中國碩士論文網提供大量免費工商管理碩士論文,如有業(yè)務需求請咨詢網站客服人員!
  
  [參考文獻] (References)
  [1] 劉方山,孫鴻燕.DC 元數據的發(fā)展及應用[J].現代情報.2004,(12):117-119.
  [2] 郝亞玲.DC 元數據與網絡信息資源的描述[J].情報科學.2002,20(10):1069-1074.
  [3] 薛建萍.從DC 元數據談網絡信息資源的組織規(guī)則[J].圖書館論壇.2005,25(4):142-145.
  [4] 董紅霞.從URMARC 到DC 元數據[J].圖書館學研究.2002,(6):60-63.
  [5] 任瑞娟,濮德敏,苗軍民,米佳.基于XML/RDF 的DC 元數據描述技術[J].情報雜志.2002,(9):25-26.
  [6] 毛燕梅,張秋萍,李麗華.網絡信息資源的組織與DC 元數據[J].情報雜志.2002,(1):27-28.
  [7] 周建清.MARC 與DC 的對比研究[J].中國科技信息.2006,(8):207-208.
  [8] 吳建中.DC 元數據[M].上海:上海科學技術文獻出版社.2000.
  [9] 張桂榮.網絡資源組織與管理的新思路——DC 元數據及其與MARC 格式的對比與轉換[J].內蒙古科技與經濟.2007,(1):70-74.
  [10] 嚴海帆.DC 元數據在圖書館中的應用[J].現代圖書情報技術.2003.
  [11] 魏文暉.DC 元數據在特種地方文獻著錄中的應用[J].圖書館論壇.2004,24(2):126-128.
  [12] 徐佳寧.DC 元數據在網絡資源學科導航體系中的應用研究[J].網絡縱橫.2002,(1):85-87.
  [13] 倪娟.MODS 元數據的新發(fā)展與應用[J].農業(yè)圖書情報學刊.2007,19(6):165-167.
  [14] 王芳,王小麗.基于OAI 協議的數字檔案館元數據互操作問題研究[J].現代圖書情報技術.2007,(3):18-24.
  [15] 陳曉波.數字圖書館的編目規(guī)則[J].圖書情報工作.2002,(7):124-125.
  [16] 江匯泉.DC 元數據圖書館應用中的編碼實現(一)——限定性DC 的編碼實現[J].圖書館雜志.2006,(3):57-61.
  [17] 江匯泉.DC 元數據圖書館應用中的編碼實現(二)——限定性DC 的編碼實現[J].圖書館雜志.2006,(4):50-53.
  [18] 劉圓圓,劉軍華.有關CNMARC 與DC 元數據之間的對應轉換[J].圖書與情報.2007,(3):103-106.
  [19] 王玉潔.MARC 格式在網絡信息資源組織中的應用探討[J].江西圖書館學刊.2012,39(4):51-53.
  [20] 張軍禮.關于網絡信息資源組織與服務趨勢的探討[J].科技情報開發(fā)與經濟.2006,16(16):8-9.
  [21] 高凡.基于知識組織體系的網絡信息資源組織模式初探[J].圖書情報工作.2006,50(5):53-56.
  [22] 盧共平.面向用戶的網絡信息資源組織與管理[J].情報探索.2007,(5):48-50.
  [23] 尹峻.淺論高校圖書館的網絡信息資源組織[J].情報探索.2012,(4):63-64.
  [24] 顏達紅.網絡信息資源組織的元數據標準研究分析[J].中共福建省黨校學報.2004,(12):48-50.
  [25] 李紅霞.網絡信息資源組織研究述評[J].情報雜志.2006,(9):11-13.
  [26] 司莉,彭雯章,賀劍峰.網絡信息資源組織與目錄學的創(chuàng)新和發(fā)展[J].圖書情報工作.2001,(9):21-24.

【網絡信息資源的組織原則研究--對DC元數據的探討】相關文章:

國外信息資源共享系統(tǒng)績效評估研究評析及啟示06-13

光纖通信工程技術研究探討05-03

大數據時代網絡信息安全探析論文04-22

PDF網元防“濫用”功能的分析和同類網元可重用性的研究05-11

網絡經濟數據挖掘在工商管理中的應用論文07-29

探討公共管理定性研究方法教學中的問題意識培養(yǎng)05-02

光電效應的研究歷史和光電效應法測量的探討論文04-23

信息資源管理論文:07-31

科技論文網絡發(fā)表與共享的版權問題探討(通用8篇)10-13

DWDM光網絡網元管理信息模型的創(chuàng)建過程05-11