- 相關推薦
中國地方志(舊方志)資源庫的設計與展望
一. 中國地方志(舊方志)資源庫建庫緣起
地方志,也稱為“方志”,“志”就是“記”,是記錄、記載、記述的意思。顧名思義,“地方志”就是一個地方從古到今,從自然到社會方方面面情況的總覽。中國國家圖書館特色館藏,就包括1949年以前編纂的地方志(簡稱舊方志),不論質量還是數量均居海內外各藏書單位之首。對于先人留給我們的這一寶貴文化遺產,我們有責任保護、利用和推介。采用數字化的形式,整理、加工舊方志資源,是實現這一目標的有效途徑。
方志資源庫采用什么樣的結構模式,是建庫之初首先遇到的問題。國家圖書館資源庫的發(fā)展歷程伴隨著圖書館發(fā)展的腳步,也經歷了從傳統(tǒng)館藏資源———館藏資源數字化———數字圖書館資源庫發(fā)展三部曲。我館現在已有的數據庫,大多是將傳統(tǒng)館藏經過數字化處理生成的。方志資源庫如采用原有的思路,即把志書平行地轉換成數字化內容,那我們最終實現的僅是把紙質志書轉換成電子志書。就載體形態(tài)來說,志書數字化使其發(fā)生了質的飛躍,但就內容而言,它僅是形式的變化。而當今信息網絡技術的發(fā)展,信息網絡資源的迅速擴大,越來越影響和改變著人們選擇信息、使用信息的行為和方式。人們對知識的需求已不滿足于以文獻為單位,而是希望通過簡單、快捷的方式檢索到所需文獻中的具體事件、數據、結論等知識單元,同時將所需知識單元和與其相關的信息進行整合,在最短的時間內獲取最大的信息量。為了最大限度地開發(fā)方志資源,多角度、多側面地深入揭示方志內涵,依據信息時代人們的信息需求特點和信息網絡技術發(fā)展所提供的技術保證,達到知識創(chuàng)新的目標,因此,方志資源庫的建庫模式應定位在數字化信息資源的重組與多媒體展示的平臺上。在此,先論述圖書館數字化和數字圖書館之間的聯(lián)系與區(qū)別以及其他幾個基本概念。
二. 方志資源庫的幾個基本概念
1.圖書館數字化:從字面上看,傳統(tǒng)圖書館館藏經過數字化技術處理和加工,為用戶提供服務,這個過程就叫圖書館數字化。這方面的工作我們在十幾年前就開始了。例如:八十年代后期我們就在M150機上編制“國家書目”,九十年代前期我們開始編制的地方志書目數據庫及以后編輯的地方志人物傳記索引數據庫,直到目前我們還在做的“古籍書目”數據庫以及我們將要建的地方志資源庫中的全文影像庫等都屬于圖書館資源數字化的范疇。其工作對象和結果僅限于傳統(tǒng)資源本身,或者說它只是一種載體形式的轉換(由紙制品轉化成電子出版物)。
2.數字圖書館:數字圖書館是把傳統(tǒng)圖書館的功能由信息的查詢和圖書資料的借閱擴展到知識服務的新階段。其中兩個關鍵的技術是信息資源的整合和知識的創(chuàng)新。前者就是要依據統(tǒng)一標準,將相互關聯(lián)的信息資源重新組合并進行科學的分類和標引,強調重組后的信息資源的有序化和關聯(lián)性,而后者突出的是知識的增值與創(chuàng)新。如果把前一過程比做物理學中物質所發(fā)生的“物理變化”的話,則知識創(chuàng)新所引發(fā)的就是物質的“化學變化”。即通過分解、重組,形成了新的信息知識網絡,較原來的傳統(tǒng)信息資源在功能、用途等方面都發(fā)生了質的變化。對此許多專家、學者都有嚴謹的描述和解釋,在這里就不一一贅述了。通俗一點兒說,它有以下幾個特征。
(1) 信息資源數字化:數字圖書館內的所有信息資源都經過數字化處理。
(2)服務手段網絡化:它借助網絡技術、計算機技術和現代通信技術傳播知識(例如互聯(lián)網、衛(wèi)星傳遞等),突破了館舍的時空局限,用戶可以隨時隨地得到所需信息,是不局限于圖書館場館的。(3)資源實體虛擬化:它是基于互聯(lián)網的多維知識網絡,突破了傳統(tǒng)載體的限制,延伸、拓展了傳統(tǒng)圖書館館藏外延。它不僅提供傳統(tǒng)的基于印刷介質的服務,還可通過跨庫檢索,對數字信息進行重新組合,提供重組后的信息服務。因而,它是對館藏資源的再開發(fā)。例如:“昭陵”和“玄武門之變”分別是景觀和事件對象資源,它們都與“李世民”相關聯(lián),分別收藏在景觀庫和事件庫中,但重組在一個頁面里,以視頻、音頻、圖像等多媒體手段展現在用戶面前。
(4)檢索方式良序化:依據統(tǒng)一規(guī)范即統(tǒng)一的元數據標準,對數字信息資源進行科學的分類和標引,達到對數字信息處理的良序化(相當于書刊采訪到館后先編目),保證了分散的數字資源經重組后提供給用戶精確的檢索,檢索效率很高。這一點有別于一般的網絡搜索引擎。網絡搜索引擎是通過網絡機器人自動搜索并生成相關的著錄信息,存入數據庫中供檢索之用,其檢索系統(tǒng)由于采用自動標引,檢索后的網上信息還需要人工識別處理,檢索效率太低。
(5)信息利用共享化:由于數字化圖書館內的信息資源的加工、發(fā)布都依據統(tǒng)一的標準和規(guī)范,所以它可以最大限度地實現信息資源的共建共享。
3.元數據:傳統(tǒng)圖書館流程中重要的一步工作就是圖書、期刊的編目,便于用戶查找。數字圖書館中的數字資源同樣需要編目。元數據就是為了滿足數字資源的編目需要應運而生的,它是數字圖書館編目的新規(guī)則,是一種有效的信息資源組織和管理的工具。它具有描述性、結構性、管理性。就描述性而言,我們以前用的卡片目錄,現在用的MARC格式都屬于元數據的范疇。但元數據又比卡片目錄、MARC格式具有更強大的描述能力,而元數據所具有的結構性(揭示資源的內部結構)和管理性(規(guī)定運行環(huán)境、數字版本、收費情況等)使它能更全面的反映了數字文檔的各個方面,為數字資源的保存和利用提供了更有效的工具。
4.資源庫:經過專業(yè)人員組織、加工、整合而成的符合數字圖書館規(guī)范的資源的集合。它具有數字圖書館的基本特征。資源庫是完全網絡化的,具有強大的檢索平臺和豐富的檢索途徑。一般資源庫都包括了文字、圖片、視頻、音頻等豐富的多媒體資料,對各種媒體都具有良好的支持。各種專題知識資源庫組成了數字圖書館的物質基礎。資源庫的建設不可能一蹴而就,它要隨著時間的推移、知識的不斷更新,動態(tài)地更新內容。由于資源庫的信息資源使用統(tǒng)一的加工、發(fā)布標準(例如元數據標準),可吸收各信息資源優(yōu)勢單位參與共建,形成系列知識庫群,使信息資源最大限度地被公眾所共享。
三. 方志資源庫的結構和內容
根據方志內容特點和用戶需求,我們的方志資源庫設計成由一個全文影像庫,一個OCR數據庫和八個專題子庫組成。
用戶既可通過全文檢索進入全文影像庫或OCR庫,也可通過“跨庫檢索”、“字段聯(lián)接”和“詞語置標標引”等方式進入各個專題子庫,再通過8個專題子庫跨庫進入全文影像庫或OCR庫,該方法實現了不同專題庫中的字段及字段中的內容的鏈接。
1 全文影像庫:就是將國圖分館所藏的1949年前編纂刊行約6000余種地方志書進行全文掃描,即志書的數字化處理,全文影像庫并沒有改變原有的信息組織,它只是對紙制志書的載體形式進行了一次平面轉移,即將紙制舊志通過掃描處
【中國地方志(舊方志)資源庫的設計與展望】相關文章:
中國地方志的史料價值及其利用05-24
談談為地方志編纂服務的二次文獻工作03-18
方志傳記資料索引數據庫的設計與實現03-19
2006年全球及中國經濟展望03-19
20世紀中國哲學的回顧與展望03-18
新中國商業(yè)改革的回顧與展望03-19
淺談方志類論文寫作與學術規(guī)范12-08
淺談中國服飾設計的演變03-16
談中國現代視覺設計需求03-28