- 相關(guān)推薦
大數(shù)據(jù)環(huán)境下關(guān)于情報學(xué)發(fā)展的思考
摘要:文章從情報學(xué)學(xué)科體系的角度出發(fā),從理論情報學(xué)、應(yīng)用情報學(xué)、技術(shù)情報學(xué)、管理情報學(xué)四個方面展開思考,分析了大數(shù)據(jù)環(huán)境下情報學(xué)的發(fā)展趨勢。
關(guān)鍵詞:大數(shù)據(jù)時代 ;情報學(xué);學(xué)科發(fā)展 ;大數(shù)據(jù)
大數(shù)據(jù)趨勢產(chǎn)生的深層原因是海量數(shù)據(jù)的存在和越來越多的事物是以數(shù)據(jù)形式存在的。隨著計算機(jī)技術(shù)全面融入社會生活,我們的工作、生活,甚至國家經(jīng)濟(jì)的發(fā)展都受到了大數(shù)據(jù)的影響,現(xiàn)在人們已經(jīng)意識到了大數(shù)據(jù)的重要性。在大數(shù)據(jù)時代因素的推動下,情報學(xué)的理論研究、研究方法以及情報學(xué)技術(shù)等都將做出新的改變,趨勢預(yù)測性情報的分量將繼續(xù)加重,情報產(chǎn)生中的跨界合作將增強(qiáng),但現(xiàn)在我們對大數(shù)據(jù)環(huán)境下情報學(xué)的發(fā)展研究還遠(yuǎn)遠(yuǎn)不夠。
一、大數(shù)據(jù)的內(nèi)涵及基本特征
1.1 大數(shù)據(jù)的內(nèi)涵
按照維基百科的定義:大數(shù)據(jù)是指所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息集合。研究機(jī)構(gòu)Gartner的定義:大數(shù)據(jù)是指需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。麥肯錫的定義:大數(shù)據(jù)是指無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進(jìn)行采集、存儲、管理和分析的數(shù)據(jù)集合。
現(xiàn)在越來越多的領(lǐng)域開始關(guān)注和研究大數(shù)據(jù),這是因為大數(shù)據(jù)涉及不同的學(xué)科領(lǐng)域,人們從不同的角度、不同的科學(xué)領(lǐng)域出發(fā),對大數(shù)據(jù)的定義進(jìn)行了詮釋。到目前為止,大數(shù)據(jù)尚未形成統(tǒng)一明確的定義。筆者認(rèn)為,大數(shù)據(jù)的“大”不單單是指數(shù)據(jù)的量很大,還指數(shù)據(jù)無時無刻不在急劇增長,數(shù)據(jù)的形式紛繁多樣,另外,數(shù)據(jù)的覆蓋面很廣泛,數(shù)據(jù)之間交互頻繁,數(shù)據(jù)之間相關(guān)關(guān)系復(fù)雜,這些都是大數(shù)據(jù)“大”的表現(xiàn)。
1.2 大數(shù)據(jù)的基本特征
業(yè)界有人將大數(shù)據(jù)的特征歸納為“4V”,即數(shù)據(jù)種類繁多(Variety),數(shù)據(jù)體量巨大(Volume),數(shù)據(jù)生成和處理速度快或理解為流動速度快(Velocity),至于第四個“V”,有人的理解是價值密度低或者理解為數(shù)據(jù)的價值日益突現(xiàn)(Value),也有人認(rèn)為大數(shù)據(jù)具有真實性(Veracity)的特征。筆者更贊同的是Volume、Velocity、Variety、Value四個特征。雖然業(yè)界也有很多人贊同上述四個特征,但是對大數(shù)據(jù)特征含義的理解卻不盡相同。筆者認(rèn)為,大數(shù)據(jù)具有以下特征。
1.2.1 數(shù)據(jù)的體量巨大。據(jù)麥肯錫全球研究院(MGI)估計,2010年,企業(yè)的磁盤中存儲了超過7EB字節(jié)的新數(shù)據(jù);用戶在個人PC機(jī)和筆記本等設(shè)備上的新數(shù)據(jù)存儲量也超過了6EB字節(jié)。2011年全球的數(shù)據(jù)量達(dá)到18Z。體量巨大是大數(shù)據(jù)的首要特征。
1.2.2 數(shù)據(jù)生成速度快,并且數(shù)據(jù)實時變化迅速。在這個信息化的時代,數(shù)據(jù)時刻在產(chǎn)生,比如銀行交易、淘寶購物、購買車票、打電話、檢索資料等,這些行為都可以以數(shù)據(jù)的形式呈現(xiàn),而且數(shù)據(jù)呈指數(shù)級增長。此外,數(shù)據(jù)是實時變化的,人們對數(shù)據(jù)的處理速度也提出了更高的要求。
1.2.3 數(shù)據(jù)種類的多樣性,F(xiàn)在大數(shù)據(jù)涉及的領(lǐng)域非常廣泛,數(shù)據(jù)的種類也趨于多樣化,數(shù)據(jù)會以數(shù)據(jù)文本、數(shù)據(jù)庫、圖片、動畫、音頻、視頻,甚至是以日志文件、網(wǎng)頁、電子郵件等多種形式呈現(xiàn)在人們的面前。隨著信息技術(shù)的不斷發(fā)展,新的數(shù)據(jù)來源和數(shù)據(jù)形式也在不斷地出現(xiàn)。
1.2.4 數(shù)據(jù)本身的價值密度低。大數(shù)據(jù)時代,各種數(shù)據(jù)的生產(chǎn)速度非常快,研究員要在冗余的信息中發(fā)現(xiàn)其價值并不容易。
二、大數(shù)據(jù)時代情報學(xué)發(fā)展所面臨的機(jī)遇與挑戰(zhàn)
2.1 大數(shù)據(jù)時代情報學(xué)發(fā)展所面臨的機(jī)遇
2.1.1 為情報學(xué)研究提供豐富的數(shù)據(jù)資源支持。情報學(xué)中的很多研究方法都是建立在大量數(shù)據(jù)的基礎(chǔ)之上,在這個網(wǎng)絡(luò)化和信息化的時代,人們時時刻刻都在以各種各樣的方式生產(chǎn)著不同類型的數(shù)據(jù),如前文提到的圖片、動畫、音頻、視頻、日志文件、網(wǎng)頁、電子郵件。大數(shù)據(jù)時代的到來為情報學(xué)的研究提供了豐富的數(shù)據(jù)資源。
2.1.2 完善情報學(xué)學(xué)科技術(shù)。大數(shù)據(jù)時代將繼續(xù)催生很多新型的產(chǎn)業(yè),基于大數(shù)據(jù)的數(shù)據(jù)信息收集、存儲、處理、分析、挖掘技術(shù)都是這個時代的產(chǎn)物,例如云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、文本挖掘、意見挖掘、中文分詞和NLP自然語言處理、神經(jīng)網(wǎng)絡(luò)算法、網(wǎng)絡(luò)分析SNA、數(shù)據(jù)可視化等。這些技術(shù)也為情報學(xué)的學(xué)科技術(shù)研究打下了基礎(chǔ),甚至很多技術(shù)都可以直接被用到情報學(xué)研究中,如云存儲技術(shù)、云計算技術(shù)等,在大數(shù)據(jù)時代,這些計算機(jī)互聯(lián)網(wǎng)技術(shù)都可以為情報學(xué)研究所用,它們很好地完善了情報學(xué)學(xué)科技術(shù)。
2.1.3 大數(shù)據(jù)將助力情報學(xué)新的研究范式和方法論。在大數(shù)據(jù)時代,人們所面臨的數(shù)據(jù)不僅僅體量巨大、類型多樣化,而且它們還在以驚人的速度生長并發(fā)生著實時的變化,這些都對情報學(xué)的研究方法提出了新的要求,因此對情報學(xué)研究方法而言,唯有創(chuàng)新才有出路。以前,人們通過研究獲得準(zhǔn)確的情報并供人們使用,而在大數(shù)據(jù)時代,情報學(xué)將在研究方法上做出改變:情報學(xué)的研究方法可以轉(zhuǎn)向研究數(shù)據(jù)之間的相關(guān)性,并根據(jù)數(shù)據(jù)之間的相關(guān)性得出預(yù)測性情報,以供人們決策使用。
2.1.4 擴(kuò)展情報學(xué)的學(xué)科研究和應(yīng)用領(lǐng)域。大數(shù)據(jù)時代,在多種因素的影響下,情報學(xué)的研究內(nèi)容和范圍不斷擴(kuò)展。在這個信息化的時代,情報學(xué)的發(fā)展離不開信息技術(shù)和網(wǎng)絡(luò)技術(shù)的支持,情報的獲取、存儲和處理都會涉及與其他學(xué)科的交叉合作。比如,在大數(shù)據(jù)時代,人們的隱私急需得到保護(hù),因此,信息政策和法律法規(guī)必將是社會科學(xué)研究的一個重要方向,這也將是情報學(xué)與其他學(xué)科跨界合作的新領(lǐng)域。
2.2 大數(shù)據(jù)時代情報學(xué)發(fā)展所面臨的挑戰(zhàn)
2.2.1 價值密度低,獲取有效信息難度加大。數(shù)據(jù)信息是情報學(xué)研究的重要基礎(chǔ),但在大數(shù)據(jù)時代,一方面數(shù)據(jù)的體量巨大,要想從中獲取對所研究主題有用的數(shù)據(jù)信息不是一件易事;另一方面數(shù)據(jù)的種類多樣,不僅包括部分結(jié)構(gòu)化數(shù)據(jù),還包括圖片、音頻、視頻等多種形式的非結(jié)構(gòu)化數(shù)據(jù)。此外,在大數(shù)據(jù)時代,數(shù)據(jù)信息是實時變化的,這些都加大了情報工作人員獲取有效信息的難度,這是情報學(xué)發(fā)展中應(yīng)該重視的一點(diǎn)。
2.2.2 情報學(xué)學(xué)科研究技術(shù)有待進(jìn)一步開發(fā)。在這個信息技術(shù)高速發(fā)展的時代,情報學(xué)技術(shù)的發(fā)展形勢不容樂觀。由于情報學(xué)知識結(jié)構(gòu)的限制,情報學(xué)很難培育自己的情報網(wǎng)絡(luò)技術(shù),情報學(xué)很多技術(shù)都是采用拿來主義,把其他領(lǐng)域的技術(shù)直接運(yùn)用到自己的學(xué)科研究中,但是在大數(shù)據(jù)時代,為了保證大數(shù)據(jù)的價值,必須對數(shù)據(jù)進(jìn)行快速有效的處理,而我們現(xiàn)有的情報采集、分析、挖掘、處理等技術(shù)已經(jīng)不再適應(yīng)現(xiàn)在巨量、多樣化、實時變化的大數(shù)據(jù)環(huán)境。
2.2.3 情報學(xué)科呈現(xiàn)泛化發(fā)展趨勢。隨著社會的發(fā)展,情報學(xué)的發(fā)展環(huán)境也在發(fā)生著巨大的變化,情報學(xué)是一門綜合性的學(xué)科,在情報學(xué)的發(fā)展過程中,會出現(xiàn)其研究內(nèi)容與其他學(xué)科交叉的現(xiàn)象。一方面,這種現(xiàn)象使情報學(xué)可以從其他學(xué)科獲取理論、技術(shù)等多方面的支持,在一定程度上促進(jìn)情報學(xué)的學(xué)科發(fā)展;另一方面,在信息和網(wǎng)絡(luò)技術(shù)高速發(fā)展的大數(shù)據(jù)時代,這種與其他學(xué)科的“跨界研究”將會使情報學(xué)的學(xué)科泛化趨勢更加明顯,從而會導(dǎo)致“過界研究”,處理好“跨界研究”和“過界研究”的關(guān)系,將成為文獻(xiàn)信息工作者面臨的一個重要任務(wù)。
2.2.4 數(shù)據(jù)信息的管理問題將是一大挑戰(zhàn)。大數(shù)據(jù)時代,傳統(tǒng)的數(shù)據(jù)管理方式不再適用,在數(shù)據(jù)來源、數(shù)據(jù)處理方式和數(shù)據(jù)思維等方面都會帶來革命性的變化,如果在情報學(xué)研究中對數(shù)據(jù)信息管理不當(dāng),甚至可能帶來情報安全危機(jī),因此數(shù)據(jù)信息的管理問題也將是對情報學(xué)的一大挑戰(zhàn),相應(yīng)的情報道德規(guī)范、情報政策、信息法律法規(guī)等是必要的。此外,反競爭情報的研究分量也將加重。
三、大數(shù)據(jù)環(huán)境下情報學(xué)的發(fā)展展望
情報學(xué)這一學(xué)科的發(fā)展離不開情報學(xué)的相關(guān)理論、應(yīng)用、技術(shù)及情報學(xué)管理這幾方面的內(nèi)容,情報學(xué)學(xué)科體系主要包括理論情報學(xué)、應(yīng)用情報學(xué)、技術(shù)情報學(xué)、管理情報學(xué)四個方面,下面筆者將從情報學(xué)學(xué)科體系角度對大數(shù)據(jù)環(huán)境下情報學(xué)的發(fā)展進(jìn)行探討。
3.1 理論情報學(xué)的發(fā)展
3.1.1 就情報學(xué)內(nèi)涵而言,在大數(shù)據(jù)環(huán)境下,情報學(xué)的內(nèi)涵將更加豐富。一個學(xué)科在發(fā)展過程中往往會受到不同的環(huán)境、技術(shù)等因素的影響,在大數(shù)據(jù)時代,數(shù)據(jù)信息類型呈現(xiàn)出多樣化的特征,情報學(xué)的研究對象也相應(yīng)地從單一的、結(jié)構(gòu)化的文獻(xiàn)信息轉(zhuǎn)向了復(fù)雜多樣的非結(jié)構(gòu)化的數(shù)據(jù),因此,大數(shù)據(jù)將在一定程度上豐富情報學(xué)的內(nèi)涵。
3.1.2 就情報學(xué)方法論而言,情報學(xué)的學(xué)科方法可以充分發(fā)揮大數(shù)據(jù)的優(yōu)勢,發(fā)現(xiàn)和利用數(shù)據(jù)信息的相關(guān)關(guān)系。在大數(shù)據(jù)時代,數(shù)據(jù)信息體量巨大,并且很多數(shù)據(jù)都是以碎片化的形式存在,情報學(xué)可以通過利用數(shù)據(jù)之間的相關(guān)關(guān)系拓展出新的情報學(xué)研究方法。以情報學(xué)研究方法中的文獻(xiàn)計量學(xué)方法為例,很多學(xué)者利用這個方法對某個數(shù)據(jù)庫中某一學(xué)科領(lǐng)域的文章發(fā)表情況或者文章內(nèi)容進(jìn)行統(tǒng)計分析研究,假設(shè)我們把某個數(shù)據(jù)擴(kuò)大到某一學(xué)科領(lǐng)域相關(guān)的所有數(shù)據(jù),或許我們會有新的發(fā)現(xiàn)。
3.1.3 情報學(xué)學(xué)科理論研究泛化。情報學(xué)是一門綜合性的學(xué)科,在情報學(xué)的發(fā)展研究中,很多內(nèi)容會涉及計算機(jī)和網(wǎng)絡(luò)技術(shù),甚至社會化媒體對情報學(xué)的發(fā)展都有很大的影響,在這種情況下,企業(yè)情報學(xué)、經(jīng)濟(jì)情報學(xué)、軍事情報學(xué)、情報行為學(xué)等這樣的情報學(xué)分支和交叉學(xué)科應(yīng)運(yùn)而生,這都是情報學(xué)學(xué)科泛化的表現(xiàn),大數(shù)據(jù)將帶來新的研究領(lǐng)域、技術(shù)和方法,情報學(xué)學(xué)科理論研究也將繼續(xù)呈現(xiàn)泛化趨勢。
3.2 應(yīng)用情報學(xué)的發(fā)展
3.2.1 情報分析預(yù)測與情報甄別的分量加重。預(yù)測是大數(shù)據(jù)的核心,在大數(shù)據(jù)的環(huán)境下,情報學(xué)可以充分利用大數(shù)據(jù)帶來的新技術(shù)。一方面,大數(shù)據(jù)時代的數(shù)據(jù)價值密度低,信息冗余量大,這對情報學(xué)的情報甄別是巨大的挑戰(zhàn);另一方面,可以從多角度發(fā)現(xiàn)并挖掘數(shù)據(jù)之間的線性關(guān)系和非線性相關(guān)關(guān)系,并在此基礎(chǔ)上進(jìn)行情報分析預(yù)測,為研究和決策服務(wù)。
3.2.2 重視情報用戶的需求,向咨詢業(yè)進(jìn)軍。情報是可以直接使用或者直接用于決策的,情報應(yīng)用中更應(yīng)該以用戶為中心,情報用戶的需求不是簡單的信息收集匯總或是信息堆砌,而是經(jīng)過深層次的加工處理,直接為用戶提供可供用戶做決策使用的成熟的、智能的知識,情報學(xué)應(yīng)該向咨詢業(yè)進(jìn)軍。
3.3 技術(shù)情報學(xué)的發(fā)展
3.3.1 大數(shù)據(jù)時代的數(shù)據(jù)信息數(shù)據(jù)量大。大數(shù)據(jù)時代的數(shù)據(jù)信息數(shù)據(jù)量巨大、來源廣泛、種類繁多、實時變化,并表現(xiàn)出碎片化的特征,這給情報的存儲和采集技術(shù)提出了要求,情報的存儲技術(shù)將在容量大的前提下,增加存儲數(shù)據(jù)的類型,開發(fā)新型的數(shù)據(jù)采集技術(shù)、數(shù)據(jù)挖掘技術(shù)及多媒體檢索技術(shù)。
3.3.2 大數(shù)據(jù)環(huán)境下更注重數(shù)據(jù)之間的相關(guān)關(guān)系。情報學(xué)在這方面的研究技術(shù)還相當(dāng)薄弱,研究大數(shù)據(jù)之間相關(guān)關(guān)系的數(shù)據(jù)模型和情報分析技術(shù)有待開發(fā)。
3.4 管理情報學(xué)的發(fā)展
3.4.1 大數(shù)據(jù)時代個人隱私有被二次利用的危險。在經(jīng)濟(jì)利益的誘惑下,情報學(xué)研究也會涉及個人隱私,為了規(guī)范情報的管理,情報學(xué)學(xué)科發(fā)展中有必要從情報倫理和情報政策與法規(guī)兩個方面規(guī)范情報的管理與研究。情報道德規(guī)范、情報職業(yè)規(guī)范、情報素養(yǎng)以及相關(guān)的情報政策、信息法律法規(guī)都將得到人們的重視,并相繼出臺或完善。
3.4.2 情報學(xué)的發(fā)展離不開人才支持。情報學(xué)是一門綜合性的學(xué)科,從目前形勢來看,情報學(xué)相對比較缺乏技術(shù)上的人才。在大數(shù)據(jù)環(huán)境下,情報學(xué)一定要抓住契機(jī),注重人才在學(xué)科發(fā)展中的作用。
四、結(jié)語
大數(shù)據(jù)將廣泛影響到我們的生活,它將重塑我們的生活、工作以及思維方式,目前,大數(shù)據(jù)分析思想已經(jīng)推廣到了多個學(xué)科領(lǐng)域,大數(shù)據(jù)也為情報學(xué)的發(fā)展開辟了一條嶄新的道路。雖然大數(shù)據(jù)與其他新技術(shù)一樣,必然要經(jīng)歷技術(shù)成熟度曲線,但是情報學(xué)的發(fā)展不能過度依賴大數(shù)據(jù),成為大數(shù)據(jù)的奴隸,而是應(yīng)該讓大數(shù)據(jù)為情報學(xué)發(fā)展所用?傊覀儜(yīng)該勇于面對、勇于創(chuàng)新,迎接大數(shù)據(jù)帶來的挑戰(zhàn)。
參考文獻(xiàn):
[1] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學(xué)報:增刊,2013:142-146.
[2] 朱東華,張嶷,汪雪鋒,等.大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2013(4):172-180.
[3] 黃曉斌,鐘輝新.大數(shù)據(jù)時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展[J].圖書與情報,2012(6):9-14.
[4] 宗威,吳鋒.大數(shù)據(jù)時代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報:社會科學(xué)版,2013(5):38-43.
[5] 彭蘭.“大數(shù)據(jù)”時代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1):6-10.
[6] 何非,何克清.大數(shù)據(jù)及其科學(xué)問題與方法的探討[J].武漢大學(xué)學(xué)報:理論版,2014(1):3-12.
[7] 沈浩,黃曉蘭.大數(shù)據(jù)助力社會科學(xué)研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播,2013(8):13-18.
[8] 夏蓓麗.“‘2008’網(wǎng)絡(luò)環(huán)境下的情報學(xué)發(fā)展研討會”綜述[J].社會科學(xué),2008(12):180-181.
[9] 江俞蓉,張?zhí)烀?大數(shù)據(jù)時代情報學(xué)面臨的挑戰(zhàn)和機(jī)遇[J].現(xiàn)代情報,2013(8):58-60.
[10] 王知津,李贊梅,周鵬.二十年以來我國情報學(xué)學(xué)科體系研究進(jìn)展[J].圖書館,2012(1):50-54.
[11] 包昌火,王秀玲,李艷.中國情報研究發(fā)展紀(jì)實[J].情報理論與實踐,2010(1):1-3.
【大數(shù)據(jù)環(huán)境下情報學(xué)發(fā)展的思考】相關(guān)文章:
云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)思考論文(精選7篇)07-26
局域網(wǎng)數(shù)據(jù)庫環(huán)境下數(shù)據(jù)采集及處理05-08
論Unix環(huán)境下程序和業(yè)務(wù)數(shù)據(jù)安全性探析05-28
淺談電子商務(wù)環(huán)境下國際貿(mào)易的發(fā)展創(chuàng)新06-02
旅游管理下數(shù)據(jù)挖掘運(yùn)用論文11-18
新媒體環(huán)境下電視新聞發(fā)展策略論文(精選15篇)07-26
EPON下的配網(wǎng)通信技術(shù)思考06-10