淺談深度學(xué)習(xí)的基本思想和方法

時(shí)間：2021-01-05 11:02:08 學(xué)習(xí)方法我要投稿

　　淺談深度學(xué)習(xí)的基本思想和方法

淺談深度學(xué)習(xí)的基本思想和方法

　　淺談深度學(xué)習(xí)(Deep Learning)的基本思想和方法深度學(xué)習(xí)（Deep Learning），又叫Unsupervised Feature Learning或者Feature Learning，是目前非常熱的一個(gè)研究主題。

　　本文將主要介紹Deep Learning的基本思想和常用的方法。

　　一. 什么是Deep Learning？

　　實(shí)際生活中，人們?yōu)榱私鉀Q一個(gè)問題，如對(duì)象的分類（對(duì)象可是是文檔、圖像等），首先必須做的事情是如何來表達(dá)一個(gè)對(duì)象，即必須抽取一些特征來表示一個(gè)對(duì)象，如文本的處理中，常常用詞集合來表示一個(gè)文檔，或把文檔表示在向量空間中（稱為VSM模型），然后才能提出不同的分類算法來進(jìn)行分類；又如在圖像處理中，我們可以用像素集合來表示一個(gè)圖像，后來人們提出了新的特征表示，如SIFT，這種特征在很多圖像處理的應(yīng)用中表現(xiàn)非常良好，特征選取得好壞對(duì)最終結(jié)果的影響非常巨大。因此，選取什么特征對(duì)于解決一個(gè)實(shí)際問題非常的重要。

　　然而，手工地選取特征是一件非常費(fèi)力、啟發(fā)式的`方法，能不能選取好很大程度上靠經(jīng)驗(yàn)和運(yùn)氣；既然手工選取特征不太好，那么能不能自動(dòng)地學(xué)習(xí)一些特征呢？答案是能！Deep Learning就是用來干這個(gè)事情的，看它的一個(gè)別名Unsupervised Feature Learning，就可以顧名思義了，Unsupervised的意思就是不要人參與特征的選取過程。因此，自動(dòng)地學(xué)習(xí)特征的方法，統(tǒng)稱為Deep Learning。

　　二. Deep Learning的基本思想

　　假設(shè)我們有一個(gè)系統(tǒng)S，它有n層（S1,...Sn），它的輸入是I，輸出是O，形象地表示為： I =>S1=>S2=>.....=>Sn => O，如果輸出O等于輸入I，即輸入I經(jīng)過這個(gè)系統(tǒng)變化之后沒有任何的信息損失，保持了不變，這意味著輸入I經(jīng)過每一層Si都沒有任何的信息損失，即在任何一層Si，它都是原有信息（即輸入I）的另外一種表示�，F(xiàn)在回到我們的主題Deep Learning，我們需要自動(dòng)地學(xué)習(xí)特征，假設(shè)我們有一堆輸入I（如一堆圖像或者文本），假設(shè)我們?cè)O(shè)計(jì)了一個(gè)系統(tǒng)S（有n層），我們通過調(diào)整系統(tǒng)中參數(shù)，使得它的輸出仍然是輸入I，那么我們就可以自動(dòng)地獲取得到輸入I的一系列層次特征，即S1，..., Sn。

　　另外，前面是假設(shè)輸出嚴(yán)格地等于輸入，這個(gè)限制太嚴(yán)格，我們可以略微地放松這個(gè)限制，

　　例如我們只要使得輸入與輸出的差別盡可能地小即可，這個(gè)放松會(huì)導(dǎo)致另外一類不同的Deep Learning方法。上述就是Deep Learning的基本思想。

　　三.Deep Learning的常用方法

　　a). AutoEncoder

　　最簡(jiǎn)單的一種方法是利用人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)，人工神經(jīng)網(wǎng)絡(luò)（ANN）本身就是具有層次結(jié)構(gòu)的系統(tǒng)，如果給定一個(gè)神經(jīng)網(wǎng)絡(luò)，我們假設(shè)其輸出與輸入是相同的，然后訓(xùn)練調(diào)整其參數(shù)，得到每一層中的權(quán)重，自然地，我們就得到了輸入I的幾種不同表示（每一層代表一種表示），這些表示就是特征，在研究中可以發(fā)現(xiàn)，如果在原有的特征中加入這些自動(dòng)學(xué)習(xí)得到的特征可以大大提高精確度，甚至在分類問題中比目前最好的分類算法效果還要好！這種方法稱為AutoEncoder。當(dāng)然，我們還可以繼續(xù)加上一些約束條件得到新的Deep Learning方法，如如果在AutoEncoder的基礎(chǔ)上加上L1的Regularity限制（L1主要是約束每一層中的節(jié)點(diǎn)中大部分都要為0，只有少數(shù)不為0，這就是Sparse名字的來源），我們就可以得到Sparse AutoEncoder方法。

　　b). Sparse Coding

　　如果我們把輸出必須和輸入相等的限制放松，同時(shí)利用線性代數(shù)中基的概念，即O = w1*B1 + W2*B2+....+ Wn*Bn， Bi是基，Wi是系數(shù)，我們可以得到這樣一個(gè)優(yōu)化問題：

　　Min |I - O|

　　通過求解這個(gè)最優(yōu)化式子，我們可以求得系數(shù)Wi和基Bi，這些系數(shù)和基礎(chǔ)就是輸入的另外一種近似表達(dá)，因此，它們可以特征來表達(dá)輸入I，這個(gè)過程也是自動(dòng)學(xué)習(xí)得到的。如果我們?cè)谏鲜鍪阶由霞由螸1的Regularity限制，得到：

　　Min |I - O| + u*(|W1| + |W2| + ... + |Wn|)

　　這種方法被稱為Sparse Coding。

　　c) Restrict Boltzmann Machine (RBM)

　　假設(shè)有一個(gè)二部圖，每一層的節(jié)點(diǎn)之間沒有鏈接，一層是可視層，即輸入數(shù)據(jù)層（v)，一層

　　是隱藏層(h)，如果假設(shè)所有的節(jié)點(diǎn)都是二值變量節(jié)點(diǎn)（只能取0或者1值），同時(shí)假設(shè)全概率分布p(v, h)滿足Boltzmann 分布，我們稱這個(gè)模型是Restrict Boltzmann Machine

　　(RBM)。下面我們來看看為什么它是Deep Learning方法。首先，這個(gè)模型因?yàn)槭嵌繄D，所以在已知v的情況下，所有的隱藏節(jié)點(diǎn)之間是條件獨(dú)立的，即p(h|v) =p(h1|v).....p(hn|v)。同理，在已知隱藏層h的情況下，所有的可視節(jié)點(diǎn)都是條件獨(dú)立的，同時(shí)又由于所有的v和h滿足Boltzmann 分布，因此，當(dāng)輸入v的時(shí)候，通過p(h|v) 可以得到隱藏層h，而得到隱藏層h之后，通過p(v|h) 又能得到可視層，通過調(diào)整參數(shù)，我們就是要使得從隱藏層得到的可視層v1與原來的可視層v如果一樣，那么得到的隱藏層就是可視層另外一種表達(dá)，因此隱藏層可以作為可視層輸入數(shù)據(jù)的特征，所以它就是一種Deep Learning方法。

　　如果，我們把隱藏層的層數(shù)增加，我們可以得到Deep Boltzmann Machine (DBM)；如果我們?cè)诳拷梢晫拥牟糠质褂秘惾~斯信念網(wǎng)絡(luò)（即有向圖模型，當(dāng)然這里依然限制層中節(jié)點(diǎn)之間沒有鏈接），而在最遠(yuǎn)離可視層的部分使用Restrict Boltzmann Machine，我們可以得到Deep Belief Net （DBN）。

　　當(dāng)然，還有其它的一些Deep Learning 方法，在這里就不敘述了。總之，Deep Learning能夠自動(dòng)地學(xué)習(xí)出數(shù)據(jù)的另外一種表示方法，這種表示可以作為特征加入原有問題的特征集合中，從而可以提高學(xué)習(xí)方法的效果，是目前業(yè)界的研究熱點(diǎn)。

【淺談深度學(xué)習(xí)的基本思想和方法】相關(guān)文章：

淺談韓語的學(xué)習(xí)方法09-12

淺談韓語學(xué)習(xí)方法09-10

淺談韓語語音的學(xué)習(xí)方法09-10

淺談黃山旅游產(chǎn)業(yè)深度開發(fā)10-16

淺談Illustrator課程的教學(xué)模式和方法09-18

學(xué)習(xí)圍棋的方法和技巧09-07

硬盤的深度維護(hù)的方法介紹07-03

淺談韓語的學(xué)習(xí)方法是什么09-10

淺談奧數(shù)學(xué)習(xí)的作用與方法09-30

淺談網(wǎng)絡(luò)營(yíng)銷都的技巧和方法12-08

亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

淺談深度學(xué)習(xí)的基本思想和方法