- 相關(guān)推薦
《數(shù)學(xué)之美》讀后感
確切的來說,《數(shù)學(xué)之美》并不是一本書,它是谷歌黑板報(bào)中的一系列文章,介紹數(shù)學(xué)在信息檢索和自然語言處理中的主導(dǎo)作用和奇妙應(yīng)用,每一篇文章都不長(zhǎng),但小中見大,從看似高深的高科技中用通俗易懂的案例展示了數(shù)學(xué)之美,深深的吸引了我。
這一系列文章的作者是google公司的科學(xué)家吳軍。他畢業(yè)于清華大學(xué)計(jì)算機(jī)系(本科)和電子工程系(碩士),并于1993-1996年在清華任講師。他于1996年起在美國(guó)約翰霍普金斯大學(xué)攻讀博士,并于XX年獲得計(jì)算機(jī)科學(xué)博士學(xué)位。在清華和約翰霍普金斯大學(xué)期間,吳軍博士致力于語音識(shí)別、自然語言處理,特別是統(tǒng)計(jì)語言模型的研究。他曾獲得1995年的全國(guó)人機(jī)語音智能接口會(huì)議的最佳論文獎(jiǎng)和XX年eurospeech的最佳論文獎(jiǎng)。
吳軍博士于XX年加入google公司,現(xiàn)任google研究院資深研究員。到google不久,他和三個(gè)同事們開創(chuàng)了網(wǎng)絡(luò)搜索反作弊的研究領(lǐng)域,并因此獲得工程獎(jiǎng)。XX年,他和兩個(gè)同事共同成立了中日韓文搜索部門。吳軍博士是當(dāng)前google中日韓文搜索算法的主要設(shè)計(jì)者。在google其間,他領(lǐng)導(dǎo)了許多研發(fā)項(xiàng)目,包括許多與中文相關(guān)的產(chǎn)品和自然語言處理的項(xiàng)目,并得到了公司首席執(zhí)行官埃里克.施密特的高度評(píng)價(jià)。吳軍博士在國(guó)內(nèi)外發(fā)表過數(shù)十篇論文并獲得和申請(qǐng)了近十項(xiàng)美國(guó)和國(guó)際專利。他于XX年起,當(dāng)選為約翰霍普金斯大學(xué)計(jì)算機(jī)系董事會(huì)董事。
正是他在信息檢索與自然語言處理領(lǐng)域中的一系列工作,使他講述了我所看到的內(nèi)容-數(shù)學(xué)之美。
看了數(shù)學(xué)之美,立即聯(lián)想到了金庸小說中的武林高人,總是把一套大多數(shù)人都會(huì)的入門功夫使得威力無比,擊潰眾多敵者。東西放在那,它的威力如何,并鍵在于使用者,武術(shù)如此,數(shù)學(xué)同樣如此。
于我而言,語音視別是一類高科技,作為非專業(yè)人土,深覺高奧。但看完數(shù)學(xué)之美之后,頓感驚詫,原來如此深?yuàn)W東西的解決方法自己也學(xué)過,并且理工科讀過大學(xué)的人都學(xué)過,那就是統(tǒng)計(jì)學(xué)中的條件概率p(a/b),即b事件發(fā)生條件下a事件發(fā)生的概率。
如果s表示一連串特定順序排列的詞w1,w2,…,wn,換句話說,s可以表示某一個(gè)由一連串特定順序排練的詞而組成的一個(gè)有意義的句子,F(xiàn)在,機(jī)器對(duì)語言的識(shí)別從某種角度來說,就是想知道s在文本中出現(xiàn)的可能性,也就是數(shù)學(xué)上所說的s的概率用p(s)來表示。利用條件概率的公式,s這個(gè)序列出現(xiàn)的概率等于每一個(gè)詞出現(xiàn)的概率相乘,于是p(s)可展開為:
p(s)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wn-1)
其中p(w1)表示第一個(gè)詞w1出現(xiàn)的概率;p(w2|w1)是在已知第一個(gè)詞的前提下,第二個(gè)詞出現(xiàn)的概率;以次類推。不難看出,到了詞wn,它的出現(xiàn)概率取決于它前面所有詞。從計(jì)算上來看,各種可能性太多,無法實(shí)現(xiàn)。因此我們假定任意一個(gè)詞wi的出現(xiàn)概率只同它前面的詞wi-1有關(guān)(即馬爾可夫假設(shè)),于是問題就變得很簡(jiǎn)單了,F(xiàn)在,s出現(xiàn)的概率就變?yōu)椋?/p>
p(s)=p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1)…
(當(dāng)然,也可以假設(shè)一個(gè)詞又前面n-1個(gè)詞決定,模型稍微復(fù)雜些。)
接下來的問題就是如何估計(jì)p(wi|wi-1),F(xiàn)在有了大量機(jī)讀文本后,這個(gè)問題變得很簡(jiǎn)單,只要數(shù)一數(shù)這對(duì)詞(wi-1,wi)在統(tǒng)計(jì)的文本中出現(xiàn)了多少次,以及wi-1本身在同樣的文本中前后相鄰出現(xiàn)了多少次,然后用兩個(gè)數(shù)一除就可以了,p(wi|wi-1)=p(wi-1,wi)/p(wi- 1)。
也許很多人不相信用這么簡(jiǎn)單的數(shù)學(xué)模型能解決復(fù)雜的語音識(shí)別、機(jī)器翻譯等問題。其實(shí)不光是常人,就連很多語言學(xué)家都曾質(zhì)疑過這種方法的有效性,但事實(shí)證明,統(tǒng)計(jì)語言模型比任何已知的借助某種規(guī)則的解決方法都有效。比如在google的中英文自動(dòng)翻譯中,用的最重要的就是這個(gè)統(tǒng)計(jì)語言模型。去年美國(guó)標(biāo)準(zhǔn)局(nist)對(duì)所有的機(jī)器翻譯系統(tǒng)進(jìn)行了評(píng)測(cè),google的系統(tǒng)是不僅是全世界最好的,而且高出所有基于規(guī)則的系統(tǒng)很多。
這就是數(shù)學(xué)的美妙之處了,它把一些復(fù)雜的問題變得如此的簡(jiǎn)單。
看到《數(shù)學(xué)之美》,在感嘆數(shù)學(xué)的美妙與神奇之處時(shí),自然而然聯(lián)系到自己專業(yè)(地質(zhì)工程而或巖土工程)中的數(shù)學(xué)應(yīng)用。
現(xiàn)在找文獻(xiàn),搜索期刊一大堆基于數(shù)學(xué)的專業(yè)文獻(xiàn),灰色數(shù)學(xué)的、模糊數(shù)學(xué)的、非線性的、系統(tǒng)的,等等,這么多的數(shù)學(xué)的使用,促進(jìn)了一大批的文章,但這些數(shù)學(xué)方法的應(yīng)用究竟是發(fā)現(xiàn)了哪些問題?還是解決了實(shí)際問題嗎?還是僅發(fā)了文章,滿足了需求?現(xiàn)實(shí)是文章好發(fā),用著難用,解決問題還得傳統(tǒng)的方法,那么是這些數(shù)學(xué)方法不行,還是用的太膚淺,根本沒發(fā)揮其威力來?如果沒有發(fā)揮出威力來,那怎么用?怎么發(fā)揮?
【《數(shù)學(xué)之美》讀后感】相關(guān)文章:
引領(lǐng)學(xué)生采擷數(shù)學(xué)之美?12-12
感悟數(shù)學(xué)之美畢業(yè)論文(精選11篇)01-27
人文之美征文01-06
淺談漆畫之美12-20
2022大美校園·人文之美征文09-21
“大美校園·自然之美”活動(dòng)總結(jié)10-15
創(chuàng)素質(zhì)之美心得10-20
橋之美教學(xué)反思07-27