面試經(jīng)驗分享之機器學(xué)習(xí)與大數(shù)據(jù)問題
本人的專業(yè)方向是機器學(xué)習(xí)、數(shù)據(jù)挖掘,就業(yè)意向是互聯(lián)網(wǎng)行業(yè)與本專業(yè)相關(guān)的工作崗位。各個企業(yè)對這類崗位的命名可能有所不同,比如數(shù)據(jù)挖掘/自然語言處理/機器學(xué)習(xí)算法工程師,或簡稱算法工程師,還有的稱為搜索/推薦算法工程師,甚至有的并入后臺工程師的范疇,視崗位具體要求而定。
機器學(xué)習(xí)、大數(shù)據(jù)相關(guān)崗位的職責(zé)
自己參與面試的.提供算法崗位的公司有 BAT、小米、360、飛維美地、宜信、猿題庫 等,根據(jù)業(yè)務(wù)的不同,崗位職責(zé)大概分為:
1、平臺搭建類數(shù)據(jù)計算平臺搭建,基礎(chǔ)算法實現(xiàn),當(dāng)然,要求支持大樣本量、高維度數(shù)據(jù),所以可能還需要底層開發(fā)、并行計算、分布式計算等方面的知識;
2、算法研究類文本挖掘,如領(lǐng)域知識圖譜構(gòu)建、垃圾短信過濾等;推薦,廣告推薦、APP 推薦、題目推薦、新聞推薦等;排序,搜索結(jié)果排序、廣告排序等;廣告投放效果分析;互聯(lián)網(wǎng)信用評價;圖像識別、理解。
3、數(shù)據(jù)挖掘類商業(yè)智能,如統(tǒng)計報表;用戶體驗分析,預(yù)測流失用戶。
以上是根據(jù)本人求職季有限的接觸所做的總結(jié)。有的應(yīng)用方向比較成熟,業(yè)界有足夠的技術(shù)積累,比如搜索、推薦,也有的方向還有很多開放性問題等待探索,比如互聯(lián)網(wǎng)金融、互聯(lián)網(wǎng)教育。在面試的過程中,一方面要盡力向企業(yè)展現(xiàn)自己的能力,另一方面也是在增進對行業(yè)發(fā)展現(xiàn)狀與未來趨勢的理解,特別是可以從一些剛起步的企業(yè)和團隊那里,了解到一些有價值的一手問題。
以下首先介紹面試中遇到的一些真實問題,然后談一談答題和面試準備上的建議。
面試問題1、你在研究/項目/實習(xí) 經(jīng)歷中主要用過哪些機器學(xué)習(xí)/數(shù)據(jù)挖掘的算法?2、你熟悉的機器學(xué)習(xí)/數(shù)據(jù)挖掘算法主要有哪些?3、你用過哪些機器學(xué)習(xí)/數(shù)據(jù)挖掘工具或框架?4、基礎(chǔ)知識
無監(jiān)督和有監(jiān)督算法的區(qū)別?SVM 的推導(dǎo),特性?多分類怎么處理?LR 的推導(dǎo),特性?決策樹的特性?SVM、LR、決策樹的對比?GBDT 和 決策森林 的區(qū)別?如何判斷函數(shù)凸或非凸?解釋對偶的概念。如何進行特征選擇?為什么會產(chǎn)生過擬合,有哪些方法可以預(yù)防或克服過擬合?介紹卷積神經(jīng)網(wǎng)絡(luò),和 DBN 有什么區(qū)別?采用 EM 算法求解的模型有哪些,為什么不用牛頓法或梯度下降法?用 EM 算法推導(dǎo)解釋 Kmeans。用過哪些聚類算法,解釋密度聚類算法。聚類算法中的距離度量有哪些?如何進行實體識別?解釋貝葉斯公式和樸素貝葉斯分類。寫一個 Hadoop 版本的 wordcount。
【面試經(jīng)驗分享之機器學(xué)習(xí)與大數(shù)據(jù)問題】相關(guān)文章:
面試問題之經(jīng)驗態(tài)度06-02
面試技巧與經(jīng)驗的分享08-04
四大面試經(jīng)驗分享01-15
分享面試經(jīng)驗12-04
海馬汽車面試經(jīng)驗與技巧分享12-08
MBA面試經(jīng)驗交流與分享11-05
小升初面試七大經(jīng)驗分享11-15
面試問題之5大“最”06-09
小升初面試經(jīng)驗之六大技巧12-19