2015年阿里校招數據分析師筆試題
2015年8月19日,阿里校招數據分析師筆試題。共計21題(單選漏了一題,選擇題每個人的都不一樣,問答題是一樣的。暫時沒有答案,希望對大家有用。
單選題:
1、觀測宇宙中單位體積內星球的個數,屬于什么分布:
A學生分布B泊松分布C正態(tài)分布D二項分布
2、一些關于數據挖掘說法是正確的
A數據挖掘是萬能的
B如果你建立了一個database,那就意味著你已經有足夠的數據可以做數據挖掘了
C數據挖掘=數據+算法,數據挖掘人員大部分的時間用來處理復雜的挖掘算法
DABC均有錯
3、已知隨機變量X,Y分別服從泊松分布P(S),卡方分布X2(t),E(X)=4,D(Y)=9,則參數s,t分別:
A2,9;B4,9C4,4.5;D2,4.5
4 、下面算法中哪一種不屬于廣義線性回歸算法
A生存模型算法
Bbeta回歸算法
Clogit回歸算法
D判別分析算法
5、有一列1000萬淘寶買家的淘寶運費險保費數據,要計算該列數據的P1-P100分位數,可使用哪個SAS語句?
Aproc sort
Bproc rank
Cproc univariate
Dproc freq
6、X服從區(qū)間(2,6)上的均勻分布,求對X進行3次獨立觀測中,至少有2次的觀測值大于3的概率。
A0.84375
B0.75275
C0.65275
D0.80370
7、下面對于“預測變量間可能存在較嚴重的多重共線性”的.論述中錯誤的是?
A回歸系數的符號與專家經驗知識不符
B方差膨脹因子(VIF)<5
C其中兩個預測變量的相關系數>=0.85
D變量重要性與專家經驗嚴重違背
8、由于淘寶買家消費數據是億級別,假設為了快速計算買家每月的平均消費額,采用抽樣1W個買家來計算
A采用分層抽樣方法把全量淘寶買家按照星級,每層抽取相同的數量,計算平均值
B采用系統(tǒng)抽樣方法,把全量買家隨機排序,每隔一定數量抽一個,計算平均值
C采用無放回隨機方法,從全量買家中隨機挑選一個買家,不放回,如此循環(huán)
D采用有放回隨機方法,從全量買家中隨機挑選一個買家,然后再放回,如此循環(huán)
9、請找出數列4,9,23,60,157的下一項()
A 411 B 314 C 425 D ABC均錯
10(應該是沒統(tǒng)計上)
多選題
11、以下哪個語法不是R的基礎語言
Aproc glot
Bselect *from table
Ckc<-kmeans(data,3)
Dprint”hello world”
Esd<-summary(data)
Fimport
12、分析師在工作中的良好習慣是
A將工作空間的密碼共享給別人
B將數據下載到私人電腦進行分析處理
C在處理資源高峰期提交大任務運算
D不定期地將分析報告分享給團隊
E定期清理存儲空間
F固話日常需要分析的數據表方便計算
13
14
15
16 、 請分析淘寶消費者的流失情況
17 、 淘寶和天貓上每天都有大量的用戶在線上購買,作為分析師可以從哪些角度對用戶進行分析,說明理由
18
19
20已知A商家近五年每月的成交數據,請列出兩種不同的時間序列預測模型可以用來預測商家接下來三個月的成交,并詳細闡述在使用每一種方法前需要對數據進行什么預處理以及具體方法
21你理解中的分析師是什么樣的?你覺得自己目前應聘分析師職位的優(yōu)勢是什么?并說明理由。
【2015年阿里校招數據分析師筆試題】相關文章:
阿里巴巴校招數據分析師職位筆試題目08-21
2015阿里校招數據產品經理筆試題08-13
阿里巴巴2016校招筆試題09-14
2015阿里校招運營專員筆試題08-21
阿里校招視覺設計師筆試題09-11
2015阿里校招研發(fā)工程師筆試題08-13
阿里巴巴綜合筆題11-13
阿里在線前端筆試題01-15