HCNP-Big Data-Developer V1.0試題及答案

時(shí)間：2024-09-15 06:00:08 華為認(rèn)證我要投稿

相關(guān)推薦

　　1.(判斷題) HDFS采用的是“一次寫入、多次讀取”的文件訪問模型。所以推薦一個(gè)文件經(jīng)過創(chuàng)建、寫入和關(guān)閉之后，就不要再去修改。

HCNP-Big Data-Developer V1.0試題及答案

　　A. True B. False

　　2.(多選題) HDFS的應(yīng)用開發(fā)中，下列哪些是HDFS服務(wù)支持的接口?

　　A. BufferedOutputStream.write

　　B. BufferedOutputStream.flush

　　C. FileSystem.create

　　D. FileSystem.append

　　3. (多選題) 關(guān)于kinit操作命令，如下哪些說法是錯(cuò)誤的?

　　A. 只能使用人機(jī)賬號(hào)。

　　B. 只能使用機(jī)機(jī)賬號(hào)。

　　C. 一個(gè)客戶端不支持多個(gè)賬號(hào)同時(shí)使用。

　　D. 執(zhí)行此命令得到的票據(jù)在24小時(shí)后會(huì)超時(shí)，需再次執(zhí)行kinit命令去重新登錄。

　　4.(多選題)對(duì)于HBase Rowkey的設(shè)計(jì)原則，如下描述正確的是?

　　A. 訪問權(quán)重高的屬性值放在Rowkey前面。

　　B. 訪問權(quán)重高的屬性值放在Rowkey后半部分。

　　C. 離散度好的屬性值放在Rowkey前半部分。

　　D. 離散度好的屬性值放在Rowkey后半部分。

　　5.(單選題)HBase表的Rowkey設(shè)計(jì)是一個(gè)很重要的開發(fā)設(shè)計(jì)環(huán)節(jié)。假設(shè)存在如下場(chǎng)景，最頻繁的查詢場(chǎng)景是基于手機(jī)號(hào)查詢每個(gè)月、每半年的歷史通話記錄，以下哪個(gè)Rowkey設(shè)計(jì)是最優(yōu)的?

　　A. 姓名+手機(jī)號(hào) B. 日期+手機(jī)號(hào)

　　C. 手機(jī)號(hào)+日期 D. 手機(jī)號(hào)+姓名

　　6.(單選題) FusionInsight HD中，關(guān)于Hive的分區(qū)(partition)功能，如下描述錯(cuò)誤的是?

　　A. 分區(qū)字段要在創(chuàng)建表時(shí)定義。

　　B. 分區(qū)字段只能有一個(gè)，不可以創(chuàng)建多級(jí)分區(qū)。

　　C. 使用分區(qū)，可以減少某些查詢的數(shù)據(jù)掃描范圍，進(jìn)而提高查詢效率。

　　D. 分區(qū)字段可以作為where字句的條件。

　　7.(判斷題) FusionInsight HD系統(tǒng)的V100R002C60版本中，Hive僅支持基于MapReduce引擎的查詢服務(wù)，不支持基于Spark引擎的查詢服務(wù)。

　　A. True

　　B. False

　　8.(單選題) FusionInsight HD中，對(duì)Solr各類資源的創(chuàng)建和讀寫權(quán)限使用，以下說法錯(cuò)誤的是?

　　A. Solr用戶組用戶可以創(chuàng)建配置集，并在創(chuàng)建Collection時(shí)指定該配置集。

　　B. Solr用戶組的用戶可以創(chuàng)建Collection。

　　C. Collection創(chuàng)建者、對(duì)該Collection具有讀寫權(quán)限的角色以及Solr admin角色可以對(duì)Collection進(jìn)行更新。

　　D. 只有Collection創(chuàng)建者和Solr admin角色可以刪除Collection。

　　9.(多選題) 在Solr的應(yīng)用查詢場(chǎng)景中，當(dāng)對(duì)查詢結(jié)果深度翻頁(yè)時(shí)，需使用游標(biāo)進(jìn)行深度翻頁(yè)。下面對(duì)游標(biāo)說法正確的是?

　　A. 必須對(duì)查詢字段進(jìn)行排序。

　　B. 必須對(duì)uniqueKey字段進(jìn)行排序。

　　C. 第一次查詢請(qǐng)求時(shí)，需指定查詢參數(shù)，操作方法如下：

　　solrQuery.set(CursorMarkParams.CURSOR_MARK_PARAM, CursorMarkParams.CURSOR_MARK_START);

　　D. 查詢時(shí)，請(qǐng)求中不能帶有start參數(shù)。

　　E. Solr的返回結(jié)果中會(huì)有nextCursorMark，在下次調(diào)用時(shí)使用這個(gè)值作為cursorMark。

　　10.(多選題)關(guān)于Kafka的Producer，如下說法正確的是?

　　A. Producer是消息生產(chǎn)者。

　　B. Producer生產(chǎn)數(shù)據(jù)需要指定Topic。

　　C. 可以同時(shí)起多個(gè)Producer進(jìn)程向同一個(gè)Topic進(jìn)行數(shù)據(jù)發(fā)送。

　　D. Producer生產(chǎn)數(shù)據(jù)時(shí)需要先連接ZooKeeper，而后才連接Broker。

　　11.(單選題) 在FusionInsight HD產(chǎn)品中，關(guān)于Kafka安全和非安全端口描述錯(cuò)誤的是?

　　(注：舊API是指舊Producer API和舊Consumer API。其中，舊Consumer API：是指kafka.consumer.ConsumerConnector中定義的接口;舊Producer API：是指kafka.producer.Producer中定義的接口。)

　　A. Kafka集群安全訪問端口默認(rèn)為21007，非安全訪問端口默認(rèn)為21005。

　　B. 舊API通過21005端口訪問某個(gè)Topic的前提是：服務(wù)端參數(shù)allow.everyone.if.no.acl.found設(shè)置為true，且此Topic未設(shè)置ACL屬性。

　　C. 舊API僅支持訪問21005端口;新API兼容訪問非安全端口21005和安全端口21007。

　　D. 對(duì)于設(shè)置了ACL的Topic，可以使用舊API連接21005端口進(jìn)行訪問。

　　12.(判斷題)在一個(gè)MapReduce應(yīng)用程序中，map函數(shù)的輸出經(jīng)由MapReduce框架處理后，發(fā)送到reduce函數(shù)。這個(gè)處理過程是基于鍵值對(duì)進(jìn)行排序和分組的。

　　A. True

　　B. False

　　13.(判斷題)在FusionInsight HD中，Spark默認(rèn)采用YARN作為集群資源管理系統(tǒng)。

　　A. True

　　B. False

　　14.(單選題)Spark應(yīng)用的計(jì)算邏輯會(huì)被解析成DAG，這個(gè)解析操作由以下哪個(gè)功能模塊完成?

　　A. Client

　　B. ApplicationMaster

　　C. Executor

　　D. Driver

　　15.(單選題)在Flume中，source功能模塊的主要作用是?

　　A. 獲取數(shù)據(jù)，并將原始數(shù)據(jù)轉(zhuǎn)化成自己處理的數(shù)據(jù)對(duì)象。

　　B. 緩存數(shù)據(jù)，根據(jù)不同的可靠性策略，將數(shù)據(jù)保存在內(nèi)存或文件上。

　　C. 輸出數(shù)據(jù)到目的地，支持多種輸出協(xié)議。

　　D. 拆分?jǐn)?shù)據(jù)，根據(jù)數(shù)據(jù)的特性，將數(shù)據(jù)發(fā)送到不同的目的地。

　　16.(單選題) 關(guān)于Streaming的拓?fù)?Topology)，下面描述錯(cuò)誤的是?

　　A. 一個(gè)Topology是由一組Spout組件和Bolt組件通過Stream Groupings進(jìn)行連接的有向無(wú)環(huán)圖(DAG)。

　　B. Topology會(huì)一直運(yùn)行，直到它被顯式kill。

　　C. 業(yè)務(wù)邏輯都被封裝進(jìn)Topology中。

　　D. 一個(gè)Topology只可以指定啟動(dòng)一個(gè)Worker進(jìn)程。

　　17.(單選題) 假設(shè)一個(gè)應(yīng)用有10個(gè)表，每個(gè)表記錄數(shù)為千萬(wàn)級(jí)別，字段數(shù)約20個(gè)�，F(xiàn)使用Redis來緩存這10個(gè)表的數(shù)據(jù)，對(duì)其數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì)，以下哪一項(xiàng)是最佳設(shè)計(jì)?

　　A. 采用hash結(jié)構(gòu)，且一個(gè)表使用一個(gè)hash KEY，表中一行記錄對(duì)于hash KEY的一個(gè)field。

　　B. 采用hash結(jié)構(gòu)，每個(gè)表的每一行記錄使用一個(gè)hash KEY，hash KEY的field對(duì)應(yīng)表記錄的字段，且設(shè)計(jì)KEY時(shí)每個(gè)表添加不同的前綴進(jìn)行區(qū)分。

　　C. 采用string結(jié)構(gòu)，每個(gè)表的每一行記錄的每個(gè)字段使用一個(gè)KEY。

　　D. 采用string結(jié)構(gòu)，每個(gè)表的每一行記錄使用一個(gè)KEY，value為表中一行記錄的所有字段拼接后的值。

　　18.(多選題) FusionInsight HD中，在使用Streaming的ACK機(jī)制時(shí)，下列哪些說法是正確的?

　　A. 啟用了Acker之后，Streaming會(huì)識(shí)別發(fā)送失敗的Tuple并自動(dòng)重發(fā)，無(wú)需人為干預(yù)。

　　B. Acker會(huì)標(biāo)識(shí)處理超時(shí)或者處理失敗的消息為fail。

　　C. 從spout開始，形成的Tuple樹中任何一個(gè)環(huán)節(jié)失敗都會(huì)標(biāo)記整棵樹失敗。

　　D. 應(yīng)用需要在spout的fail()接口方法中實(shí)現(xiàn)消息重發(fā)邏輯。

　　19.(多選題)在Spark中，關(guān)于廣播變量以下說法正確的是?

　　A. 廣播變量在每個(gè)Task中保存一份。

　　B. 廣播變量在每個(gè)Executor中保存一份。