IT培訓(xùn)網(wǎng)
IT在線學(xué)習(xí)
近年來大數(shù)據(jù)技術(shù)人才層出不窮,但無論如何求職者只有經(jīng)過層層面試才能獲得施展才華的機(jī)會,而面試的首關(guān)就是一套技術(shù)面試題,所以中公優(yōu)就業(yè)小編整理了一些常見的大數(shù)據(jù)面試題,希望對大家有幫助。
1、舉一個簡單的例子說明mapreduce是怎么來運(yùn)行的 ?
2、secondarynamenode的主要職責(zé)是什么?簡述其工作機(jī)制
3、Sqoop用起來感覺怎樣?
4、kafka 數(shù)據(jù)高可用的原理是什么
5、MapReduce 中排序發(fā)生在哪幾個階段?這些排序是否可以避免?為什么?
6、100w 個數(shù)中找出最大的 100 個數(shù)。
7、一個文本文件,大約有一萬行,每行一個詞,要求統(tǒng)計出其中最頻繁出現(xiàn)的前10個詞,請給出思想,給出時間復(fù)雜度分析。
8、已知某個文件內(nèi)包含一些電話號碼,每個號碼為8位數(shù)字,統(tǒng)計不同號碼的個數(shù)。
9、有一千萬條短信,有重復(fù),以文本文件的形式保存,一行一條,有重復(fù)。 請用 5 分鐘時間,找出重復(fù)出現(xiàn)最多的前 10 條。
10、每個文件至少有1000萬行,請用程序完成以下工作,
1)每個文件的個子的IP
2)出現(xiàn)在b.text而沒有出現(xiàn)在a.text的IP
3)每個user出現(xiàn)的次數(shù)以及每個user對應(yīng)的IP的個數(shù)
相關(guān)推薦:
更多內(nèi)容
>>本文地址:http://www.yceu.cn/jiuye/2018/45570.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學(xué)歷
3 您更想做哪個方向的工作?