百度大数据实习生职位电话面试总结
贝加尔湖畔v
刚面完百度大数据实习生职位,还热乎的,这样我第一次面试献给了百度,感觉面试官很nice,听声音年龄不到三十,问的问题好多都是探讨讲,这中间还会提示一些。进BAT任何一家实习一直是我特别向往的,下面为我以后更好发挥做个总结,同时也为准备去百度的小伙伴提供参考,希望我出现的问题你们不要在出现。
昨天中午接到百度HR的通知,今天下午两点有电话面试,准备时间只有一天,时间比较紧张,我想的是HR既然看的我简历来面试我的,那么我要把简历上的东西捋一捋(切记简历一定要真实,不要吹牛逼,哎,说多了都是泪。。。)。网上说百度会问数据结构和算法之类的,也把数据结构主要算法看了一遍,盯着时间从1点50到了2点,应了那句话,最紧张的不是考试,而是等待考试的到来。不废话了,言归正传。
1. 介绍下自己
简单说了自己研究生做的项目,本科时候获的奖励
2. 问简历上项目
我简历上写了两个项目,一是研一时候过的一个Java项目,二是自己实验室做的关于Hadoop的实验。面试官重点问了第二个项目,应该是因为和职位相关吧
(1)问了二次排序原理,这个在我简历上写了的,用语言表达确实不容易表达,/(ㄒoㄒ)/~~回答的不太好,如果现场面试画个图会更好些
(2)由于我描述的不太清,他就让我介绍下wordcount基本原理,balabala说了一通,面试官说介绍的还可以(窃喜)
(3)讲讲mapreduce配置优化
(4)一个实际问题:mapreduce程序,reduce阶段,key聚集到一块儿怎么处理?
(5)另一个实际问题:写一个统计pv访问次数的程序,输入文件有两列:一列url,一列pv访问次数(这个程序类似于wordcount统计程序)
(6)上个问题升级版,如果这个文件有三列:加一列cookie,统计去重后地址访问次数(同一个地址访问,cookie值一样的算是一次),我回答需要自定义个数据类型来做,面试官引导我:先给文件分区,然后在去重。最后也没表达出面试官提示的方法。
3. 数据库方面
问了left join、right join、inner join 没回答好,自己在简历上写的熟练掌握数据库(作死的节奏啊o(╯□╰)o)
4. “问个简单的数据结构算法吧”
面试官原话,不过确实挺简单的,只问了快速排序原理及复杂度,复杂度答错了,好悲催
5. 问我对职位还有什么问题
这次面试过程还是蛮轻松,比我想象要简单,可是自己并没有回答的很好,以后需要加强的地方:
1.简历一定要实事求是,切忌浮夸
2.面试必不可少数据结构,数据结构必不可少快速排序算法
面试官最后说让我等通知,自己被pass掉也正常,能进去算是自己撞大运了,不管什么结果,再接再厉!