酷家乐大数据研发面试

总共三轮,感觉面试官好像都没问什么基础知识。
一轮,写文件分割,合并的程序。分割要求输入文件路径,分割后存储的文件夹路径,分割块数。合并给定文件夹路径,和合并文件存储路径,要求文件分割合并不依赖文件名进行,能够合并时检测文件块是否缺失。大概写出来了,时间不够,没调通。
二轮,讨论项目的倒排索引的设计等等一系列的问题。
三轮,三个算法和逻辑题。
1. 介绍map reduce。给定select date,count(*),count(distinct userid) from A where date>*** and date<*** and uri like *** group by date.  数据表的字段是 date,uri,userid。讲讲要怎么map,怎么reduce来实现这个sql。将一块记录放到map节点内存中,选出符合要求的记录,然后将每个date对应的记录去重userid后发到reduce节点,在reduce节点针对每个date统计不同userid的个数。
2. 怎么实时获得数字流的中位数。建立两个堆,一个最大堆,一个最小堆,按照一定规则,稍复杂插入实时数字,然后中位数就是堆顶数或者堆顶数的均值。
3. 一道智力题。20个人,戴着红帽子或者黑帽子,排成一队,每个人能够看到前面所有人的帽子颜色,他们只能说红或者黑一个字,如果他们猜对了自己帽子的颜色,他们就可以活命,否则处决。他们事先可以商定规则,如何才能使得尽量多的人活命。本来没什么头绪,面试官提示第20个人甘愿牺牲自己,最好结果是19个人活命。在猜出要利用红黑帽子数量的奇偶性质后,面试官提示最后一个人比如说喊出前面奇数帽子的颜色。最后完全答出来了。
感觉问得都是逻辑题和算法题。可能是自己没有做过大数据相关项目吧。也没问什么基础。#面经##春招##实习##Java工程师##大数据开发工程师##酷家乐#
全部评论
老哥,文件合并那题是啥思路
点赞 回复 分享
发布于 2019-04-16 19:50
好难啊。。。。
点赞 回复 分享
发布于 2019-11-02 13:23

相关推荐

服从性笔试吗,发这么多笔,现在还在发。
蟑螂恶霸zZ:傻 x 公司,发两次笔试,两次部门匹配挂,
投递金山WPS等公司10个岗位 >
点赞 评论 收藏
分享
贺兰星辰:不要漏个人信息,除了简历模板不太好以外你这个个人简介是不是太夸大了...
点赞 评论 收藏
分享
4 31 评论
分享
牛客网
牛客企业服务