脉脉大数据开发实习生一面

岗位JD

使用大数据组件对海量数据进行建模,参与数据仓库的的开发、维护及优化

岗位要求

  1. 计算机相关专业,对大数据有浓烈的兴趣
  2. 扎实的计算机基础,熟练使用python/java/scala其中至少一种语言
  3. 熟悉Hadoop生态体系,包括但不限于Hadoop/Hive/Spark/Clickhouse
  4. 学习能力强,强烈的责任心,具有较强的沟通能力及团队合作精神,细致耐心、积极主动
  5. 有大规模数据/日志处理经验,熟悉离线计算者优先

一面

  1. 自我介绍
  2. 对数仓分层、维度建模有什么相关的了解。数仓分层答的不是很好 磕磕绊绊 得加强 维度建模还行
  3. 项目是都跟着走完了还是?
  4. 维度建模分数据域和分层 主题域 分了哪些数据域 数据是怎么流向的 大概讲解下 数据域(交易域 流量域 用户域 工具域 互动域)
  5. 对hive的优化有什么了解?具体的优化措施
  6. 本科和硕士都是大数据相关 数仓大数据类相关的知识学过哪些
  7. hadoop三大件有哪些
  8. 简单讲一下mapreduce怎么跑起来的 mapreduce的流程 这个没讲好
  9. 简单讲一下shuffle的原理?
  10. 两道hive sql题 简单题 1:排名函数 2 多行转多列
  11. 反问:我问了 工作时间(早10晚7)和工作氛围(和蔼平和)怎么样?最近部分有项目在忙吗?

以后可以问 面试官对我有一些什么建议吗?技术上,简历上,面试上等?

SQL题总结

第一题 窗口函数

select a,second_c
from (
  select a,second_c,
  row_number() over (partition by a order by b) rank
  from t2
where rank=2
)t
group by a

问题 子查询里面的 where 不能直接用rank判断 这样会报错 where 应该写在外面 且是c列 不是second_c

第二题

select 
    year,
    concat_ws(',', collect_list(case when department = 'A' then person_count else null end))  col_A,
    concat_ws(',', collect_list(case when department = 'B' then person_count else null end))  col_B
from t
group by year;


全部评论
还好,问的不是很深
1 回复 分享
发布于 01-31 21:51 上海
大佬
点赞 回复 分享
发布于 01-15 16:28 河南
我们组刚走一个 就招人了😅
点赞 回复 分享
发布于 01-15 21:21 北京

相关推荐

全流程介绍:在BOSS上投的简历,第一天投第二天约一面(约到了两天后)当天HR通知我顺利通过面试,问我什么时候约二面,于是我就约到了当天晚上。当天二面完后半小时后HR通知二面顺利通过,说需要加一轮技术面,问我什么时间合适。当时已经周五,所以三面约到了下周一。周一上午面完三面,下午HR通知顺利通过,问我什么时候有时间参与下HR面。于是约到了三面的当天晚上。面试官表示两个工作日之内会收到offer。不得不说字节的HR效率是真的高,借此机会我将自己一二三面做整理;以来是有个记录、二来希望可以帮到之后的兄弟姐妹们。  1、自我介绍    讲了一下自己的当前情况,介绍了一下对大数据开发两个方向上的理解;介绍了下自己的一段滴滴实习经历+自己写的项目。表示了自己会有写技术博客的习惯,取得了4W+阅读量此外粉丝量也即将达到2K人。  2、深挖两个项目 - 大部分时间    面试官对实习经历特别感兴趣,我提到了几个亮点:Spark调优+物化视图中间层建设+实时数仓经历,都被扒了个底朝天。此外面试官还会根据你写的项目来问你八股的问题,比如我分布式文件系统的项目,他问我使用什么数据结构来存储元数据的,我回答说HashMap,于是他就问了HasMap的底层原理。(大家在准备的时候一定要好好准备)  3、计算机网络中:在地址框输入域名后到页面展示经过了什么?    绝了,还好考研的时候学过没忘哈哈哈  4、Bloom Filter与BitMap    巧了,虽然BitMap没接触过,但是Bloom Filter在学习HBase的时候学过,所以答得还可以。作用、存在什么问题..应用场景等等。  5、HashMap底层原理    刚好复习到了这个知识点,因为上一次找实习的时候,当时是第一次面试,美团面试官也是根据我的项目问出了这个题。(所以说大家一定要好好准备项目相关八股)。  6、StarRocks中的表模型    提前准备了,面试的时候往这上面引导,面试官顺理成章的问了,我也顺理成章的答了出来。  7、StarRocks如何实现更新 (读时更新、写时更新)    这个地方不是很了解,面试官跟我讲了一下:Merge-on-Read和Merge-on-Write  8、StarRocks中的关联方式    这里答了出来,但是没答全;面试官同样跟我讲了一下;全程和蔼,可以让面试者很轻松自信。  代码题 ;动态规划,最小子数组和问题    没什么好说的,给我简单爽了。  面试时长55分钟,很无奈我找到是数仓实习,这个岗位却是做计算引擎开发(属于后端开发范畴);本来以为凉了,但是面试官表示开发技术不是问题,进去之后会进行培养。在这里给自己的CSDN打一波广告,欢迎大家参考!:   https://ansentai.blog.csdn.net/
查看9道真题和解析
点赞 评论 收藏
分享
评论
5
40
分享
牛客网
牛客企业服务