9.2-小红书-数据开发-一面+二面

一面:30min

自我介绍

实习和项目内容

数仓常问的分层、维度建模等

八股,基本是按照简历问的

Spark和MR区别和优劣?

Spark的Shuffle和MR的Shuffle的区别?

Standalone模式是怎么调度资源的,Yarn模式有什么变化?

Kafka消息投递保证机制?有出过问题吗?怎么解决?

介绍一下HBase?优缺点?使用场景?

LSM数和B+树区别?

SQL题:

同时在线最多人数

反问:部门做什么的,有什么需要改进

二面:40min

项目介绍(实时+离线数仓,我整合到一起了)

为什么要设计流处理和批处理两条线?

采集组件的技术选型区别?

做的业务主题介绍一下?为什么要这样划分?

Flink学的怎么样,介绍一下?

Flink和Spark streaming区别?

Flink checkpoint?

Flink怎么实现exactly once?

实时数据落到实时数仓的流程?

实时写入HDFS出现过小文件问题吗?怎么处理的?

数据湖知道吗?和数据仓库区别?用过哪一种?

算法题:安排会议室

反问:面试表现?表达方面需要改进。面试官表示项目几乎都差不多,问我是不是都从网上学的,希望能多思考

全部评论
大佬牛皮,居然数据开发实习都要问算法题吗,想入门数据开发,感觉要学的东西太多了
1 回复 分享
发布于 2023-09-03 10:27 北京
有后续吗
点赞 回复 分享
发布于 2023-09-03 10:54 北京
大佬太强了,我xhs直接用人部门淘汰
点赞 回复 分享
发布于 2023-09-03 12:27 上海
笔试a了多少?啥bg啊,为啥我笔完没消息了
点赞 回复 分享
发布于 2023-09-03 21:09 浙江
大佬太强了,我xhs直接用人部门淘汰
点赞 回复 分享
发布于 2023-09-04 12:53 四川
约hr了吗
点赞 回复 分享
发布于 2023-09-05 20:58 北京
楼主笔试啥时候做的
点赞 回复 分享
发布于 2023-09-08 18:53 澳大利亚
楼主,拿到oc了吗
点赞 回复 分享
发布于 2023-09-13 23:25 浙江

相关推荐

11-11 14:21
西京学院 C++
无敌混子大王:首先一点,不管学校层次怎么样,教育经历放在第一页靠上位置,第一页看不到教育经历,hr基本直接扔掉了
点赞 评论 收藏
分享
面试摇了我吧:啊哈哈面试提前五个小时发,点击不能参加就是放弃
点赞 评论 收藏
分享
评论
6
20
分享
牛客网
牛客企业服务