获赞
142
粉丝
76
关注
6
看过 TA
2238
大连理工大学
2025
大数据开发工程师
IP属地:辽宁
熟练操作希沃白板,选我带你看股市通
私信
关注
美团 数开 30k+签+股 其他
0 点赞 评论 收藏
分享
0 点赞 评论 收藏
分享
被ks恶心完已经有点想摆了偷了大家很多面经,回馈一下,也欢迎数开的xdm交流一面:实习拷打15min如果有一个指标你会怎么去加工,逻辑会怎么去写一个hql提交的具体执行过程mr的整体过程spark跑任务有几个阶段Hadoop生态都有什么;HDFS组成部分,存储逻辑数据倾斜,有没有实际优化过对数仓的理解(基本建模/分层所有的八股都问了一遍)hive和mysql之间的差异,mysql怎么实现毫米级的响应,b+树为什么快想汰换表会怎么做sql1 把string结构的数据转换成sql可用的数据结构,然后算中位数sql2同时在线二面:实习拷打20min对数仓建模的认识,实操过程你是怎么做的flink-cdc是什么,有没有遇到过什么问题phoenix,hbase是做什么的hql提交后做了什么事情最后把数据生成出来逻辑执行计划和物理执行计划有什么区别,为什么要分这两个左表五条数据left join右表三条数据,结果是几条map join知道吗?sql:一张表记录学生和得分情况,展示分数高于平均分的学生id和分数三面:实习拷打20min(跟一二面不同的是他更在乎实操的细节)spark调优场景20min(都是基于实习的场景给我提问题)MR重启任务从哪开始跑,如果长时间任务(T+2)怎么减少重启对时效性的影响算法:滑动窗口总结下来感觉一二面比较重基础,三面比较注重实操和宏观思维吧,但应该也因面试官而异实习和项目留点不详细的部分能分担不少八股火力
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务