唯品会大数据开发二面

1.hadoop组成2.讲一下spark on yarn提交流程3.spark宽窄依赖怎么划分4.spark为什么会存在shuffle5.说一下spark on Yarn两种运行模式:Cluster,client模式6.怎么避免死锁7.一个生产线程,一个处理线程,在服务需要退出的时候,怎么确保所有事件处理完了8.CPU消耗很高怎么排查9.接到一个需求怎么做?10.HQL优化详细讲一下11.数据倾斜是怎么发现的
全部评论
很常规的题啊
点赞 回复 分享
发布于 03-07 11:03 浙江
👍
点赞 回复 分享
发布于 03-01 17:10 山东
接好运
点赞 回复 分享
发布于 02-24 00:28 上海
这公司挺能泡的,年前面的,前天才给我发了offer,已拒
点赞 回复 分享
发布于 02-15 11:53 广东
佬是官网投递还是b o s s投递啊
点赞 回复 分享
发布于 02-05 20:00 安徽

相关推荐

#牛客AI配图神器#上来自我介绍,个人信息、在校所学专业、毕业时间、为什么学习大数据。询问出生年份。(没懂为什么专门问这个)介绍项目,离线数仓的五层是怎么设计的,DataX做首日的全量采集、Maxwell做后续每日的增量采集,Flume传输数据,Kafka起缓存作用,解耦各个组件。大数据竞赛拿了全国一等奖,那么这个竞赛中做的是什么业务?学校主修课是什么,大数据是否是自学?介绍一下简历中的离线数仓。说一下Maxwell的底层实现原理。讲一下Hive On Spark引擎的特点。介绍一下简历中的实时数仓。说一下checkpoint机制和精准一次。Docker的常用命令。Doris需要更新数据吗,怎么更新数据的,是用update吗?Doris在项目中的作用。Kafka的偏移量需要手动维护吗。项目的数据来自哪里,是真实的数据吗?数据量有多少,能达到什么级别,有一亿条数据吗?HBase在项目中是怎么使用的,为什么维表存到HBase中?为什么没有存到Redis中?FastJson了解吗,说一下。SpringBoot的拦截器和过滤器的区别。现在是否在校?反问工作压力大吗?公司有食堂吗?(我在想没食堂 可以买拼好饭吃😋)刚才回答的内容还算可以吗?(面试官:回答得没问题,学生能学到这个程度,已经可以了)写面经攒人品,希望能一把过#数仓面试##数据开发##数仓开发#
查看19道真题和解析
点赞 评论 收藏
分享
评论
3
18
分享

创作者周榜

更多
牛客网
牛客企业服务