宁德时代 大数据开发面经

更新:第一天晚上做完英语测评,第二天早上挂了(虽然测评确实没认真做)
————————————————————————————————————
40min
面试体验感超好,德子好感+1
Spark sql了解吗?Dateframe 是啥(不会)
项目里数据怎么拉的?
Flume+kafka+flume+hdfs
有什么过滤器吗?:3个flume拦截器 判断文件类型+时间戳过滤器+落hdfs小文件检测
数据量:千万 flume拉取时间是多少?(不会,瞎编的10分钟有兄弟了解吗)
Spark小文件怎么处理
Kafka 的整体结构:broke+produce+consume (这边比较细)
Jvm:可达性分析+引用计数+gc+jvm内存结构+volatile
Spark 数据倾斜:加盐减盐,广播小表,提高并行度,map聚合等等
反问:业务(之前一直以为德子的业务应该是写sql,但是后面了解到德子的业务很大,有搞spakr的有搞flink的有搞kafka的等等,给德子点赞)
还有下一面吗:过了的话会有,业务主管面
还有其他八股,无手撕#面经#
全部评论
😂看项目应该是尚硅谷 spark问了这么多吗?😨
点赞 回复 分享
发布于 2023-09-19 17:11 辽宁
大佬 想问一下你面的是什么部门
点赞 回复 分享
发布于 2023-09-26 00:38 山东

相关推荐

03-12 10:27
已编辑
华东师范大学 Java
1. 自我介绍2. 项目介绍3. 详细介绍一下抽奖项目的流程(穿插一些八股,分布式锁……定时任务……缓存数据库一致性……防止超卖……ThreadLocal如何从父线程传递到子线程……)(有些忘了)共计十分钟场景共计35分钟,基本都是连续追问问道无法回答为止,问答顺序记不清楚了场景题1:4.线程池的实现原理(八股)5.有一千个任务在线程池内,任务的执行时间各不相同(大数据场景),我们希望同时解决多个问题包括    (1) 长任务超时会保留数据,不会重来,不能重新发任务    (2) 多个执行的任务中,有的时间长有的时间短,我们不希望长任务的长时间执行导致短任务的饥饿    (3) 短任务的结果能优先看到场景题2:6.看你是图数据的科研方向,如果一张日活用户图上有4000w个用户点,点赞/关注都可以都可以作为边,考虑如何评价前二十(top 20) 的高质量用户并予以奖励?以什么作为评价指标?如何计算?如何让偏差率收敛到1-5%之内?7.单机无法计算的情况下,如何拆分?拆分原则是什么?如果分多台机器,那些会被分到哪些机器上?如何判定边界?如果判定了边界导致南北方人,或者不同文化背景的人所处的图不同,违反了b站的原则(不分具体的人只看质量,不能用相似类型评判质量)怎么办?你的划分还有效吗?(最后提示去看google的pagerank论文)8. 了解大数据相关内容吗(不了解)结束反问:1.使用语言?业务前景?服务对象?2. 4000w的具体场景?问实习时间实习时长等发面经求好运
查看11道真题和解析
点赞 评论 收藏
分享
评论
6
20
分享

创作者周榜

更多
牛客网
牛客企业服务