有赞大数据开发四面(已OC)

赞下有赞,一下午走完流程,效率很赞!

8.29 有赞一面(40 min)基础为主

1、自我介绍

2、平常哪种变成语言?java/python

场景问题:用 ArrayList 和 LinkedList 存储相同的元素个数,哪个使用的空间更大?kafka 是如何解决大数据量的问题(高吞吐的原因)?如果不在允许增加分区的情况下,kafka 是如何解决生产者生产大大数量的,怎样防止数据的堆积?(没回答到点上,今天刚看过,其实可以从kafka 的特性上来说)
3、hive 的数据倾斜问题?数据倾斜有哪些现象,怎样判断?(二面时问,可能都是哪些问题造成的数据倾斜)分组时数据倾斜该如何解决,join 时该如何解决?(大表和大表join 的情况没说清楚)
sql :场景问题:两个表,字段为 uid,还有time(时间),如何拿出每个用户按时间 排序的前三条信息,具体怎么实现?说一下窗口函数底层是怎么实现的?说一下 哪些场景下使用窗口函数?
4、zookeeper 对于 kafka 的作用?
5、jvm:
1.说一下 java 的内存区域吧
2.GC 的收集算法发展史
3.多线程了解吗?说下线程如何实现?说下对线程池的理解
4、说一下 hashmap,为什么底层用红黑树,为什么在节点数目为 8 时链表才转化为红黑树,不从一开始就用红黑树存储呢?

有赞二面(项目为主)(45 min)
1、自我介绍
2、问项目
3、说一下你对推荐系统和广告系统的理解?二者有什么差别?大数据的应用层面来说,还有哪些应用?
4、spark 中三个表进行 join ,会有几个 stage?共有几种情况(大小表的情况是不相同的)
5、Hive 的数据倾斜问题?起因,各种情境下该如何解决?
6、系统性的工程项目做过没?想问有没有一些平台研发的经验(比如搭环境)
7、近期有没有做什么规划,平常是如何学习的?6、算法:判断链表有环存在

有赞三面(项目为主 )(40 min)
1.自我介绍
2.用户标签提取的 LDA模型讲一下?
3.你认为你这几个项目中做的最有成就感的是哪件?我说了实习的项目,q:其他人没有人想到吗?你是怎么想起来这样做的?实习中最兴奋的事情?
4.kafka 的高吞吐是如何实现的?
5.你用 hive/mysql/kafka/es  这些做过哪些事?

反问:业务场景和技术栈
面试官说了很多,推荐系统和广告系统都在做,主要是服务于商家的,大概记不清了 
有赞四面(45 min)
聊的挺开心,都是常规问题。

#面经##大数据开发工程师#
全部评论
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-09-13 19:42
楼主是现场面试还是视频面试
点赞 回复 分享
发布于 2020-09-15 11:05
我的是电话面试,是不是又被刷kpi了
点赞 回复 分享
发布于 2020-09-15 16:51
楼主,有赞没有hr面吗
点赞 回复 分享
发布于 2020-09-19 11:03
我算法给我转大数据了 然而我大数据就不怎么懂。。。。 在考虑要不要10月这波笔试了
点赞 回复 分享
发布于 2020-10-06 12:21
楼主你好,想请教一下 spark 中三个表进行 join ,会有几个 stage?共有几种情况 这个你是咋回答的呀? 不太懂🙃
点赞 回复 分享
发布于 2021-03-06 19:10

相关推荐

不愿透露姓名的神秘牛友
11-21 22:29
点赞 评论 收藏
分享
评论
7
21
分享
牛客网
牛客企业服务