字节跳动大数据开发工程师-电商业务面经

许愿offer
1面:
1、为什么换了方向呢?
2、二叉树的广度优先遍历和深度优先遍历。
3、TCP的三次握手和四次挥手。
4、平时编程用什么语言?
5、kafka的消息有序吗?当时是怎么了解kafka这些的?kafka这块是看的相关的书籍还是博客呢?kafka怎么回溯数据?(下游消费kafka里的数据,数据丢了,要重新消费昨天的数据怎么做这个回溯呢?)
kafka的数据保存在哪呢?像这种被消费之后的数据。
6、sqoop将数据导入数仓吗?底层原理是什么样的?
7、tez运行,你知道hive有哪些引擎?
8、有自己写过udf,udtf吗?udtf写的是什么?
9、hive窗口函数了解吗?了解哪些?row_number、rank、dense_rank的区别?
10、sql题,求连续活跃5天的用户。
11、算法题,实现微信发红包,输入是红包数和总金额,实现随机分配。(期望要一样)

2面:
1、数据是哪里来的?日志数据怎么实现。是动态变化的吗?
2、了解flink吗?
3、数仓分层每层是做什么的?
4、哪个技术栈比较熟?
5、kafka的高可用是怎么保证的?
6、kafka遇到什么性能瓶颈?
7、了解kafka和其他MQ之间的区别吗?比如说activeMQ。
8、kafka的哪些设计会提高它的性能。
9、hdfs的mr的shuffle机制?
10、hive里面map和reduce的数量怎么确定?它的优先级是怎么样的?还有其他的优化吗?除了参数的影响(哪些参数可以调控map的数量)。
11、数据倾斜简单介绍一下。怎么优化?
12、mapjoin了解吗?还有其他的理解吗?其他的join有了解吗?比如说桶的优化。
13、讲下sparkstreaming的大概原理。
14、spark为什么比mr快?
15、spark的stage的划分是怎么划分的?是从前面开始还是从后面开始的顺序?
16、JVM的内存模型讲一下。
17、你觉得你自己的优势和不足是什么?
18、算法题,一个数组里面每个元素表示每天的股票价钱,怎么样买入和卖出能赚最多的钱?只能先买入再卖出。

3面:(以为是聊项目,谈人生理想,没想到全程在问基础写算法题)
自我介绍
简单介绍下你的项目
基础问题:
java里面的几个底层原理。hashmap冲突了怎么处理的?链表太长,冲突太多了怎么办?treemap底层是怎么实现的?我说不会,面试官就让我想下你觉得能怎么实现?
简单解释一下多线程和多进程有什么区别?
mysql的索引?b+树相对于b树有什么优点?
mr的combiner主要是做什么?
算法题
1、n个个位数,全排列组成一个整数。怎么找到最近的下一个比他大的数。时间复杂度要求o(n)。(没写代码,只让我讲思路)
2、返回二叉树的镜像,非递归算法。
3、抖音用户浏览视频日志 TableA(date, user_id, video_id), 统计2020.03.29观看视频最多的前5个user_id(相同视频要排重)。
3面面试官虽然感觉有点凶,但句句在理,很耐心的一点点揪出我代码里的错误,让我改正。前2面的面试官也很超有耐心,面试体验感太好了。

#面经##字节跳动##大数据开发工程师##校招#
全部评论
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-09-20 09:27
我感觉你做的项目应该是电商数仓
点赞 回复 分享
发布于 2020-09-20 10:05
是北京的吗
点赞 回复 分享
发布于 2020-09-20 10:33
楼主有推荐的大数据学习路线吗,我目前只看过入门视频,知道各组件大体负责什么,简单的搭过环境😅
点赞 回复 分享
发布于 2020-09-21 09:45
kafka回溯消费那个,老哥怎么回答的呢
点赞 回复 分享
发布于 2020-09-21 20:08
请问算法题给多久时间写出来呀?
点赞 回复 分享
发布于 2020-09-22 21:18
您好,楼主收到意向书了吗
点赞 回复 分享
发布于 2020-09-30 02:06
为什么选大数据啊
点赞 回复 分享
发布于 2020-11-01 16:53
请问准备了什么项目哇
点赞 回复 分享
发布于 2021-02-04 15:03
同问 能问下大体准备了什么样的项目嘛 举个例子也行
点赞 回复 分享
发布于 2021-02-14 17:31
请问还有hr面吗
点赞 回复 分享
发布于 2021-02-16 04:33
请问可以加微信咨询一下咩,上海电商给我打电话让我去面试了,想请教一下
点赞 回复 分享
发布于 2021-08-12 22:58

相关推荐

03-10 15:22
已编辑
北京邮电大学 Java
3.3面-3.7挂面试官感觉比较”淡“?不知道咋形容,但没开摄像头,这时其实已经感觉有点像kpi了。后面面试中有时候说了一大堆,说完了后会楞一会儿不说话,感觉没有怎么仔细听自我介绍,有点紧张,简单说了下学校专业和技术栈,稍微介绍了一下项目,但其实简历都有,没啥新的。面试官介绍了下部门业务。八股,35min+:介绍一下java的集合和底层逻辑等等。一口气从list说到queue,重点说了说arraylist和hashmap,前者分析了扩容后者说了底层实现和扩容,其他的基本就是举例对比底层实现什么的。hashmap线程安全吗,什么情况线程不安全。要保证线程安全该怎么做。介绍一下threadlocal。答了一下threadlocalmap和线程隔离。追问了可能出现的问题。忘了,后续复盘觉得可能是因为key的弱引用导致gc之后内存浪费,或者线程池复用没及时清理导致数据污染?问了线程池,应用场景,参数介绍。后续复盘发现unit说漏了。redis持久化机制。RDB和AOF事务隔离机制。顺便边说便把事务并发问题也说了。mysql索引。说了一下索引选型和每个结构与B+树的对比。jvm内存区。简单说了一下,两个版本。gc算法。单例模式,设计原则和应用场景,实现方法。算法,10min-:给了15min。最长不重复字串,刚刷过,秒了。介绍了一下思路。全程45min左右,无反问。#牛客AI配图神器#
查看13道真题和解析
点赞 评论 收藏
分享
评论
9
112
分享

创作者周榜

更多
牛客网
牛客企业服务