字节大数据一二三面+HR面
字节date数据中台 实习一面(8-17,47min)
自我介绍
项目(两个项目都问了)
数据倾斜问题怎么解决
MR 过程中有几次排序过程
sql:公交车人数最高的时间段
算法:二叉树层次遍历
一个男孩,一个女孩的概率问题
瓶盖换水问题
维度建模步骤
-
选择业务处理
-
定义粒度
-
选择维度
-
确定事实
字节date数据中台 二面(8.20 1h 7min)
自我介绍
根据自我介绍聊天(聊了很多)
离线处理和实时处理的区别
主要考察 wordcount 细节
Map默认是HashPartitioner 如何自定义分区
hadoop 三大组件简介
SeconderyNameNode 的作用
计算机基础知识系列
数据库索引 InnoDB 数据引擎的特点
事务的隔离级别
数据库 三大范式
tcp 为什么是三次握手
tcp 如何保证可靠性连接
网络7层架构,各个层都是干什么的
算法题
非严格单调递增 查找最靠前的目标数
二叉树前序遍历
字节 data数据中台 三面(8.23 50min)
主要是对知识的理解深度
如何学习的大数据相关的知识
介绍一下 YARN
YARN 的任务提交流程
有没有读过 MapReduce 相关的论文
Mapreduce 为什么适合适合大数据存储
PB级大数据处理时,比如join操作,如何优化
job, task,work 的区别(涉及spark 不会)
在集群计算的时候,什么是集群的主要瓶颈(磁盘IO(正解),CPU,内存,网络带宽)
MapReduce 处理过程
sql (比较简单,但我没转过来)
Hive 内部表和外部表的区别
字节数据中台 HR面(8.24 20min)
自我介绍
怎么学习的大数据
相对于专业大数据有什么有时
业务结合能力强吗
办公地地点
有没有面过别的地方
反问
实习时间几点到几点
薪资待遇
#大数据开发##面经##字节跳动##校招##大数据开发工程师#