秋招面经-腾讯&字节&阿里-Java&大数据
秋招的同学可以看看贝壳哦,贝壳开放了大量校招hc,9.7 9.8面试 一天走完全部面试流程
推荐码:ISKM8A
campuske.zhiye.com
填写推荐码 ISKM8A ,简历会被优先处理
数仓的表的设计的原理
数仓的分层原因以及好处
实时数仓使用的架构选择
Kafka简单介绍下
如何提高Kafka的吞吐量
生产者角度
消费者角度
介绍下Flink的watermark
场景题
上游中Kafka是每一分钟向Flink写一次
watermark水印的设置
窗口的关闭时间 10:00---10:05,什么时候会关闭窗口 (10:06关闭窗口)
clickhouse与ES的技术选型
clickhouse对比mysql,为什么使用clickhouse
离线数仓
hive的引擎比较 spark MR tez
hive on spark 的语法兼容性问题
shuffle过程 MR spark
Java SDK 是啥。。。
场景题
有一批数据 有id有名字 如何设置一个数据结构 在大数据场景下 实现对于数据根据id与名字进行查找
基于Flink实时数仓的业务场景说一下
如果出现了反压,如何去排查问题
flink与spark对比
Hbase的底层存储方式
Hbase读数据的流程 范欣欣博客里面的比较详细
mysql的索引结构
mysql对比redis
Hadoop的基本框架
MR的基本流程
spark对比MR
MR如何规避shuffle
Kafka 如何保证自己的高吞吐量
Kafka的压缩算法 snappy LZ4
LZ4用的比较多,压缩比在35%
Kafka的高可用机制
Kafka如何保证消息的一致性
Hbase的基本架构
Flink的反压机制 两个版本
Flink的数据倾斜
算法
字符串中最长的无重复子串 力扣 3 需要自己设置case 覆盖
Java的三个特点
解释下多态
怎么实现多态的
类加载器
如何去实现自己的类加载器
arraylist linkedlist 的优缺点比较
hashmap 使用场景 并发问题
concurrenthashmap 实现
多线程下如何保证线程安全
Flink 实时计算
日活统计指标
CEP机制
interval join
旁路缓存
异步IO查询
数据量
链路压测
面向对象与面向过程,具体区别,为什么面向过程快
sql是什么类型的语言
活锁与死锁
分布式锁如何实现 是否会出现死锁
redis的高可用方案
运行时异常与编译异常的区别
链表判断有环,为什么快慢指针会相遇
如何终止线程
string stringbuffer stringbuilder
TCP握手 为什么三次 挥手为什么四次
hdfs高可用
hdfs的NN联邦机制
实时数仓Kafka中的删除策略
实时数仓主要考虑时效性,真正的数据存储要依靠离线数仓,所以可以对Kafka定期的删除
可以进行数据迁移
mysql的索引对比
mysql与redis对比
Hadoop的整体结构
mapreduce的流程
spark为什么相对于MR速度更快
MR如何想办法去规避shuffle,使得MR的性能接近于Spark
使用combiner进行预聚合
Kafka的高性能
Kafka的压缩策略 LZ4的压缩比为35%
Kafka的批量发送的缓冲区大小
顺序读写
Kafka的高可用
消息的一致性
Kafka消费者的幂等性
Hbase整体架构
Flink的两个版本机制
数据倾斜的解决
HashMap 并发会出现什么问题
介绍下JVM虚拟机
抽象类和接口的区别
介绍下Hive的底层文件系统和计算引擎
Kafka为什么具有高吞吐量
HDFS的如何保证可靠性和稳定性
MR的可靠性和稳定性
Hive数据倾斜问题的解决
Flink业务数据的动态分流如何实现
日活统计的状态机制,使用了哪些flink状态机制
状态的生命周期,如何限制的
任务失败的情况遇到吗
Flink的故障策略 重启策略
Flink重启需要读取哪些数据
旁路缓存,异步IO查询解释下
缓存与数据库不一致问题如何解决。
Flink的异步IO解释一下
Mysql的隔离级别
隔离级别的实现原理
读未提交会存在脏写问题吗
Mysql的默认隔离级别是什么
访问主题宽表中窗口机制数据倾斜解决方案?
什么原因会导致窗口的数据倾斜?
离线数仓分层解释一下?
拉链表的作用解释下
商品实付分摊解释下实现原理
Flink消费Kafka的时候有积压问题,如何解决
Flink消费Kafka如何保证数据不丢失
接口和抽象类的区别
List如何遍历
HashMap的工作原理
synchronized工作机制
java进程占用内存比较大,如何检查
JVM调整堆内存、栈内存的方法
算法题
给出一个NxN的矩阵,每一行是递增的,输入k,输出K最大的数字