秋招面经-腾讯&字节&阿里-Java&大数据

秋招的同学可以看看贝壳哦,贝壳开放了大量校招hc,9.7 9.8面试 一天走完全部面试流程

推荐码:ISKM8A

campuske.zhiye.com

填写推荐码 ISKM8A ,简历会被优先处理

数仓的表的设计的原理

数仓的分层原因以及好处

实时数仓使用的架构选择

Kafka简单介绍下

如何提高Kafka的吞吐量

生产者角度

消费者角度

介绍下Flink的watermark

场景题

上游中Kafka是每一分钟向Flink写一次

watermark水印的设置

窗口的关闭时间 10:00---10:05,什么时候会关闭窗口 (10:06关闭窗口)

clickhouse与ES的技术选型

clickhouse对比mysql,为什么使用clickhouse

离线数仓

hive的引擎比较 spark MR tez

hive on spark 的语法兼容性问题

shuffle过程 MR spark

Java SDK 是啥。。。

场景题

有一批数据 有id有名字 如何设置一个数据结构 在大数据场景下 实现对于数据根据id与名字进行查找

基于Flink实时数仓的业务场景说一下

如果出现了反压,如何去排查问题

flink与spark对比

Hbase的底层存储方式

Hbase读数据的流程 范欣欣博客里面的比较详细

mysql的索引结构

mysql对比redis

Hadoop的基本框架

MR的基本流程

spark对比MR

MR如何规避shuffle

Kafka 如何保证自己的高吞吐量

Kafka的压缩算法 snappy LZ4

LZ4用的比较多,压缩比在35%

Kafka的高可用机制

Kafka如何保证消息的一致性

Hbase的基本架构

Flink的反压机制 两个版本

Flink的数据倾斜

算法

字符串中最长的无重复子串 力扣 3 需要自己设置case 覆盖

Java的三个特点

解释下多态

怎么实现多态的

类加载器

如何去实现自己的类加载器

arraylist linkedlist 的优缺点比较

hashmap 使用场景 并发问题

concurrenthashmap 实现

多线程下如何保证线程安全

Flink 实时计算

日活统计指标

CEP机制

interval join

旁路缓存

异步IO查询

数据量

链路压测

面向对象与面向过程,具体区别,为什么面向过程快

sql是什么类型的语言

活锁与死锁

分布式锁如何实现 是否会出现死锁

redis的高可用方案

运行时异常与编译异常的区别

链表判断有环,为什么快慢指针会相遇

如何终止线程

string stringbuffer stringbuilder

TCP握手 为什么三次 挥手为什么四次

hdfs高可用

hdfs的NN联邦机制

实时数仓Kafka中的删除策略

实时数仓主要考虑时效性,真正的数据存储要依靠离线数仓,所以可以对Kafka定期的删除

可以进行数据迁移

mysql的索引对比

mysql与redis对比

Hadoop的整体结构

mapreduce的流程

spark为什么相对于MR速度更快

MR如何想办法去规避shuffle,使得MR的性能接近于Spark

使用combiner进行预聚合

Kafka的高性能

Kafka的压缩策略 LZ4的压缩比为35%

Kafka的批量发送的缓冲区大小

顺序读写

Kafka的高可用

消息的一致性

Kafka消费者的幂等性

Hbase整体架构

Flink的两个版本机制

数据倾斜的解决

HashMap 并发会出现什么问题

介绍下JVM虚拟机

抽象类和接口的区别

介绍下Hive的底层文件系统和计算引擎

Kafka为什么具有高吞吐量

HDFS的如何保证可靠性和稳定性

MR的可靠性和稳定性

Hive数据倾斜问题的解决

Flink业务数据的动态分流如何实现

日活统计的状态机制,使用了哪些flink状态机制

状态的生命周期,如何限制的

任务失败的情况遇到吗

Flink的故障策略 重启策略

Flink重启需要读取哪些数据

旁路缓存,异步IO查询解释下

缓存与数据库不一致问题如何解决。

Flink的异步IO解释一下

Mysql的隔离级别

隔离级别的实现原理

读未提交会存在脏写问题吗

Mysql的默认隔离级别是什么

访问主题宽表中窗口机制数据倾斜解决方案?

什么原因会导致窗口的数据倾斜?

离线数仓分层解释一下?

拉链表的作用解释下

商品实付分摊解释下实现原理

Flink消费Kafka的时候有积压问题,如何解决

Flink消费Kafka如何保证数据不丢失

接口和抽象类的区别

List如何遍历

HashMap的工作原理

synchronized工作机制

java进程占用内存比较大,如何检查

JVM调整堆内存、栈内存的方法

算法题

给出一个NxN的矩阵,每一行是递增的,输入k,输出K最大的数字

全部评论

相关推荐

全流程介绍:在BOSS上投的简历,第一天投第二天约一面(约到了两天后)当天HR通知我顺利通过面试,问我什么时候约二面,于是我就约到了当天晚上。当天二面完后半小时后HR通知二面顺利通过,说需要加一轮技术面,问我什么时间合适。当时已经周五,所以三面约到了下周一。周一上午面完三面,下午HR通知顺利通过,问我什么时候有时间参与下HR面。于是约到了三面的当天晚上。面试官表示两个工作日之内会收到offer。不得不说字节的HR效率是真的高,借此机会我将自己一二三面做整理;以来是有个记录、二来希望可以帮到之后的兄弟姐妹们。  1、自我介绍    讲了一下自己的当前情况,介绍了一下对大数据开发两个方向上的理解;介绍了下自己的一段滴滴实习经历+自己写的项目。表示了自己会有写技术博客的习惯,取得了4W+阅读量此外粉丝量也即将达到2K人。  2、深挖两个项目 - 大部分时间    面试官对实习经历特别感兴趣,我提到了几个亮点:Spark调优+物化视图中间层建设+实时数仓经历,都被扒了个底朝天。此外面试官还会根据你写的项目来问你八股的问题,比如我分布式文件系统的项目,他问我使用什么数据结构来存储元数据的,我回答说HashMap,于是他就问了HasMap的底层原理。(大家在准备的时候一定要好好准备)  3、计算机网络中:在地址框输入域名后到页面展示经过了什么?    绝了,还好考研的时候学过没忘哈哈哈  4、Bloom Filter与BitMap    巧了,虽然BitMap没接触过,但是Bloom Filter在学习HBase的时候学过,所以答得还可以。作用、存在什么问题..应用场景等等。  5、HashMap底层原理    刚好复习到了这个知识点,因为上一次找实习的时候,当时是第一次面试,美团面试官也是根据我的项目问出了这个题。(所以说大家一定要好好准备项目相关八股)。  6、StarRocks中的表模型    提前准备了,面试的时候往这上面引导,面试官顺理成章的问了,我也顺理成章的答了出来。  7、StarRocks如何实现更新 (读时更新、写时更新)    这个地方不是很了解,面试官跟我讲了一下:Merge-on-Read和Merge-on-Write  8、StarRocks中的关联方式    这里答了出来,但是没答全;面试官同样跟我讲了一下;全程和蔼,可以让面试者很轻松自信。  代码题 ;动态规划,最小子数组和问题    没什么好说的,给我简单爽了。  面试时长55分钟,很无奈我找到是数仓实习,这个岗位却是做计算引擎开发(属于后端开发范畴);本来以为凉了,但是面试官表示开发技术不是问题,进去之后会进行培养。在这里给自己的CSDN打一波广告,欢迎大家参考!:   https://ansentai.blog.csdn.net/
查看9道真题和解析
点赞 评论 收藏
分享
3 19 评论
分享
牛客网
牛客企业服务