跟谁学大数据研发工程面经
1面后隔一周2面,2面后隔一周hr就说通过了,发了意向offer
一面
1、本科对于大数据方面的课程有吗?2、数据结构了解过吗?
3、数组和链表的区别?
4、链表和数组插入数据的时间复杂度?
5、用链表模拟栈的功能?
6、JAVA本身有了解吗?会看JAVA的资料吗?
7、JAVA里面StringBuffer和String有了解吗?
8、 怎么理解线程安全和线程不安全?
9、 怎么解决线程安全问题?(像StringBuffer怎么解决的?)
10、死锁怎么产生的?
11、有什么解决办法?
12、看你了解scala,python,c++,但自己还是用JAVA多点是嘛?
13、对于java的深拷贝和浅拷贝有过了解吗?
14、JVM的原理有过了解吗?跑JAVA任务的时候JVM怎么运作的?
15、对于你自己学大数据这块,都了解过哪些组件?
16、平时接触最多是哪种?自己最熟悉的是哪种?
17、hadoop或者hdfs和kafka的在使用上有什么不同?或者使用场景有什么不同?
18、对kafka本身有什么了解?kafka的Topic了解吗?原理,topic的结构设计,Topic是个什么东西?
19、消费的是leader分区的还是follwer也可以读?
20、为什么不能读follwer?
21、什么情况会产漏读呢?消费者可能会丢消息。
22、知道ISR队列?
23、一般leader怎么判断follwer挂掉?
24、超时时间一般是多少?
25、kafka通过什么方式学?
26、对自己平时做项目或者学习这块,可以说一两点自己的心得体会吗?或者遇到的问题怎么解决?
27、项目中遇到的问题,怎么解决的?
28、反问:
二面:
1、你有参加过什么实习吗?
2、你的集群搭了什么组件。
3、hadoop集群和Hive的版本是什么?
4、Impala和Presto了解吗?
5、数仓分层这块你怎么理解的?
6、维度建模问题?
7、MapReduce一般分为几个步骤?二次排序你写过吗?
8、shuffle?
9、UDF和UDTF?
10、实时这块怎么弄的?
11、SparkStreaming双流join是怎么join的?你这个是通过一个SparkStreaming程序写的还是两个SparkStreaming程序写的?null值反查redis是怎么实现的?
12、你了解ES主要是做什么的吗?ES的数据更新需要怎么操作?可以直接更新吗?还是说要先PUT再GET?
13、HBase你用来干嘛的?
14、scala会写吗?scala和JAVA写的时候有什么明显的差异?
15、python你是简单了解还是用的比较多?
反问
面试体验很好,一面和二面的面试官都很有耐心。
#面经##校招##高途##数据开发工程师#