欢聚集团大数据开发一、二面
9.16一面
1.简单介绍一下hadoop是什么东西?
2.简单说一下HDFS高可用,namenode高可用
3.详细说下namenode的高可用和实现原理
4.2.0中使用qjm架构听过吗?
5.在HDFS上面hadoop3和hadoop2的区别?
6.yarn是什么作用?有什么特性?知道什么说什么
7.nodemanager所谓的空闲是指什么?
8.yarn的资源管理主要是管理什么资源?就是说你要申请资源的话,主要是申请什么资源
9.yarn资源调度有几种调度算法?
10.yarn的公平分配是啥?
11.MySQL有几种存储引擎,大概说下
12.InnoDB,MyISAM的使用场景和优缺点
13.在什么情况下会选择使用InnoDB和MyISAM
14.为什么InnoDB用update,insert会快呢?(查)
15.namenode存有元数据,那么主要存的是些什么元数据呢?有什么信息?分别怎么获取?
16.HDFS写三副本的文件是如何写的?
17.写的过程中有一台datanode挂掉怎么办?
18.平时有用linux吗?
19.说一下用过的linux命令?
20.mysql中语句执行的特别慢会怎么去排查? 或者说语句执行有没有用到索引什么的?怎么看?
21.怎么去判断有没有用到索引呢?你先跟我说下索引是什么吧?
22.创建索引和使用索引要注意的点?
23.有没有情况你创建了索引但是不生效的?
24.什么是线程?
25.线程和进程的区别?
26.如何在java中实现线程?
27.如果java程序在系统上运行时cpu占用特别高,响应速度特别慢,你会怎么排查?
28.对jvm了解吗?堆和gc了解什么?
算法题 俩个数组合并(5分钟)
反问
需要去学习什么知识(hadoop生态,linux知识去加强)
2.简单说一下HDFS高可用,namenode高可用
3.详细说下namenode的高可用和实现原理
4.2.0中使用qjm架构听过吗?
5.在HDFS上面hadoop3和hadoop2的区别?
6.yarn是什么作用?有什么特性?知道什么说什么
7.nodemanager所谓的空闲是指什么?
8.yarn的资源管理主要是管理什么资源?就是说你要申请资源的话,主要是申请什么资源
9.yarn资源调度有几种调度算法?
10.yarn的公平分配是啥?
11.MySQL有几种存储引擎,大概说下
12.InnoDB,MyISAM的使用场景和优缺点
13.在什么情况下会选择使用InnoDB和MyISAM
14.为什么InnoDB用update,insert会快呢?(查)
15.namenode存有元数据,那么主要存的是些什么元数据呢?有什么信息?分别怎么获取?
16.HDFS写三副本的文件是如何写的?
17.写的过程中有一台datanode挂掉怎么办?
18.平时有用linux吗?
19.说一下用过的linux命令?
20.mysql中语句执行的特别慢会怎么去排查? 或者说语句执行有没有用到索引什么的?怎么看?
21.怎么去判断有没有用到索引呢?你先跟我说下索引是什么吧?
22.创建索引和使用索引要注意的点?
23.有没有情况你创建了索引但是不生效的?
24.什么是线程?
25.线程和进程的区别?
26.如何在java中实现线程?
27.如果java程序在系统上运行时cpu占用特别高,响应速度特别慢,你会怎么排查?
28.对jvm了解吗?堆和gc了解什么?
算法题 俩个数组合并(5分钟)
反问
需要去学习什么知识(hadoop生态,linux知识去加强)
9.24二面
1、hive怎么通过hadoop去构建底层存储
2、hive核心的元数据的表有哪些,一个hive表是怎么映射到元数据里面
3、hive优化,数据倾斜怎么处理
4、sqoop的工作流程,sqoop有什么参数
5、flume熟悉吗?
6、讲讲你怎么数据仓库怎么做的?
7、让你去保障数据质量的话应该怎么做?
算法1:写一个单例类,运行的时候生成且并发时候保证线程安全
算法2:LRU
反问
还需要学习啥(java基础要去学好,组件的话要再深的去了解原理)
2、hive核心的元数据的表有哪些,一个hive表是怎么映射到元数据里面
3、hive优化,数据倾斜怎么处理
4、sqoop的工作流程,sqoop有什么参数
5、flume熟悉吗?
6、讲讲你怎么数据仓库怎么做的?
7、让你去保障数据质量的话应该怎么做?
算法1:写一个单例类,运行的时候生成且并发时候保证线程安全
算法2:LRU
反问
还需要学习啥(java基础要去学好,组件的话要再深的去了解原理)
感觉凉了,很想进但是二面答的很差
#欢聚集团##面试题目#