着陆页科技-数开实习面经

1. 自我介绍
2. java基础。equal和‘==’区别、&和&&区别、常用集合、list的实现类、list和set区别、继承特性、list和set区别。
3. 介绍一下hadoop,说一下上传数据的流程。
4. yarn的作用,资源调度过程。
5. mapreduce过程、shuffle过程。
6. hadoop高可用如何实现、通过什么方法调度、namenode挂一个怎么办、namenode重新上线后会怎么样。
7. 介绍一下Hbase、region作用,用什么管理region?
8. hive的作用和特点、hive中表的类型区别、hql转换成mapreduce过程、hive如何进行调优、hive中join操作类型。
9. zookeeper的作用、zookeeper如何实现分布式锁、选举机制、zookeeper集群监控方式。
10. kafka的作用、kafka如何保证消息顺序和一致性、介绍kafka中topic和partition、如何提高kafka的吞吐量。
11. flume的作用、如何保证数据的可靠传输。
12. 介绍spark、spark中数据处理模型、RDD的五大特性、RDD和DateFrame的区别、两者之间如何转换、介绍spark的核心组件、spark如何处理数据倾斜问题。
13. 机器学习和深度学习的区别、有监督学习和无监督学习的区别。
14. 问项目、项目中负责什么工作、亮点。

反问xxx

这个岗位主要是参与那种高校学习实验平台的建设、听面试官说主要负责一些实验教案的编写。
问的东西真的多,小组件的一些东西,我说不会说的我自己都想笑了
全部评论

相关推荐

1. 维度建模和范式建模是什么,两者之间比较大的区别。2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么?3. 两道Sql题。       order_info (                    order_id bigint,    -- 订单id                    city_name string,   -- 城市名                    driver_id bigint,    -- 司机id                    passenger_id bigint,    -- 乘客id                    call_time string,   -- 订单呼叫时间                    finish_time string,   -- 订单完成时间                    pay_time string)  -- 订单支付时间这个表是订单粒度的一个打车记录,call_time、finish_time、pay_time都有可能为空。(1)  求有多少个用户曾经呼叫过,多少个用户曾经完成过订单,多少个用户曾经支付过订单。用户可能多次打车。(2)  求每个城市完成订单最多的十个司机。4.  项目中数仓分了几层?为什么要分成5层?
查看5道真题和解析
点赞 评论 收藏
分享
4 3 评论
分享
牛客网
牛客企业服务