卓望数码 数据开发 一面 终极八股盛宴
以下三十多道八股,包括但不限于:
请做一下自我介绍。
结合您的项目经理经历,讲一下您对数据仓库的理解。
描述数据仓库的四大特点。
询问您是否有涉及实时数据仓库。
介绍HDFS的副本机制。
介绍HDFS的编码机制。
介绍HDFS的高可用机制。
介绍元数据表的存储方式及其表结构。
介绍用户定义函数(UDF)、UDTF及聚合函数。
介绍窗口函数及其使用场景。
介绍Hadoop生态中常用的数据存储格式。
介绍Hadoop生态系统中的资源调度器,包括FIFO、Capacity Scheduler和Fair Scheduler。
介绍Kafka分区副本的特点以及如何保证消息不重复消费。
询问您对Spark和Flink的了解程度。
介绍Spark的Checkpoint机制及其作用。
解释Spark中RDD、DataFrame和Dataset的区别。
介绍Spark任务划分的原理。
介绍如何解决Spark作业中的数据倾斜问题以及其他性能调优策略。
介绍Java类加载过程。
比较Java中的synchronized关键字与Lock接口。
介绍如何实现Java中的线程池。
介绍Scala中函数编程的概念。
介绍Scala中的模式匹配及其应用。
介绍MySQL的逻辑架构。
介绍数据库设计中的第一范式、第二范式和第三范式。
询问您对数据挖掘和机器学习算法的了解情况。
询问您是否具有后端开发的经验。
询问公司使用的离线处理、实时处理及存储技术栈。
懒得反问了,直接遗憾离场
#面经##数据开发##数据开发工程师面经#