快手数据研发1面+2面
23.5.30快手一面
1、介绍项目
这里都根据个人项目去聊的,问了很久
2.数据怎么来的(ods层数据同步问题)ads层下游怎么做,数据怎么来的报表直接查的ads层吗 数据抓过来存在哪
3.hadoop了解吗hdfs有那些组件,
4.聊聊mapreduce进行几次排序
一个sql题,按分数进行排序
count(*) count(1) count(col)三者有什么区别
数据倾斜 pv值
23.5.31快手二面
1、面向业务的数据库设计
面向业务的数据库设计流程通常分为以下6个阶段1:
- 需求分析:分析用户的需求,包括数据、功能和性能需求。
- 概念结构设计:主要采用E-R模型进行设计,包括画E-R图。
- 逻辑结构设计:通过将E-R图转换成表,实现从E-R模型到关系模型的转换。
- 数据库物理设计:主要是为所设计的数据库选择合适的存储结构和存取路径。
- 数据库实施:包括编程、测试和试运行。
- 数据库运行与维护:系统的运行与数据库的日常维护。
2、为什么要有三范式,三范式的意义是什么
3、mysql建索引需要注意那些事项,常见的索引有哪些
4、数据结构有哪几种类型 找两个介绍
5、实习中做了什么东西
6、dataworks 维度建模有哪些,你们用了星型模型还是雪花模型,雪花模型相对星型模型有哪些不同点,阿里用的哪种,为什么用这种(之前在阿里系实习)
7、数仓分层,为什么要放在s层,明细层是什么,汇总层是什么,我为什么不可以把明细层的东西放在s层里呢,汇总层的作用又是什么呢,要细致的了解
8、业务数据存到mysql、hive这些地方,谈谈有关hive优化会用到哪些方法
9、数据研发的了解 ,除了大数据组件以外你觉得还需要掌握哪些内容
10、实时flink ,实时数仓你是否有了解,会不会
二面挂
#数据开发工程师面经#