1、自我介绍(1-2min)
做了模板,直接背了
2、数据库的掌握程度
只刷过题,做过笔试题,没接触过真实业务
3、数据库存储过程和视图
这个不会(现在想起来视图是虚表,而且平时都是问索引......)
4、数据库聚合函数
group by? 更深的是?难道是max,min,avg,sum,count这些?(太简单以至于没反应过来)
5、数据去重的办法
group by和distinct,只记得这2个,就答了这2个
(貌似还能having、创建临时表、子查询)
6、对数仓有了解吗
有......但是我忘记定义了,就说了有三层架构
7、数仓三层架构是什么
三层架构:源数据、数据仓库、数据应用,实现从源数据抽取、转换、装载、存放数据
8、做过数据清洗吗
比赛使用python和kettle做过数据预处理,清洗异常值
9、使用过哪些etl工具
kettle(问我还有吗?真就知道且用过kettle)
10、除了mysql,使用过哪些数据库
MongoDB
11、使用过大数据相关的数据库吗
??好像没有(如果hdfs算的话,就是1个)
因为使用hive和spark写sql时,我是直接建表然后进行操作的
12、使用过kafka和flume实现实时读取数据吗
没有,但是用过spark steaming,也是能实现这一个功能的
13、2个指标,1个纬度画什么图
我说了环形图(因为下意识感觉都可以),但是不对
14、环形树图的使用场景(应该是树形图才对?)
刚刚2个指标,1个纬度的场景,举了电影的例子,电影数量和评分(然后面试官说,简单点就是分布和数量)
15、独立完成过多指标、可联动的bi看板吗?
好像有的,课上做过相关的
16、场景题(算法?)
时间序列或者回归相关的
反问环节:
如果我能成功进入贵公司会负责哪些工作内容?
我需要具备哪些能力?
根据客户需求去实现,sql、数仓*和前端(bi看板)
这次面试内容十分全面且细节,难度还算合适,涵盖了我大学学过的,也有没学过的,收获满满~
做了模板,直接背了
2、数据库的掌握程度
只刷过题,做过笔试题,没接触过真实业务
3、数据库存储过程和视图
这个不会(现在想起来视图是虚表,而且平时都是问索引......)
4、数据库聚合函数
group by? 更深的是?难道是max,min,avg,sum,count这些?(太简单以至于没反应过来)
5、数据去重的办法
group by和distinct,只记得这2个,就答了这2个
(貌似还能having、创建临时表、子查询)
6、对数仓有了解吗
有......但是我忘记定义了,就说了有三层架构
7、数仓三层架构是什么
三层架构:源数据、数据仓库、数据应用,实现从源数据抽取、转换、装载、存放数据
8、做过数据清洗吗
比赛使用python和kettle做过数据预处理,清洗异常值
9、使用过哪些etl工具
kettle(问我还有吗?真就知道且用过kettle)
10、除了mysql,使用过哪些数据库
MongoDB
11、使用过大数据相关的数据库吗
??好像没有(如果hdfs算的话,就是1个)
因为使用hive和spark写sql时,我是直接建表然后进行操作的
12、使用过kafka和flume实现实时读取数据吗
没有,但是用过spark steaming,也是能实现这一个功能的
13、2个指标,1个纬度画什么图
我说了环形图(因为下意识感觉都可以),但是不对
14、环形树图的使用场景(应该是树形图才对?)
刚刚2个指标,1个纬度的场景,举了电影的例子,电影数量和评分(然后面试官说,简单点就是分布和数量)
15、独立完成过多指标、可联动的bi看板吗?
好像有的,课上做过相关的
16、场景题(算法?)
时间序列或者回归相关的
反问环节:
如果我能成功进入贵公司会负责哪些工作内容?
我需要具备哪些能力?
根据客户需求去实现,sql、数仓*和前端(bi看板)
这次面试内容十分全面且细节,难度还算合适,涵盖了我大学学过的,也有没学过的,收获满满~
全部评论
哪一家,好难
兄弟 自我介绍要说些什么啊
bi分析,我现在实习就在做
相关推荐