1、自我介绍(1-2min)
做了模板,直接背了

2、数据库的掌握程度
只刷过题,做过笔试题,没接触过真实业务

3、数据库存储过程和视图
这个不会(现在想起来视图是虚表,而且平时都是问索引......)

4、​数据库聚合函数
group by? 更深的是?难道是max,min,avg,sum,count这些?(太简单以至于没反应过来)

5、数据去重的办法
group by和distinct,只记得这2个,就答了这2个
(貌似还能having、创建临时表、子查询)

6、对数仓有了解吗
有......但是我忘记定义了,就说了有三层架构

7、数仓三层架构是什么
三层架构:源数据、数据仓库、数据应用,实现从源数据抽取、转换、装载、存放数据

8、做过数据清洗吗
比赛使用python和kettle做过数据预处理,清洗异常值

9、使用过哪些etl工具
kettle(问我还有吗?真就知道且用过kettle)

10、除了mysql,使用过哪些数据库
MongoDB

11、使用过大数据相关的数据库吗
??好像没有(如果hdfs算的话,就是1个)
因为使用hive和spark写sql时,我是直接建表然后进行操作的

12、使用过kafka和flume实现实时读取数据吗
没有,但是用过spark steaming,也是能实现这一个功能的

13、2个指标,1个纬度画什么图
我说了环形图(因为下意识感觉都可以),但是不对

14、环形树图的使用场景(应该是树形图才对?)
刚刚2个指标,1个纬度的场景,举了电影的例子,电影数量和评分(然后面试官说,简单点就是分布和数量)

15、独立完成过多指标、可联动的bi看板吗?
好像有的,课上做过相关的

16、场景题(算法?)
时间序列或者回归相关的

反问环节:
如果我能成功进入贵公司会负责哪些工作内容?
我需要具备哪些能力?
根据客户需求去实现,sql、数仓*和前端(bi看板)

这次面试内容十分全面且细节,难度还算合适,涵盖了我大学学过的,也有没学过的,收获满满~

全部评论
哪一家,好难
点赞 回复 分享
发布于 2023-08-01 18:17 湖北
兄弟 自我介绍要说些什么啊
点赞 回复 分享
发布于 2023-08-01 20:42 江西
bi分析,我现在实习就在做
点赞 回复 分享
发布于 2023-08-02 12:14 广东

相关推荐

联洲 嵌入式软件开发 总包48w(sp+3档)
点赞 评论 收藏
分享
2024-11-21 13:04
已编辑
门头沟学院 算法工程师
点赞 评论 收藏
分享
评论
8
24
分享
牛客网
牛客企业服务