快手大数据平台面试

面了快手大数据平台,面试官不走寻常路,项目问了几句,然后两道牛客SQL题,当然是面试官大概写了一下

1、统计每个用户的天数, 连续出现天数的最大值. 第一个是简单group by解决没啥好说的,第二题有点卡壳没做出来,其实row_number() 之后再date_add一下rk_num,这个之前在写的自救指南里面写过,但是面试没想起来

2、每分钟累计的UV. 我采用的办法是支架表,对于log来说这种方法当然是不可取的, 因为支架表导致重复计算数量庞大,但是5分钟之内写出压力有点大,所以用了支架表,其实可以试试增量表的办法处理相比会好一点,我在日志处理上比较少所以这里不是很熟悉. 另外提一句,有部分公司喜欢考窗口函数,lead lag这些,可以稍微准备一下,建议刷一下力扣或者牛客的SQL

3、算法题. 经典的回文子串.此时心态有点崩了,但是大概还是知道中心法,大概讲了一下思路

4、问项目的时候问了分层,事实表类型,建模思想,星型模型和雪花模型的区别,inmmon 和kinball的建模思想的优缺点. 3NF,还好没考我BCNF.

事实表类型平时接触少,可能是在kimball的经典书籍上有但是这个知识点被我忽略了.雪花模型和星型模型大概说了一下,建模思想差异在kimball书上是有的,3范式网上很多,我也写了一篇文章,但是我只记得了函数依赖,具体举例的时候没举好,夹带一下私货,欢迎看我的文章《规范化和函数依赖》

#快手##面经##数据分析工程师##校招#
全部评论
自救指南是在哪里可以看到呀~
点赞 回复 分享
发布于 2021-02-09 19:40

相关推荐

1 20 评论
分享
牛客网
牛客企业服务