lazada面经
lazada(大数据开发)一面面经(11.9)
1.自我介绍
2.深挖简历部分(这部分大概20-30min)
Q:实习项目用户画像是怎么建立的?
从基础属性、会员属性、兴趣爱好等列举详细的吧啦吧啦
Q:是不是可以增加用户的行为相关指标?
你说的是根据用户浏览加购等行为,实现给用户推送合适的优惠信息嘛
Q:是的(没再深挖)
Q:讲一讲你实习的项目怎么实现会员精细化运营的?
举例讲了输出什么指标,报表,上传到可视化平台给业务人员圈选实现一键推送消息,发送短信等
Q:讲一讲你第二个项目数据清洗的具体做法,清洗后的数据量大概多大?
清洗是基于重复值跟缺失值的,我这边采取的处理方法是直接剔除
Q:讲一讲IFL模型的含义?
RFM模型的一个变体,巴拉巴拉解释了参数(感觉总结的不够完美)
Q:那这个项目的实际应用呢?
我觉得这个项目对我来说的应用是帮我找出了B站科技区高质量的up主,呜呜呜,我之后可以看他们的视频
Q:所以这个项目是没有实际应用到业务中是吗?
是的
Q:(开始第三个项目)解释一下你们针对拉新、促活、留存、转化做的工作?
Q:解释一下留存跟转化?
(估计还有些问题我忘记了)
3.提问环节
Q:一道sql(口述思路)
Q:你上一道题用到了row_number,你讲一讲还有其他的排序函数嘛?
row_number
rank
dense_rank
Q:讲一讲这三个排序函数的区别?
Q:你熟悉哪些连接方法嘛?
left join
right join
inner join
或者left semi join,你说的是这些嘛?
Q:场景题,有一个a表,b 表,a表跟b表存在交集,求a 表去除两者交集的数据?
left semi join
Q:求a表跟b 表的并集?
(开始脑子没运转,以为是交集,说inner join),然后面试官强调了是并集,我说full join
Q:a表有100 条数据,只有id这一列,b表有50 条数据,只有id这一列且去重后只有一个id,将a 表跟b表用id关联返回多少条数据?
这应该是a表跟b表左连接一定返回的是a 表的行数问题的变体,左连接150条,内连接50条。(但是自己脑抽了,回答了100 条)
Q:行转列,列转行的实现方式?
case when then
union all
Q:数据仓库分层,分哪些层,每一层干什么?分层的作用?
Q:数据倾斜问题?解决办法?
Q:数据波动分析问题?(MAU,MAB 两个指标)
拉大盘,判断是不是周期性波动,能不能算作一个数据波动问题?
看政策,或者有不有竞品近期发售
用不同的维度分解去看这个指标:地区、渠道等
Q:还有其他的嘛?
想了好久,说可以把MAU跟MAB两个指标拆分成小指标,然后看小指标的变化趋势的角度去定位问题
Q:介绍这个岗位主要分为两个小方向,一个用户增长策略,一个是数据质量保证,数据基础模型方向的,问我更感兴趣哪一个?
4.反问环节
Q:可以讲诉一下你在公司的一天嘛?具体工作内容?
Q:你对我有什么建议?
Q:你觉得这个工作最大的挑战是什么呢?
Q:根据面试官的回答,又反问了应届生该怎么更好地锻炼自己的业务敏锐度呢?
#Lazada##面经#