快手数分一面

# 一面60min
- 自我介绍&实习经历
- 搜索电商gmv下降,如何分析?
- 如何量化归因每个渠道对于搜索gmv的下降贡献(每个渠道体量不同的情况下)
面试官思路:构造一个统计量(忘了是啥)同时考虑品类的体量和变化值
- 用回归做归因合适吗?
面试官思路:不合适,因为有些爆品没有历史数据

abtest

- 如何计算样本量
- 设计abtest判断入口很深的功能变动对于整体的订单取消率是否有影响时,该功能的用户使用次数很低应该怎么处理(样本量过小)
面试官思路:样本是否能代表总体

两道sql

1. 计算GPA
exam_table(student_id, score, course_id, exam_time)
course_table(course_id, credit)
面试官说有问题,关于gpa的计算方式上有分歧,但是没听懂面试官的思路是啥…
```sql
SELECT student_id, sum(c.credit*e.score)/sum(c.credit) as GPA
FROM exam_table as e
JOIN course_info as c
USING course_id
GROUP BY student_id;
```

1. 计算次日留存率、七日留存率
用户活跃表(user_id, p_date)
当时没写出来,面完后写的,不确定是否正确
```sql
SELECT t1.p_date, count(distinct t2.user_id)/count(distinct t1.user_id) as 次日留存率
FROM table t1
LEFT JOIN table t2
ON t1.p_date=date_sub(t2.p_date, interval 1 day) and t1.user_id=t2.user_id;
```

次日留存率的定义为:t+1日中在t日活跃过的活跃用户数/t日活跃用户数
全部评论
请问是实习还是春招
点赞 回复 分享
发布于 2023-04-24 18:48 福建
留存计算不对
点赞 回复 分享
发布于 2023-04-25 07:27 北京
求问友友,这是什么部门的数分实习岗
点赞 回复 分享
发布于 2023-04-28 13:16 香港
您好,请问面试时写sql题需要提前准备好本地环境吗
点赞 回复 分享
发布于 2023-05-22 19:01 北京

相关推荐

2024.12.23(一面)一面 (1h 5mins)- 实习拷打  - 快手-评论模版留存率(10 mins)    - 严格漏斗和非严格漏斗的区别  - 字节-链路改造优化    - 延伸:数据的时效性怎么保证(从整体和单点分别叙述)    - 延伸:优化任务的思路    - 延伸:并行度相关的改法(三种)    - repartition()能改变第一个stage的shuffle write的并行度吗?    - 第一个stage的shuffle write的并行度由什么决定?  - 字节怎么分的数据域  - 字节分了哪些主题域  - 数据域和主题域的区别(主题域:自上向下,从分析的角度划分)  - 分层的意义(复用性和一致性)  - 怎么考虑分层,该分多少层(直接说了没必要在意这个,要理解分层的本质,面试官表明说的也有道理,也抛了另一个观点:肯定要分层,需要有不同粒度的数据,每个人在意数据都不同,比如说老板在意汇总层的数据,数分可能更在意明细层的数据,另外,在做归因分析的时候也需要血缘追踪)- SQL题二面 (26 mins)全程实习拷打- 自我介绍- 字节实习  - 多机房代码一致性怎么保证的(治理存量,增量通过oceanus)  - 多机房涉及到的网络问题(通过全球化数据迁移解决)- 快手实习  - 评论模版留存率    - 严格漏斗和非严格漏斗的区别(准确性和计算量之间的取舍)    - 为什么这样设计    - 最终的目的是什么    - 有没有想过通过抽样解决数据量大的问题- 反问
查看18道真题和解析
点赞 评论 收藏
分享
评论
7
64
分享

创作者周榜

更多
牛客网
牛客企业服务