题解 | #每天的日活数及新用户占比#
每天的日活数及新用户占比
https://www.nowcoder.com/practice/dbbc9b03794a48f6b34f1131b1a903eb
with new_user_log as ( select uid, min(in_time) signin_time from tb_user_log group by uid ) , activity_log as ( select uid, date(in_time) dt from tb_user_log union select uid, date(out_time) dt from tb_user_log ) ,t1 as ( select a1.uid, a1.dt, if((a1.dt=date(n1.signin_time)), 1, 0) flag from activity_log a1 left join new_user_log n1 on a1.uid = n1.uid ) select dt, count(1) dau, round(sum(if((flag=1), 1, 0)) / count(1), 2) uv_new_ratio from t1 group by dt order by dt;
本题主要是要知道新用户怎么找出来,以及跨天的活跃用户如何获取。
建立第一个子表new_user_log,条件是每个用户的最小in_time,后续join时只有in_time为它自己的最小in_time才能算新用户
建立第二个子表activity_log, 把in_time和out_time查询结果可以union起来,这样跨天的也算第二天的活跃了。注意要用union不能用union all,因为union本身自带去重
建立第三个子表t1, 把新用户打上flag,flag=1是新用户 flag=0是老用户,条件就是通过最小in_time
最后主逻辑计算活跃用户,和日活比就很简单了