题解 | #每天的日活数及新用户占比#

每天的日活数及新用户占比

http://www.nowcoder.com/practice/dbbc9b03794a48f6b34f1131b1a903eb

# 难点1:如果in_time和out_time跨天了,在两天里都记为该用户活跃过。
# 那就union,把两个时间合并成一个字段;因为最终是计算“每天的用户数”
# 难点2:新用户占比,每天的"新"都是相对前面的所有日期而言的
# 看到这种就想到窗口函数了,order by+日期

SELECT dt, COUNT(DISTINCT uid) dau, # 求每个dt有多少个uid,即dau
ROUND(SUM(IF(rk=1,1,0))/COUNT(DISTINCT uid),2) uv_new_ratio
# 只保留第一个日期的uid记为1,此时的uid在这个日期是新用户,sum计算总共有多少个新用户; 以dt分组,就是每个dt有多少新用户
FROM
    (
# 以uid分组,以dt排序,计算有多少dt;即每个uid在多少个dt出现;第一个日期就是新用户
# dt会有大量重复(因为我们把in_time跟out_time合并了),用count可能会计算多次呢?所以我选择row_number对dt进行不重复排序
    SELECT uid, dt, ROW_NUMBER()OVER (PARTITION BY uid ORDER BY dt) rk 
    FROM
        (
        SELECT uid, DATE(in_time) AS dt
        FROM tb_user_log
        UNION 
        SELECT uid, DATE(out_time) AS dt
        FROM tb_user_log
        ) t1
    ) t2
GROUP BY dt
ORDER BY dt

全部评论

相关推荐

贺兰星辰:不要漏个人信息,除了简历模板不太好以外你这个个人简介是不是太夸大了...
点赞 评论 收藏
分享
沉淀一会:**圣经 1.同学你面试评价不错,概率很大,请耐心等待;2.你的排名比较靠前,不要担心,耐心等待;3.问题不大,正在审批,不要着急签其他公司,等等我们!4.预计9月中下旬,安心过节;5.下周会有结果,请耐心等待下;6.可能国庆节前后,一有结果我马上通知你;7.预计10月中旬,再坚持一下;8.正在走流程,就这两天了;9.同学,结果我也不知道,你如果查到了也告诉我一声;10.同学你出线不明朗,建议签其他公司保底!11.同学你找了哪些公司,我也在找工作。
点赞 评论 收藏
分享
评论
2
收藏
分享
牛客网
牛客企业服务