首先来解释一下题目:题目要求计算某个用户在第一日答题以后第二题继续答题的平均概率,简单举个例子就是,假设用户A在1月1日答题以后,1月2日继续答题,而表中只有这两条数据,那留存率就是1/2=0.5。我在第一次做的时候忽略了表中含有的重复数据,比如device_id=2315,date=2021-08-13的数据是有两条的,那如果表中有这两条数据再加一条device_id=2315,date=2021-08-14的数据,实际上需要根据device_id和date两个字段做一个去重,最终的留存率应该是1/2=0.5,而不是2/3。这点是需要注意的。答题步骤:要计算最终的留存率实际上就是找出计算留存...