题解 | #近一个月发布的视频中热度最高的top3视频#

近一个月发布的视频中热度最高的top3视频

https://www.nowcoder.com/practice/0226c7b2541c41e59c3b8aec588b09ff

WITH t1 AS(
    SELECT
        t1.video_id,
        SUM(if_like) AS like_cnt,
        SUM(IF(comment_id IS NULL, 0, 1)) AS comment_cnt,
        SUM(if_retweet) AS retweet_cnt,  
        AVG(IF(TIMESTAMPDIFF(second, start_time, end_time) >= duration, 1, 0)) AS finish_rate,
        1 / (DATEDIFF((SELECT DATE(MAX(end_time)) FROM tb_user_video_log), DATE(MAX(end_time))) + 1)  AS fresh_rate
    FROM tb_user_video_log t1
    JOIN tb_video_info t2 ON t1.video_id = t2.video_id
    WHERE release_time >= DATE_ADD((SELECT DATE(MAX(end_time)) FROM tb_user_video_log), INTERVAL -29 DAY) 
    GROUP BY t1.video_id
)

SELECT
    video_id,
    ROUND((100*finish_rate + 5*like_cnt + 3*comment_cnt + 2*retweet_cnt) * fresh_rate, 0) AS hot_index
FROM t1
ORDER BY hot_index DESC
LIMIT 3

总体思路为按照题干里提到的几个元素一个一个算。点赞数、评论数、转发数和 完播率都可以使用聚合函数 + IF条件解决。新鲜率需要计算一个时间差,需要注意要提取所有记录中某属性的最大值不能直接使用MAX,而是应该用一个小的子查询括起来,本题中是(SELECT DATE(MAX(end_time)) FROM tb_user_video_log),在下面的WHERE过滤条件中也是如此。

在把需要使用的字段全部准备好之后,在主查询中按照公式计算出热度,再排序和选取前三条记录即可。

全部评论

相关推荐

神哥了不得:你简历字体有点不太协调呀,下面的字实在太小了呀,而且项目也不太行,建议换几个高质量的项目,面试会多很多
点赞 评论 收藏
分享
03-15 20:26
已编辑
电子科技大学 C++
T3题面:给一个3e5数组,每次询问长度为len的子数组乘积的和,如果子数组乘积>1e9,则视为0.赛后一分钟想出来了,比赛时打了个暴力+线段树注意到1e9大约是2^30, 因此len长度如果>30就直接输出0,30以内做一个记忆化就行,复杂度O(30*n)感觉是以前比赛做过的题,忘了怎么做了。。。---upd: 忘了数据范围了,如果有0,1的话那这样也不行
blueswiller:给出一个做法,刚刚才想到,应该没问题,时间复杂度为 O(max(30n, nlogn)): 1. 根据 0 切分数组。2. 现在问题转化为>=1 的情况,我们首先维护每一个数前一个 > 1 的数的位置,同时维护一个长度的差分数组,初始值全为 0。3. 我们从每一个数 i 开始向前跳,至多跳 30 次,维护这个过程中的乘积,于是得到 30 个区间加和。举例:假设从 j1 跳到 j2 ,相当于对查询长度 (i- j1 + 1) 至 (i - j2) 贡献 a_i * ... * a_j1。4. 对于所有区间加和,我们采用差分数组结合树状数组对其进行维护,由于长度至多为 n ,树状数组构建的复杂度为 O(nlogn),于是,构建阶段的复杂度为 O(max(30n, nlogn))。在线单次查询的复杂度为树状数组查询的复杂度 O(logn)。
投递淘天集团等公司10个岗位 > 笔试
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务