沙上有印 - 个人主页动态 - 牛客网

发布(4) 评论刷题收藏

2023-11-07 19:46

杭州电子科技大学后端

求助关于sql的面试题

服务器每天产生30亿的访问日志，每一行日志包括字段：device_id, country, channel_id,date,ip, ......其中device_id表示设备，country表示国家，channel_id表示渠道，date表示日期，......已知device_id去重总数不到10亿，每天缓慢增加，缓慢到可以忽略不计；已知country长度最长3个大写字母，channel_id取值范围是100-999；已知device_id为36个字符组成；现在要分析：1、不同国家的device_id去重计数是多少，2、不同渠道的device_id去重计数是多少，3、不同渠道独有的device_id去重计数是多少，（因为一个设备可能在不同渠道出现，也可能只在某一个渠道出现）4、渠道100的设备与其他渠道（101～999）的设备重复率是多少，要求：1、写出各个要求的伪sql（不限方言）2、在计算第四点时如果是 10亿的device_id表 left join 10亿的device_id表，速度较慢，如何解决？（不限方言，最好是spark，不要求能运行，逻辑对即可；可以自定义算子，算子功能描述清楚即可）

0 点赞评论收藏

分享

2023-05-04 16:48

杭州电子科技大学后端

题解 | #创建一张新表#

CREATE TABLE IF NOT EXISTS user_info_vip ( id int(11) NOT NULL PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID', uid int(11) NOT NULL UNIQUE NOT NULL COMMENT '用户ID', nick_name varchar(64) COMMENT '昵称', achievement int(11) DEFAULT 0 COMMENT '成就值', level int(11) COMMENT '用户等级', job varchar(32) COMMENT '职业方向'...

0 点赞评论收藏

分享

2023-04-02 20:32

杭州电子科技大学后端

题解 | #统计每个学校的答过题的用户的平均答题数#

select u.university, round(count(q.question_id) / count(distinct q.device_id), 4) as avg_answer_cnt from user_profile as u join question_practice_detail as q on u.device_id = q.device_id group by u.university order by u.university;

0 点赞评论收藏

分享

2023-04-01 21:34

杭州电子科技大学后端

题解 | #分组计算练习题#

select gender, university, count(gender) as user_num, avg(active_days_within_30) as active_days_within_30, avg(question_cnt) as question_cnt from user_profile group by university, gender 一定要心中有中间查询的表结果

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务