求助关于sql的面试题

服务器每天产生30亿的访问日志，
每一行日志包括字段：device_id, country, channel_id,date,ip, ......
其中device_id表示设备，country表示国家，channel_id表示渠道，date表示日期，......
已知device_id去重总数不到10亿，每天缓慢增加，缓慢到可以忽略不计；
已知country长度最长3个大写字母，channel_id取值范围是100-999；
已知device_id为36个字符组成；
现在要分析：
1、不同国家的device_id去重计数是多少，
2、不同渠道的device_id去重计数是多少，
3、不同渠道独有的device_id去重计数是多少，（因为一个设备可能在不同渠道出现，也可能只在某一个渠道出现）
4、渠道100的设备与其他渠道（101～999）的设备重复率是多少，
要求：
1、写出各个要求的伪sql（不限方言）
2、在计算第四点时如果是 10亿的device_id表 left join 10亿的device_id表，速度较慢，如何解决？
（不限方言，最好是spark，不要求能运行，逻辑对即可；可以自定义算子，算子功能描述清楚即可）

全部评论

推荐最新楼层

11-26 15:16

上海交通大学商务渠道

中信银行面试记录

面试流程：无领导小组讨论：10人一组，分成两个5人小组进行辩论，时长约30分钟。形式较为轻松，但需要积极发言，展现个人见解。半结构化面试：紧随无领导面试后，以群面形式进行，由3位面试官主持，其中可能包括人事老总。面试前需准备好对中信银行的深入了解。注意要点：女生建议携带平底鞋或低跟鞋，以满足长时间站立或行走的需求。了解中信银行及其核心价值观，熟悉股份制银行与国有银行的区别，以及自己对银行工作的看法和服务理念。在无领导小组讨论中要敢于表达自己的观点，同时保持团队合作精神。对于服务与销售的重要性问题，强调服务是销售的前提，良好的服务能增强客户信任，促进销售成功。

查看5道真题和解析非技术面试记录

点赞评论收藏

11-25 14:30

CVTE_运营管理_HR

拿完offer再挑

目前池子里已经有很多同学泡着了，各个学校的三方也已经陆续开放，但是并不代表着签完三方就结束了，很多同学还会有违约考虑国企央企，所以10月到11月之间对于大部分同学来讲，还是没办法完全放松（已经拿到满意的offer的另说） ，还没有投的同学最后都投上吧，春招hc都不一定有秋招中期的剩下的hc多，直入主题，大家都关注的问题cvte加不加班？加还是加的，但是看部门，软硬件基本都是8点钟走其他的一些文职部门我看下班还是六点准时的而且不是强制，你事情做完可以走的，全天不打卡工资待遇怎么样？待遇还是挺不错，校招普遍都是10k以上，目前我见过最高的是18k的。福利待遇有哪些？五险一金啥的不用说了。住房公积...

CVTE公司福利 266人发布

点赞评论收藏

10-11 15:10

蚌埠坦克学院嵌入式软件开发

已经习惯了😎

点赞评论收藏

11-24 15:09

已编辑

北京戏曲艺术职业学院硬件开发

华为报批

和对接人沟通确认意向，地点等信息，属于第一批。已经报批，结果会在12.5号前公布，最晚推迟两个周。武汉终端硬件电源，bg985本。苦等两个月，一定要给我发offer

沉淀一会：1.同学你面试评价不错，概率很大，请耐心等待； 2.你的排名比较靠前，不要担心，耐心等待； 3.问题不大，正在审批，不要着急签其他公司，等等我们！ 4.预计9月中下旬，安心过节； 5.下周会有结果，请耐心等待下； 6.可能国庆节前后，一有结果我马上通知你； 7.预计10月中旬，再坚持一下； 8.正在走流程，就这两天了； 9.同学，结果我也不知道，你如果查到了也告诉我一声； 10.同学你出线不明朗，建议签其他公司保底！ 11.同学你找了哪些公司，我也在找工作。

点赞评论收藏