无忧数仓实习

面试时给的SQL题
    1.有个无忧达人开的店铺,每个顾客访问任何一个店铺的任何一个商品时,都会产生一条访问日志 访问日志存储的表名为vsit,访客用户id为user id,被访问的店铺名称为shop。请统计每个店铺访问次数top3的访客信息。输出店铺名、访客id、访问次数。

    2.现在只有两个字段工号,姓名,请你在原有数据不动的情况下,标记这个人是否出现重名情况,并把其余重名的人的工号(要去除自己的工号),拼接起来,加一列
题意:在原有数据上增加两列:是否重名,其余重名人工号

    3.现在有两个字段uid ,date,现在要求出,每天的uid非重复数;其中定位为下:
非重复数指今天出现的uid中,未在以前的历史数据中出现过的uid数例如 一号 出现了AB,二号出现了ADD,那么二号的非重复数是1,要对两个D进行去重。
题意:计算的时候把之前出现过的数据忽略掉
全部评论
第二个怎么撕,标重复用row_number好像不能标全,工号没思路
点赞 回复 分享
发布于 09-18 16:56 浙江
大佬,哪个无忧呢
点赞 回复 分享
发布于 09-28 23:32 陕西

相关推荐

各位大佬,后辈目前研1,专业是金融科技,本科学的是应用统计跟应用数学,求职方向是数分,有两端数分实习,一段是上市快消公司的一段是电子产品领域的跨境电商公司因为数分现在实在太卷了,加上之前面试数分实习的时候,罕见的遇到了不止一家公司问是否有数仓使用经验,都以我沉默答不上而宣告失败。痛定思痛后我决定补充数仓知识同时把数仓作为并行求职路线本科的时候接触过python,sql,实习也干过写sql,做报表,Bi可视化,写python数据处理脚本这些工作内容,但是没有大数据组件使用经历。从九月开始跟网课学,现在学了hadoop,hive,spark三个大组件,还有zookeeper和kafka,现在正在做一个离线数仓项目(hive + pyspark)想请教一下大佬们有人也是应用统计转数仓的吗?这样做前景如何?以及目前我预计下周五之前做完项目,做完项目之后应该做哪些准备呢,是直接开始背大数据组件的相关八股?如果不找实时岗位,flink一定要学吗?另外,我咨询过不同的信息渠道,有些前辈说大数据可以用python解决,有些前辈说还是得学java,请问有前辈可以就这个问题答疑解惑吗?面试的时候,八股文部分考核,是聚焦大数据组件的八股,还是也会出现计算机网络,操作系统这些计算机专业科班才会接触的内容呢(如果是后者那恐怕应统专业是要跟大数据无缘了)#数据人的面试交流地##牛客在线求职答疑中心##你后悔选择现在的专业吗#
Markovo:不投实时可以不用学flink,数仓就是写hql,java都很少用到
点赞 评论 收藏
分享
2 6 评论
分享
牛客网
牛客企业服务