2018拼多多(内推)数据分析师试题

问答题1

现有一个数据库表Tourists,记录了某个景点7月份每天来访游客的数量如下:
id    date    visits
1    2017-07-01    100
……
非常巧,id字段刚好等于日期里面的几号。现在请筛选出连续三天都有大于100天的日期。
上面例子的输出为:
date
2017-07-01
……

问答题2

在一张工资表salary里面,发现2017-07这个月的性别字段男m和女f写反了,请用一个Updae语句修复数据
例如表格数据是:
id name gender salary month
1   A     m     1000   2017-06
2   B     f     1010   2017-06

问答题3 (哪位大神教教我怎么做)

现有A表,有21个列,第一列id,剩余列为特征字段,列名从d1-d20,共10W条数据!
另外一个表B称为模式表,和A表结构一样,共5W条数据

请找到A表中的特征符合B表中模式的数据,并记录下相对应的id

有两种情况满足要求:
1每个特征列都完全匹配的情况下。
2最多有一个特征列不匹配,其他19个特征列都完全匹配,但哪个列不匹配未知

问答题4

我们把用户对商品的评分用稀疏向量表示,保存在数据库表t里面:
t的字段有:uid,goods_id,star
uid是用户id;goodsid是商品id;star是用户对该商品的评分,值为1-5。

现在我们想要计算向量两两之间的内积,内积在这里的语义为:对于两个不同的用户,如果他们都对同样的一批商品打了分,那么对于这里面的每个人的分数乘起来,并对这些乘积求和。

例子,数据库表里有以下的数据:
U0    g0    2
U0    g1    4
U1    g0    3
U1    g1    1

计算后的结果为:
U0    U1    2*3+4*1=10
……

编写SQL做上述计算。

问答题5

微信取消关注分析,题目太长了,没记录。。
全部评论
之前都是面试,没笔试过,想问一下,需要本地的数据库编译吗?还是直接写语句就行
点赞 回复 分享
发布于 2018-08-30 07:55
shen m
点赞 回复 分享
发布于 2017-10-26 17:55
楼主知道第三题怎么做了吗
点赞 回复 分享
发布于 2017-09-01 15:23
想问下大佬笔试题就这些?90分钟五个问答题?
点赞 回复 分享
发布于 2017-09-01 12:30
请问一下朋友们还记得第五题吗?当时时间紧没有做出来。谢谢。
点赞 回复 分享
发布于 2017-08-07 21:10
通知面试了吗
点赞 回复 分享
发布于 2017-08-06 23:43
数据分析有面试的了么?
点赞 回复 分享
发布于 2017-08-04 11:13
sql工程师(摊手
点赞 回复 分享
发布于 2017-08-03 18:54
% 有答案不,求分享!
点赞 回复 分享
发布于 2017-08-03 17:57
看来好多人都报了数据分析啊
点赞 回复 分享
发布于 2017-08-02 21:46
求楼主提供答案
点赞 回复 分享
发布于 2017-08-02 17:19
请问知道在哪查进度吗?或者大约什么时候通知面试?
点赞 回复 分享
发布于 2017-08-02 16:25

相关推荐

虚闻松声:简历看起来很清爽。几点建议。 1. 总结提炼项目工作内容。如第一个项目第一点,研发用户信息管理、购票功能:(然后具体展开)。还可以继续总结,如基础功能开发、算法优化座位分配、并发性能提升等等 2. 优化技术栈描述。全文多次出现Spring Boot,我感觉一次就够了。可以不写或者写整个体技术架构? 3. 增加业务指标描述。最好有一些业务效果的指标。或者优化的效果指标等等。
点赞 评论 收藏
分享
评论
点赞
88
分享

创作者周榜

更多
牛客网
牛客企业服务