拼多多数据分析工程师社招面经

拼多多

1.问:贝叶斯公式复述并解释应用场景

2.问:如何写SQL求出中位数平均数和众数(除了用count之外的方法)

3.问:如何避免决策树过拟合

4.问:朴素贝叶斯的理解

5.问:SVM的优点

6.问:处理需求时的一般思路是什么,并举例

7.问:hadoop原理和mapreduce原理

8.问:现有一个数据库表Tourists,记录了某个景点7月份每天来访游客的数量如下:id date visits 1 2017-07-01 100 …… 非常巧,id字段刚好等于日期里面的几号。现在请筛选出连续三天都有大于100天的日期。上面例子的输出为:date 2017-07-01 ……

9.问:在一张工资表salary里面,发现2017-07这个月的性别字段男m和女f写反了,请用一个Updae语句修复数据。例如表格数据是:id name gender salary month 1 A m 1000 2017-06 2 B f 1010 2017-06

10.问:现有A表,有21个列,第一列id,剩余列为特征字段,列名从d1-d20,共10W条数据!另外一个表B称为模式表,和A表结构一样,共5W条数据 请找到A表中的特征符合B表中模式的数据,并记录下相对应的id。

11.问:我们把用户对商品的评分用稀疏向量表示,保存在数据库表t里面:t的字段有:uid,goods_id,star uid是用户id;goodsid是商品id;star是用户对该商品的评分,值为1-5。现在我们想要计算向量两两之间的内积,内积在这里的语义为:对于两个不同的用户,如果他们都对同样的一批商品打了分,那么对于这里面的每个人的分数乘起来,并对这些乘积求和。

#拼多多##面经##数据分析工程师##社招#
全部评论
通过了么
点赞 回复 分享
发布于 2021-04-08 17:41
😂考得挺多的,面挺广的
点赞 回复 分享
发布于 2021-04-16 18:44
请问一下:第十题中“特征符合B表中模式的数据”具体是什么意思呀?
点赞 回复 分享
发布于 2021-05-26 17:42

相关推荐

三年之期已到我的offer快到碗里来:9硕都比不上9本
点赞 评论 收藏
分享
6 75 评论
分享
牛客网
牛客企业服务