拼多多数分记录

9.21
拼多多一面
1.问kaggle项目
2.Catboost和lightgbm相对于xgboost有什么优势(训练更快)
3.手撕sql*3,连续最大登录天数(user_id,log_date)

聚合函数不能嵌套使用,因此每一步都需要一个子查询或者CTE

4.平常处理缺失值的方法,catboost如何处理缺失值:
自动处理,数值的会在分裂时判断加入哪一边增加了增益,
类别的作为单独类别 #拼多多# #数据分析# #面试# #秋招#
5.概率题:36个球,34白2黑,随机分成4堆,一堆9个,求两个黑球不在一堆的概率
6.反问

9.28 二面 50分钟
9.28.2024拼多多二面 55分钟
1.问实习
2.Kaggle项目,决策树八股
3.数据倾斜时合并应注意什么(不会)
4.手撕sql*4(最后一问累计收益不会)
5.SQL优化
6.反问

挂了
全部评论
咱俩问的问题居然都差不多,我也二面挂
点赞 回复 分享
发布于 10-17 14:30 俄罗斯

相关推荐

11-09 15:36
已编辑
蚌埠坦克学院 数据分析师
OPPO 数据分析 (n+2)*15
点赞 评论 收藏
分享
5 19 评论
分享
牛客网
牛客企业服务