信也科技——数据挖掘面经
2020.9.15投递
2020.9.18笔试 七道主观题 3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目
————————————————————————————————————————————
2020.9.25 一面有些记不太清除了
自我介绍
挖实习经历:风控相关:解释一些WOE值是怎么计算的,IV值是怎么计算的
还有就是一些风控建模细节
大数定律
线性回归的拟合优度$R^2$是怎么计算的
解释一下P值的概念
对信也了解吗?以前的拍拍贷
如果客户一直对你的模型不满意怎么办
解释一下过拟合(有好多家笔试都考到了的)
撸了一道sql题 两表连接+筛选条件 比较简单
整体体验蛮好的
反问:平时的主要业务和工作是什么?
面试官看我用过catboost,让我讲一下(我只是用过,没有太深入的进行了解,就讲了一下处理类别变量的优势)
评分卡模型了解吗?讲一下步骤
评分卡模型得到的分数在某一个分数段上比较集中该怎么处理?
有多少家公司正在面?
你有想去的地方吗?你的计划是留在一线城市嘛?
反问:数据挖掘岗平时的主要工作是干什么呢?(好像问了和一面一模一样的反问,不过两个面试官给出的角度还是不太一样的,不过确实是我想做的风控建模的工作)
国庆后给通知么?(是的) 本来复试想推倒国庆后,国庆好好准备一下的,不过hr说,复试的流程要在国庆前结束。
二面的整体感觉也是很棒的,感觉面试官问的很技术,问到了各种算法的细节。我也还需要继续努力学习其中的细节。
————————————————————————————
2020.9.18笔试 七道主观题 3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目
————————————————————————————————————————————
2020.9.25 一面有些记不太清除了
自我介绍
挖实习经历:风控相关:解释一些WOE值是怎么计算的,IV值是怎么计算的
还有就是一些风控建模细节
大数定律
线性回归的拟合优度$R^2$是怎么计算的
解释一下P值的概念
对信也了解吗?以前的拍拍贷
如果客户一直对你的模型不满意怎么办
解释一下过拟合(有好多家笔试都考到了的)
撸了一道sql题 两表连接+筛选条件 比较简单
整体体验蛮好的
反问:平时的主要业务和工作是什么?
————————————————————————————————————
2020.9.30 二面
没有自我介绍,面试官上来就吐槽我的简历太简洁(要不是一面的面试官问了很多问题都不知道我做了这么多工作),尴尬。。。 投递的有些匆忙,用的是最开始的简历
挖实习经历
中心极限定理(我忘记了,说我对大数定律比较了解,然后讲了大数定律)
**大数定律、中心极限定理真的很重要,研究生复试问到了,找工作也还是逃不掉啊**
树模型、gbdt的实现过程 不要原理,要实现过程 我讲了一堆boosting的原理,还有gbdt和adaboost的区别与联系 但是面试官还是说我说的是原理 引导问:决策树是怎么生成的,我就简单讲了下基于信息熵、信息增益、基尼指数、平方损失等,选择分裂节点,然后对于子树进行递归操作
xgboost是怎么分裂的? 没答上来
boosting和bagging的差异? 信手拈来
lightgbm和xgb的区别?xgboost是预排序 lightgbm是基于直方图,无论存储还是计算都要快很多
xgb,lightgbm的调参? 贪心算法,优先调重要的,然后调次要的
怎么降低过拟合 调整顺序 优先调什么?
建模时xgboost的损失函数是什么样的?(没答上来,忘记了。。。应该是回答auc吧) 追问了解mae和mse吗? 解释一下两者的差异?
没有自我介绍,面试官上来就吐槽我的简历太简洁(要不是一面的面试官问了很多问题都不知道我做了这么多工作),尴尬。。。 投递的有些匆忙,用的是最开始的简历
挖实习经历
中心极限定理(我忘记了,说我对大数定律比较了解,然后讲了大数定律)
**大数定律、中心极限定理真的很重要,研究生复试问到了,找工作也还是逃不掉啊**
树模型、gbdt的实现过程 不要原理,要实现过程 我讲了一堆boosting的原理,还有gbdt和adaboost的区别与联系 但是面试官还是说我说的是原理 引导问:决策树是怎么生成的,我就简单讲了下基于信息熵、信息增益、基尼指数、平方损失等,选择分裂节点,然后对于子树进行递归操作
xgboost是怎么分裂的? 没答上来
boosting和bagging的差异? 信手拈来
lightgbm和xgb的区别?xgboost是预排序 lightgbm是基于直方图,无论存储还是计算都要快很多
xgb,lightgbm的调参? 贪心算法,优先调重要的,然后调次要的
怎么降低过拟合 调整顺序 优先调什么?
建模时xgboost的损失函数是什么样的?(没答上来,忘记了。。。应该是回答auc吧) 追问了解mae和mse吗? 解释一下两者的差异?
面试官看我用过catboost,让我讲一下(我只是用过,没有太深入的进行了解,就讲了一下处理类别变量的优势)
评分卡模型了解吗?讲一下步骤
评分卡模型得到的分数在某一个分数段上比较集中该怎么处理?
有多少家公司正在面?
你有想去的地方吗?你的计划是留在一线城市嘛?
反问:数据挖掘岗平时的主要工作是干什么呢?(好像问了和一面一模一样的反问,不过两个面试官给出的角度还是不太一样的,不过确实是我想做的风控建模的工作)
国庆后给通知么?(是的) 本来复试想推倒国庆后,国庆好好准备一下的,不过hr说,复试的流程要在国庆前结束。
二面的整体感觉也是很棒的,感觉面试官问的很技术,问到了各种算法的细节。我也还需要继续努力学习其中的细节。
希望可以帮助一些想要从事风控的同学们
————————————————————————————
2020.10.15 已oc 感谢帮助过我的小伙伴们
#面经##校招##数据挖掘#