我的第一次实习面试——迈步科技算法实习生(金融风控方向)
11月12日投递的简历,13日下午进行的面试。
面了45分钟左右。从自我介绍开始,然后是讨论简历上的项目+一些技术问题。最后给了个业务方向的开放式问题。
项目问题和技术问题是很常规的问题。
项目问题比如:
对数据做了哪些特征工程?
这让我意识到我选的项目实在不是一个好的项目,基本没有什么特征工程的空间,于是准备把这个项目换掉,去找一个业务含义明确的数据集,才能增进对业务的了解。而且多在数据探索部分去挖掘一些规律,相当于干了数据分析的活儿。这对于业务理解应该是比较重要的。
技术问题比如:
xgb调了哪些参数?
我只说了树的数量,学习率和树的深度三个,实际上还有:colsample_bytree(用于训练模型的子样本比例)和subsample(每棵树随机采样的列数比例);还有两个正则化参数reg_alpha和reg_lambda。这些我都是调过的,但是面试前没复习,所以都给忘了。(所以面试前还是得把自己做过的事情复盘一遍啊!)还有两个控制节点分裂的参数我不是很熟悉,分别是min_child_weight(最小样本权重和)和gamma/min_split_loss(最小损失),调大它们可以降低模型复杂度。可能还有一些比较细节的参数就需要对xgb模型有比较深入的理解了吧。
开放式业务问题是:
现在有用户的APP安装包名称和安装时间的信息,怎么构建特征?
说实话在面试前我对于风控业务的了解实在是太少了,没想到还能从APP安装里面挖掘信息。于是一脸懵逼,不清楚是要挖掘什么指标。后面在网上看才了解,主要是看APP里面跟金融有关的各种信息。比如近X天(7天,14天,30天等各种时间窗口)安装的金融类APP数量&占比等。可以参考帖子:https://zhuanlan.zhihu.com/p/78413058
还可以引申到https://zhuanlan.zhihu.com/p/77238851
#还记得你第一次面试吗?#