21校招记录——金融保险行业(数据算法/大数据)

一、泰康保险(offer)

岗位:大数据/数据算法岗

(一)一面40min+(一对一单面)

  1. 深挖项目和比赛(数据挖掘类比赛):数据预处理(缺失值填充、异常值检测、标签等等),特征工程(统计特征、滑窗特征、差分特征生成方式等),模型优化(网格搜索法,参数调整方式),模型融合(加权、stacking融合)。
  2. 回归类的问题如何解决——调用不同的函数,例如xgb的XGBClassifier用于分类,XGBRegressor用于回归。
  3. bagging和boosting区别(出现频率极高!!)
    • 样本选择:Bagging是随机有放回的取样,Boosting的每一轮训练的样本是固定的。
    • 样本权重:Bagging为均匀采样,权重相同;Boosting的权重由错误率决定,错误率越大的样本权重会变大。
    • 预测函数:Bagging所以的预测函数权值相同,Boosting中误差越小的预测函数其权值越大。
    • 并行计算:Bagging的各个预测函数可以并行生成,取均值作为结果;Boosting的各个预测函数必须按照顺序迭代生成.
  4. xgboost原理:介绍GBDT原理(梯度提升决策树)
    • 梯度:以损失函数的负梯度作为残差进行拟合。
    • 提升:根据每轮的预测结果不断调整权值,迭代提升,最后生成一个强学习器。
    • 决策树:基模型为树模型。
  5. 交叉验证的原理:将训练集分成N份,循环选择其中的N-1份作为训练集,另一份为验证集,进行学习预测。最终N次结果取平均,得到最终的预测结果。充分利用数据集,防止过拟合
  6. 过拟合如何处理:交叉验证、增加训练集、删除冗余特征。
  7. xgboost关注哪些参数:学习率learning_rate、最大深度max_depth、选择特征的比例colsample_bytree(防止过拟合)
  8. stacking融合的过程:首先用两个模型预测出来结果,将这两个结果作为特征重新输入到模型中,二次预测。

(二)二面1h(一对一单面)

  1. 分类算法的评价指标:
    • AUC:ROC曲线下面积,ROC曲线纵坐标为真阳性率TP,横坐标为假阳性率FP
    • F1-score
    • kappa
  2. 网格搜索法调参有哪些:学习率、特征选择比例、数据选择比例、最大深度等等。
  3. 树模型中缺失值如何处理出现频率极高!!)
    • 以lgb和xgb为例,对缺失值不敏感,可不必处理。
    • 如果处理的话:labelencoder编码、众数均值填充、根据业务逻辑填充等等。
  4. 字符类型数据输入模型前如何处理
    • labelencoder编码、one-hot编码
    • NLP思想:word2vec、TF-IDF
  5. 逻辑回归的激活函数:sigmoid、tanh等
  6. 编程题:类似于一个one-hot编码的问题,给定一系列字符串,分别计算每个首字母出现的次数,并映射成为字典的形式。(注意:这是一个实际的业务场景,不难但对于字典dict要熟悉掌握,这可能是平时会忽略的
  7. 给一组数据,从读取到预测全流程执行一遍:这道题由于我都是用的“祖传代码”,要么找网上开源的例子拿过来用,所以只进行了pandas读取和数据处理,后面跑模型就直接打开我CSDN开源分享的一篇进行解释😅

(三)待遇

※※ 17.7W==12K*12(月薪)+3.3W(年终),户口说研究生往年都解决。(打电话的时候HR自己都说:我们薪资没有什么竞争力🤣🤣

(四)总结

  1. 对于数据算法、数据挖掘的一些基本概念和原理考察的比较细致。
  2. 一些机器学习算法推导,函数思想还是不太了解,只会工程上的应用。后面有机会还要读一下西瓜书
  3. 自己总结一下,将来回顾起来也比较方便hhh

二、南方基金

岗位:信息技术部-研发工程师

由于是线下宣讲会的面试,所以了解到比较多的信息。

(一)企业相关信息

  1. 企业性质:国企头部基金公司。
  2. 待遇:宣讲会上HR说年薪40-50(没想到这么香!),闷声发大财😂
  3. 加班:不提倡加班,也没有行研加班那么猛。
  4. 发展前景:科技岗会有一些瓶颈吧,在基金公司科技序列天花板可能就是信息科技部的经理,竞争也很激烈。最后如果想突破更进一步的话,可能要转金融行研方向。
  5. hc相关:近两年科技岗扩招,21届30人,22届招80人,其他金融岗位都是个位数,相比之下还是很多的。不过我感觉来我们这线下宣讲,更多的是吸引22届的,21届可能已经招的差不多了。

(二)面试

  1. 没有自我介绍(可能看我不是科班的吧),提了一句中行的实习经历(面试官是鹅厂跳过来的,比较看重互联网大厂实习经历)。
  2. 直奔主题:hashmap如何实现?--直接蒙了,通信菜鸡没怎么学过数据结构,直接跟面试官说了,也就没问这些(感觉基本凉了)。
  3. 挖了挖项目、比赛,算法的实现过程。
  4. dataframe一年12月的交易流水数据,如何求出每个月的交易流水的均值--pandas包的groupby分类汇总,on=‘month’。

(三)总结

  1. 结果:不出意外的凉了,其实他们也是招python数据挖掘岗的,不过正好碰到的面试官是做后端开发的吧,也没办法。
  2. 面试官关注大厂实习经历,注重基础知识考查(数据结构、计算机组成原理、计算机网络等等)。
  3. 证券/基金公司逐渐在走金融科技的路线,所以这对于信科方向的同学是个优势,把握机会,有可能在金融圈能拿到比互联网更高的薪水(目前还不是特别卷)。

三、中国人寿研发中心(秋招记录)

岗位:软件开发与创新岗-大数据应用方向(秋招)

(一)一笔70min

行测(图形推理、言语理解等)+性格测试

(二)一面10min以内(更偏向于HR面)

  1. xx公司实习主要的工作内容。--前端页面开发,接口测试等
  2. 前端和后端的工作哪个更熟一些。---都不熟,投的是大数据方向,更希望从事大数据、数据挖掘、机器学习算法相关工作。
  3. 做过哪些数据挖掘类项目。---介绍的比赛
  4. xx比赛承担的角色,主要做了哪些工作。

(三)二笔(算法笔试)

1.十进制转R进制(2~16)
def f(a, y):
    x=abs(a)  #注意负数
    if y < 10:
        z = []
        while x != 0:
            z.append(x % y)
            x = x // y
        res = z[::-1]
    else:
        k = []
        z = []
        while x != 0:
            z.append(x % y)
            x = x // y
        for i in range(len(z)):
            if z[i] >= 10:
                z[i] = z[i] - 10 + ord('A')
            elif z[i] <= 9 and z[i] >= 0:
                z[i] = z[i] + ord('0')
        for i in range(len(z)):
            k.append(chr(z[i]))
        res = k[::-1]
    return res
#主程序部分
a=23
b=12
res=f(a,b)
x=[str(i) for i in res]   #注意转成str类型
r=''.join(x)
if a>=0:
    print(r)
else:
    re='-'+r
    print(re)
2.取石子游戏——斐波那契数列
while True:
    try:
        n=int(input())
        if n==0:
            break
        else:
            l=[[0] for i in range(50)]
            l[0]=l[1]=0
            for i in range(2,50):
                l[i]=l[i-1]+l[i-2]
            while(n):
                flag=0
                for i in range(50):
                    if(l[i]===n):
                        flag=1
            if flag==1:
                print('Second win')
            else:
                print('First win')
    except:
        break
            
3.给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数(LeetCode72)
动态规划求解,这道题属于困难水平,建议看看题解。

(四)总结

  1. 人寿研发的流程比较多:2次笔试+2次面试,我没有收到终面,也就是最后的技术面试。问了HR给的理由也很奇怪,笔试未通过,命名3道题全部AC……挂的很迷,这波操作不太懂(另一个同学同样全AC给的理由也是这样,严重怀疑是不是在敷衍😒
  2. 公司相关:待遇20出头,户口排队(据说名额比较少,解决户口能力欠佳)。
  3. 关于加班:一年一两次封闭开发996,也就最多两周,其他都正常965这种吧。
  4. 看了同学发的图片,食堂、健身房、游泳馆都很nice,地点稻香湖风景好环境好,工作氛围应该很不错(这一点值得考虑hhh)

(五)中国人寿(其他投递公司)

  1. 国寿寿险总公司-金融科技类(简历挂):27+户口,“养老圣地,神仙打架”,果然待遇和难度成正比😂
  2. 人寿财险-金融科技中心(秋招简历挂,春招笔试未参加):待遇偏低,同样户口不保证,而且即将搬去稻香湖。听了同学的分享果断劝退😂






#面经##校招##南方基金##泰康保险集团##中国人寿研发中心##大数据开发工程师#
全部评论
财险待遇偏低嘛
1 回复 分享
发布于 2022-10-25 14:40 山东
南方基金base哪里啊
点赞 回复 分享
发布于 2021-04-22 18:14
请问下寿险金融科技 27+户口是什么意思呀
点赞 回复 分享
发布于 04-21 14:57 北京

相关推荐

不愿透露姓名的神秘牛友
11-15 12:37
泰康科技 数据分析 年包15万 硕士985
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
昨天 08:42
已编辑
某割草机公司 算法 N×15 硕士985
点赞 评论 收藏
分享
评论
18
174
分享
牛客网
牛客企业服务