上海银行总行科技&大数据岗(数据分析)技术面(自我感觉)凉经
2021.09.26 下午三点场的线下技术面,等了差不多一个多小时,加上本身感冒,状态不是很好。签到时发现是三人群面,心态有点小崩。 入场后,对面四个面试官,旁边两个工作人员。本来一次面三个,我这一轮实际只有两个,我和一个计算机硕士老哥。自我介绍,我发现我每次自我介绍都不太一样。 废话不多,直接开面。我面的数据分析,对面一个专门做这方面的小姐姐就开始夺命连环问:
1.------------------------------------------------------------------------------------------------------------------------------------------------------------------
Q: 介绍一下你做数据分析这方面的经历。
A: os(我虽然实习数据分析岗了,但没有项目驱动。在公司带薪学习。)支支吾吾没一会,就被打断。
Q: 直接说项目的目标是什么,怎么做的?
A: os(殊不知我没有项目)。我把我leader做的项目(xgb)cue了一下。
Q: 这一说,完了。就问我xgb具体怎么实现的,label怎么打的。
A: 这一段回答的很糟糕,真后悔没有把项目内容编好,对,是编。
Q: 数据从哪来的,长啥样子?
A: 数据主要来自电子病历上。原始数据很脏,要做标准化。
Q: 数据怎么标准化的?
A: 一般是最大最小值归一化,或者正态归一化。
2.------------------------------------------------------------------------------------------------------------------------------------------------------------------
Q: (面试官看出我项目上回答不上什么了)其他树模型有没有了解?
A: 基于信息增益和GINI指数的决策树,集成学习。
Q: bagging 和 boosting的区别?
A: 我说一个是打包,基学习器是同水平的。一个是提升,利用残差对模型做提升。(我怕不是在翻译?)
Q: bagging 的例子?
A:随机森林(诶,这个我知道)
Q: GDBT了解吗?
A:我说用了梯度下降法(忘了,不是梯度下降,是用梯度重构残差)
3. -----------------------------------------------------------------------------------------------------------------------------------------------------------------
Q: 其他的机器学习方法?
A:有监督的KNN,无监督的K-means.
Q: KNN和K-means的区别?
A: KNN是有监督的,用到了label. K-means是无监督的,没有label。
Q: KNN和K-means都需要训练吗?
A:我说了都需要。(因为我隐约记得之前做KNN的时候,将样本分成了test和train。K-means我忘了。其实K-means不需要,没有label训练个锤子。)
Q: KNN是怎么训练的?
A:没答上来。说了句:KNN本质是用目标样本的最近的K个近邻投票决定分类的。
Q: 其他的机器学习方法?
A:说了个SVM。最简单的LR和LR给忘了。无语子。
4. -----------------------------------------------------------------------------------------------------------------------------------------------------------------
Q:常用编程语言?
A: Python
Q: 常用的库?
A: 四剑客:numpy, pandas, matplotlib, seaborn.还有机器学习的sklearn, pymc3。
Q: pandas怎么去重?
A: 很久没用了,函数没想起来。我说mysql里面直接用distinct可以去重。面试官笑了。
Q: pandas怎么取交集,取并集.
A: 最近在刷数据结构笔试题,这些库搁置很久了。我崩不住了,说:距离我上次使用pandas有一段时间了。
Q: (面试官懂我意思)如何判断一个字符串里面是否有数字。
A: 不知道有没有直接的函数,类似isalldigit之类的,不敢乱说。讲了下底层逻辑,用for循环遍历判断。
Q: 最常用的函数?
A: 我说了标准库里面的append和pop.
5. ------------------------------------------------------------------------------------------------------------------------------------------------------
Q: mysql写过最复杂的是什么,有那些逻辑?
A: 没明白想问什么。刚在想要不要说事务,又怕说不清。又想可能问一些简单的逻辑函数吧。刚准备把where,group,order,having,limit轮番报一遍菜名,被打断了。无语子+1
Q: mysql里面union和union all的区别?
A: 只回答了在去重上面的区别。
Ending
反问环节:
- 上海银行总行科技&大数据岗做数据分析的对我们的期望或者是需求是什么样子的?
- 传统的统计分析模型在银行里面有什么用处?因为我之前一直做的都是传统的统计分析模型。
秋招以来的第一次技术面。怎么说呢,问的不是很难,但确实有点偏数据挖掘了。我简历上压根就没提机器学习这四个字,全怪我提了一嘴xgb。sql也没怎么问。加上感冒本身状态也不是很好,面的时候回忆硬是回忆不上来。srds, 怪只能怪学艺不精啊, 多康康书吧, xdm.
Timing: 2021.09.26 20:00