CVTE研究院数据挖掘岗三轮面经:
一面:
1、自我介绍(研究方向)
2、研究方向上目前的研究成果有哪些(介绍了自己的两篇论文和专利)
3、参加的竞赛(介绍了曾经参加过的天池竞赛和编程马拉松)
4、围绕交通流预测竞赛开始发问:
1)自己在竞赛中的角色
2)比赛的难点
3)如何解决该难题
4)竞赛中上分最高的几个手段是哪些
5)特征工程如何做的,有哪些特征,为何使用这些特征
6)单模型最高与模型融合的结果差距多少?如何进行的融合
5、阐述SVM原理,为何使用对偶性以及对偶性原理,SVM如何解决多分类,SVM与LR对比。
6、阐述GBDT、xgboost、lightGBM的异同,xgb的优势,lgb的优势,二者的并行如何实现。
7、阐述word2vec的原理,为何使用哈弗曼树,如何构建哈夫曼,负采样的原理。
8、对于一个取值较多的类别变量在不能进行onehot的情况下如何使用?
9、阐述Hadoop与Spark的区别?
10、Spark的工作原理是什么?
二面:
1、自我介绍
2、开始对我的一个NLP的项目发问:
1)做NER和RE时采用了什么模型?效果目前怎样?
2)知识图谱的构建过程是怎样的?
3)RE时的数据标注如何进行的?
4)图谱推理目前采用了什么方法?
5)表示学习如何使用在NLP任务中,举例说明。
3、LSTM、GRU、RNN的原理以及差别
4、梯度消失与梯度爆炸的产生原因,如何避免?
5、CNN的原理,卷积为何有效?1*1卷积的作用?
6、HMM与CRF的原理,差别,是全局最优还是局部最优以及为什么。
7、无人机竞赛中所使用的路径规划算法是什么?是如何对天气进行预测的?比赛中对上分的手段是什么?
终面:
终面是现场面,三个不同岗位的同学一起面见HR,围绕一些生活问题、人生观价值观等问题问了半小时。(还好最后没问你认为你们三个中谁表现最差.....)
总结:
技术面问的都比较基础,基本稳绕简历发问,全程没有让写编程题,没有问基础数据结构。HR面问题也相对温和,没有问一些极端的问题,感觉不错。
#面经##广州视源电子科技股份有限公司##数据挖掘##算法工程师##秋招##内推##校招#