个人秋招算法岗总结、面经
2018年秋招总结
经过长时间的准备与奋战,终于心满意足的结束秋招之旅,一路走过来,牛客网帮助了我很多很多,在此开一个总结帖,回馈牛客
自我介绍
- 学历:上海某商科院校硕士,双非,经济学专业
- 会议论文:无
- 比赛:kaggle top 2%
- 项目:个人机器学习库(练手玩的)simple_ml),实习项目
- offer情况:依图cv算法,第四范式机器学习建模,今日头条反作弊算法,b站推荐算法,英语流利说nlp,趣头条推荐算法,宜信数据挖掘算法,步步高算法
秋招经历 part 1 (前期准备)
2017年10月底,结束了一份量化实习之后,确定自己想进互联网,对金融无兴趣,于是开启正式的互联网算法岗秋招之旅。
此时的基础是:
- 西瓜书看过一遍,统计学习方法看过一半,吴恩达视频看过一半
- 有大量统计建模经验,熟悉统计学
- 熟练使用C#和python,因为做过量化系统的框架和上线工作,所以代码功底较强
- 有某小型互联网企业nlp实习经历
在接下来的到6月的半年多里,我主要做了如下几件事:
1. 重读西瓜书,边读边记笔记,重在理解算法内部详细推导
2. 结合相关博客,尤其是刘建平的博客,实现各种算法到我的个人项目simple_ml中
3. 刷算法题,剑指offer先后刷了2遍,leetcode刷了100题,主要是medium和hard难度
4. 读完数据结构与算法的书,自己实现一遍,并且要求非常熟练,起手就能写出
上述所有事情都是用spacemacs的GTD功能进行记录,并且严格按照番茄工作法完成(当时只有一个感觉,自己是一个机器。。。)放一张当时的记录:
接下来的时间里,主要做了如下两件事情:
- kaggle: home credit default risk,在8月底拿到2%
- 某互联网中厂暑期实习
然后秋招就正式开始了
秋招经历 part 2 (正式开始)
本次秋招投递的简历,包括网申和内推,共计62家,共收到面试通知18家,收到offer8家,以下是有记录的企业面经:
途牛
- 实习介绍
- 项目介绍,kaggle中你负责什么,怎么提升效果的
- svm gbdt rf介绍,区别是啥
- simpleml的目的
- 读了哪些源码
- 怎么实现自动化特征处理
- 实习做了什么
- 样本量多少
- 过拟合欠拟合的本质
- 如何解决过拟合欠拟合
- 以后的打算
keep
- 最印象深刻的实习
- 图的bfs,dfs实现
- 矩阵中最长的连续1的个数
- 数组最大连续和
- 矩阵(0,0)到右下的最短路径
- 估算附近超市年营业收入
- 读过印象最深的三本书(喵喵喵??
今日头条
- 自我介绍
- 聊项目
- xgboost如何做到自定义损失函数
- 旋转数组查找
- 两个排序数组求交集(归并)
- logistic回归梯度推导
- 手写logistic
- 统计与机器学习关系
- ab测试如何检验
- bayes调参原理
- xgb,lgb,gbdt区别,为什么lgb速度更快
- ftrl算法
- lstm时间怎么处理的
- 求中位数,线性时间,复杂度分析
- 比赛调优方法论
第四范式
- 很简单的代码题,忘了
- 介绍一下自己
- 对我的机器学习项目simple_ml很感兴趣,介绍一下
- 如何实现自动化的
- 聊一下你的kaggle比赛
- 如何进行特征工程的,详细步骤
- 为什么gbdt效果好于lr
- 如果x1和x2两个特征,而x1/x2这个特征很关键,现在我们不知道,只将x1,x2作为特征,那么lgb能捕捉到x1/x2吗?决策边界是怎么样的?
- 其他的忘记了。。。
宜信
- 第一类错误和第二类错误,以及与p值的关系,一类二类错误相加与1的关系
- auc值是怎么计算出来的,f1呢
- 什么是交叉熵
- 为什么logistic回归用交叉熵损失而不是平方损失
- 说一下L1和L2正则
- L1为什么可以进行特征选择,L1和L2有什么区别
- 为什么L1和L2可以减少过拟合?
- 回归的通式解,知道ridge的通式解吗?
- 逐步回归说一下,什么是前向后向算法
- R方约高效果越好吗?调整后R2越高效果越好吗?
- 排序算法了解啥,写一下堆排序
- 了解learning to rank哪些算法
- 概率题:n个服从0-1均匀分布的数字最大值的期望是多少
- 算法题:最长递增子串
- 说一下项目
- xgboost与gbdt的区别
- 决策树如何防止过拟合
- xgboost如何防止过拟合
- 为什么xgboost不用后剪枝
- 算法题:最长叶节点之间的路径
- 概率题:连续抛出“正正”硬币的期望次数
- 聊项目
趣头条
- KD树介绍
- 介绍kaggle项目
- 局部敏感hash,哪些hash函数
- svm核函数,时间复杂度
- 写一个二叉树的层次遍历,看代码风格
- sql题 学生-课程-成绩表,输出每个课程排名前2的学生名称
- L1, L2正则,区别,为何L1能做稀疏
- BP推导
- 哪些损失函数
- 知道Selu吗
- ReLu什么时候会导致神经元死亡
- ReLu除了导致神经元死亡还有什么区别
- XGboost, lightgbm与gbdt的区别
- 编程题:happy数,对一个数每个位上的数字取平方,加总,重复此过程,直到成环,此时不为1则为happy数,问判断一个数是否为happy数
- 当误判损失不一样的时候,怎么处理
- KD树了解吗
- ANN算法了解吗
感言
以后再写吧
#面经##秋招##算法工程师##字节跳动##宜信##第四范式##Keep#