个人秋招算法岗总结、面经

2018年秋招总结

经过长时间的准备与奋战,终于心满意足的结束秋招之旅,一路走过来,牛客网帮助了我很多很多,在此开一个总结帖,回馈牛客

自我介绍

  • 学历:上海某商科院校硕士,双非,经济学专业
  • 会议论文:无
  • 比赛:kaggle top 2%
  • 项目:个人机器学习库(练手玩的)simple_ml),实习项目
  • offer情况:依图cv算法,第四范式机器学习建模,今日头条反作弊算法,b站推荐算法,英语流利说nlp,趣头条推荐算法,宜信数据挖掘算法,步步高算法

秋招经历 part 1 (前期准备)

2017年10月底,结束了一份量化实习之后,确定自己想进互联网,对金融无兴趣,于是开启正式的互联网算法岗秋招之旅。

此时的基础是:

  • 西瓜书看过一遍,统计学习方法看过一半,吴恩达视频看过一半
  • 有大量统计建模经验,熟悉统计学
  • 熟练使用C#和python,因为做过量化系统的框架和上线工作,所以代码功底较强
  • 有某小型互联网企业nlp实习经历

在接下来的到6月的半年多里,我主要做了如下几件事:

1. 重读西瓜书,边读边记笔记,重在理解算法内部详细推导
2. 结合相关博客,尤其是刘建平的博客,实现各种算法到我的个人项目simple_ml中
3. 刷算法题,剑指offer先后刷了2遍,leetcode刷了100题,主要是medium和hard难度
4. 读完数据结构与算法的书,自己实现一遍,并且要求非常熟练,起手就能写出

上述所有事情都是用spacemacs的GTD功能进行记录,并且严格按照番茄工作法完成(当时只有一个感觉,自己是一个机器。。。)放一张当时的记录:

接下来的时间里,主要做了如下两件事情:

  • kaggle: home credit default risk,在8月底拿到2%
  • 某互联网中厂暑期实习

然后秋招就正式开始了

秋招经历 part 2 (正式开始)

本次秋招投递的简历,包括网申和内推,共计62家,共收到面试通知18家,收到offer8家,以下是有记录的企业面经:

途牛

  • 实习介绍
  • 项目介绍,kaggle中你负责什么,怎么提升效果的
  • svm gbdt rf介绍,区别是啥
  • simpleml的目的
  • 读了哪些源码
  • 怎么实现自动化特征处理
  • 实习做了什么
  • 样本量多少
  • 过拟合欠拟合的本质
  • 如何解决过拟合欠拟合
  • 以后的打算

keep

  • 最印象深刻的实习
  • 图的bfs,dfs实现
  • 矩阵中最长的连续1的个数
  • 数组最大连续和
  • 矩阵(0,0)到右下的最短路径
  • 估算附近超市年营业收入
  • 读过印象最深的三本书(喵喵喵??

今日头条

  • 自我介绍
  • 聊项目
  • xgboost如何做到自定义损失函数
  • 旋转数组查找
  • 两个排序数组求交集(归并)
  • logistic回归梯度推导
  • 手写logistic
  • 统计与机器学习关系
  • ab测试如何检验
  • bayes调参原理
  • xgb,lgb,gbdt区别,为什么lgb速度更快
  • ftrl算法
  • lstm时间怎么处理的
  • 求中位数,线性时间,复杂度分析
  • 比赛调优方法论

第四范式

  • 很简单的代码题,忘了
  • 介绍一下自己
  • 对我的机器学习项目simple_ml很感兴趣,介绍一下
  • 如何实现自动化的
  • 聊一下你的kaggle比赛
  • 如何进行特征工程的,详细步骤
  • 为什么gbdt效果好于lr
  • 如果x1和x2两个特征,而x1/x2这个特征很关键,现在我们不知道,只将x1,x2作为特征,那么lgb能捕捉到x1/x2吗?决策边界是怎么样的?
  • 其他的忘记了。。。

宜信

  • 第一类错误和第二类错误,以及与p值的关系,一类二类错误相加与1的关系
  • auc值是怎么计算出来的,f1呢
  • 什么是交叉熵
  • 为什么logistic回归用交叉熵损失而不是平方损失
  • 说一下L1和L2正则
  • L1为什么可以进行特征选择,L1和L2有什么区别
  • 为什么L1和L2可以减少过拟合?
  • 回归的通式解,知道ridge的通式解吗?
  • 逐步回归说一下,什么是前向后向算法
  • R方约高效果越好吗?调整后R2越高效果越好吗?
  • 排序算法了解啥,写一下堆排序
  • 了解learning to rank哪些算法
  • 概率题:n个服从0-1均匀分布的数字最大值的期望是多少
  • 算法题:最长递增子串
  • 说一下项目
  • xgboost与gbdt的区别
  • 决策树如何防止过拟合
  • xgboost如何防止过拟合
  • 为什么xgboost不用后剪枝
  • 算法题:最长叶节点之间的路径
  • 概率题:连续抛出“正正”硬币的期望次数
  • 聊项目

趣头条

  • KD树介绍
  • 介绍kaggle项目
  • 局部敏感hash,哪些hash函数
  • svm核函数,时间复杂度
  • 写一个二叉树的层次遍历,看代码风格
  • sql题 学生-课程-成绩表,输出每个课程排名前2的学生名称
  • L1, L2正则,区别,为何L1能做稀疏
  • BP推导
  • 哪些损失函数
  • 知道Selu吗
  • ReLu什么时候会导致神经元死亡
  • ReLu除了导致神经元死亡还有什么区别
  • XGboost, lightgbm与gbdt的区别
  • 编程题:happy数,对一个数每个位上的数字取平方,加总,重复此过程,直到成环,此时不为1则为happy数,问判断一个数是否为happy数
  • 当误判损失不一样的时候,怎么处理
  • KD树了解吗
  • ANN算法了解吗

感言

以后再写吧

#面经##秋招##算法工程师##字节跳动##宜信##第四范式##Keep#
全部评论
感谢分享!
点赞 回复 分享
发布于 2018-10-30 14:55
竟然在牛客看到spacemacs用户
点赞 回复 分享
发布于 2018-10-30 15:18
刘建平博客好评
点赞 回复 分享
发布于 2018-10-30 15:43
天,这种学校都...,果然牛人不分学校,佩服三连。楼主厉害顶顶顶
点赞 回复 分享
发布于 2018-10-30 15:45
大佬厉害呀,不过话说大佬实验室不管吗?有那么多时间学     
点赞 回复 分享
发布于 2018-10-30 15:47
向大佬学习
点赞 回复 分享
发布于 2018-10-30 16:15
大佬太强了,orz
点赞 回复 分享
发布于 2018-10-31 12:56
kaggle top%2大佬太强了👍,能不能分享下kaggle比赛的经验?
点赞 回复 分享
发布于 2018-10-31 14:29
竟然能在牛客网上看到外贸的程序员大佬 佩服佩服 学习了
点赞 回复 分享
发布于 2018-11-01 00:05
依图的cv算法…厉害了……要求可是leetcode的hard难度的
点赞 回复 分享
发布于 2018-11-01 01:29
膜拜楼主~~~ 楼主能发下simple_ml的链接嘛? 我最近打算造个自己的小库,想看看楼主的源码学习一下~
点赞 回复 分享
发布于 2018-11-01 04:55
膜拜
点赞 回复 分享
发布于 2018-11-02 00:17
大佬有githib吗?我想粉一下。。
点赞 回复 分享
发布于 2018-11-04 13:27

相关推荐

比亚迪汽车新技术研究院 硬件工程师 总包21左右 硕士
点赞 评论 收藏
分享
27 285 评论
分享
牛客网
牛客企业服务