算法方向推荐系统学习路线
资料推荐人简介
211本国科大硕,快手商业化推荐算法工程师准入职,秋招快手、美团offer
机器学习
- 算法:逻辑回归,树模型(传统树模型到GBDT),聚类算法,降维算法
- 八股:比较杂,必须偏差方差、各种loss优缺点及使用场景等
- 书:李航《统计学习方法》(只学相应章节就行),《百面机器学习》(基本囊括了所有八股,但是有的不是一本书都要背,有的章节看一下就行)
- 视频:吴恩达的机器学习课程
深度学习
- 模型:LSTM,GRU,CNN以及Transformer的一些基础知识,尤其是Transformer面试官很喜欢问
- 八股:loss、激活函数、批正则、优化算法等等
- 书:《百面深度学习》(只看对应章节)
- 视频:吴恩达的深度学习课程
推荐系统
- 模型:GBDT、LR、wide&deep、DCN、DIN、DIEN等等,再往后序列模型(DIN、DIEN、DSIN等)和多目标模型(MMoE、PLE等)挑一个扩展一下即可,当然最好是两类都扩展
- 八股:特征工程、复杂度分析、冷启动、召回等
- 书:王喆《深度学习推荐系统》,推荐且只推荐这一本,这本书全部都是重点,前几章的知识点都得会,后面涉及到工程的东西可以先了解即可
工具
语言
- python:主要为两方面,一方面是刷题,另一方面是深度学习框架的使用(tensorflow或者pytorch)
- sql:比较简单,把力扣上的sql题刷完就满足要求了
大数据(不必要但是加分项)
- hadoop:知道原理
- spark:spark可以用pyspark或者scala,自选一个就行
项目
开源项目
我做的是datawhale的新闻推荐系统开源项目,地址FunRec (datawhalechina.github.io)
前后端部分其实可以忽略,这个开源项目主要还是精排环节,可以根据自己的理解在这个基础上做一些扩展。我当时是把这个项目从单机扩展为了分布式,加了召回、冷启动、打压热门item,模型改成了DCN
比赛
不建议kaggle,虽然含金量高,但是很难拿牌子。可以自己找一些现在正在进行的比赛参加,推荐系统的比赛比较少,数据挖掘的也行。名次不重要,主要是丰富简历,并且熟悉特征工程
其他
- 上面的弄完找个实习应该可以了,剩下的就是实习期间的项目积累了,这个纯看自己
- 可以多看看知乎上跟推荐系统相关的文章,推荐系统的知识很多且很碎,很多时候就是看文章慢慢积累的,推荐两个知乎博主王喆和石塔西
- 王喆的《深度学习推荐系统》和石塔西的《互联网大厂推荐算法》,这两本书囊括了推荐系统从实习到秋招的所有问题,基本上所有面试的问题都能在这里面找到答案,值得反复阅读
特此说明
我有幸能认识这么多优秀的同学们,希望能让更多校招的在校同学们了解到各个岗位方向的前沿信息以及准备的资料,能让你在选择就业方向以及准备的过程中有更多参考信息。(信息均为个人看法,仅供参考,希望能帮到你们)
在此也感谢所有推荐学习资料,接受采访的同学们,能够分享你的经验和见解。如果你还有想要了解的方向与资料,或者你也想聊一聊你所在方向的见解,都可以评论区告诉我
#算法#