机器学习专栏大纲
专栏介绍
本专栏专注于机器学习领域的技术与知识点,是五年学习研究的笔记整理,囊括机器学习领域绝大部分常见模型和技术。旨在于让读者可以通过专栏的阅读和学习从原理上理解机器学习以及其中的模型和算法,做到知其然也知其所以然。
对于机器学习中的每一个模型和算法,尽可能做到源码级的剖析,亲自用Python代码实现一个个”高深莫测“的模型,身体力行地体会每一个模型的原理和特点。
如果你仔细阅读本专栏当中的所有文章,相信你不仅可以入门机器学习这个领域,还能获得一定深度的知识积累。相信足够应付大部分相关的面试。
由于篇幅所限,本专栏不包含深度学习以及神经网络的相关内容。
作者介绍
ACM-ICPC亚洲区银牌选手,15年自学机器学习进入阿里实习。后转做了一年时间Java后端,由于兴趣原因再次通过自学通过阿里面试回到算法岗位。前阿里高级算法工程师,现任职于shopee新加坡。
在算法领域有着长达五年的积累和经验,钻研问题喜欢刨根究底,直到挖掘到底层的原理为止。在知乎、掘金、CSDN等多个平台有着自己的专栏博客,由于文章深入浅出,浅显易懂,而拥有大量粉丝。
专栏目录
第一篇 开篇词
专栏简介
第二篇 机器学习简介
大数据、机器学习、人工智能的关联
如何学好机器学习
第三篇 数据处理
Numpy, 高效处理矩阵的科学计算库
Pandas, 像表一样处理海量数据
Matplotlib, 灵活绘制各类图表
第四篇 无监督模型
KNN, 通过邻居找自己
KNN进阶,使用KD-tree优化算法效率
Apriori算法挖掘频繁项集
FP-growth优化Apriori效率
K-means聚类, 面试常见的聚类算法
K-means背后的EM算法
第五篇 有监督模型
最简单的分类模型朴素贝叶斯
最基础的线性回归并不简单
梯度下降、随机梯度下降与批量梯度下降
给线性回归加上分类能力的逻辑回归
分类算法的损失函数是怎么回事
树形结构的分类器决策树模型
使用决策树做回归的回归树模型
纸上推算出来的模型——SVM
第六篇 集成模型
Bagging——从决策树到随机森林
AdaBoost——弱分类器也能逆袭
GBDT,学习残差进一步优化
第七篇 降维算法
PCA,通过线性变换来降低特征维度
SVD,矩阵分解
第八篇 面试准备
机器学习就业方向
算法工程师面试常见问题
适合填充简历的项目准备