想转行数据方向，苦苦找不到方法？看这里，数据方向的完整知识体系送给你！

数据分析/挖掘-岗位要求

阿里巴巴数据挖掘工程师岗位要求：

1.熟练使用统计分析工具例如SQL, excel, SPSS, SAS, R, python等等；

2.掌握常用的数据分析方法，例如数据预处理，单变量描述性统计，多元统计分析如回归，聚类等；

3.良好的数据敏感度,能从海量数据提炼核心结果，有丰富的数据分析、挖掘、清洗和建模的经验；

4.有成本优化效能提升数据分析经验，尤其是供应链相关的优先。

腾讯数据挖掘工程师的岗位要求：

数据分析/挖掘知识体系

一、必备工具-SQL

SQL包括MySQL、hiveSQL/Oracel等，基本语法差不多，掌握其中一种即可，其他的可以用到时在学。SQL的学习需要掌握以内容：

推荐书籍及链接：《SQL必知必会》、牛客网刷题、推荐B站神器

R语言是比较常用的统计分析工具，也是一种简单易学的高级程序语言。R语言的学习需要掌握以下内容

书籍推荐：《R语言实战》、《ggplot2:数据分析与绘图艺术》

Python作为AI的必备工具，需要掌握以下内容：

书籍推荐：《Python编程从入门到实践》、《利用PYTHON进行数据分析》

网站推荐：廖雪峰的官方网站

统计概率是数据挖掘理论知识的基础。在日常的数据分析工作中，常常会用到统计概率论的知识。统计概率涉及到的条件概率、概率分布，统计检验等知识是学习数据挖掘必备的先验条件。

书籍推荐：《深入浅出统计学》《统计学-从数据到结论》

概率论与数理统计是学习机器学习和深度学习的基础，学号线性代数与数理统计更容易理解及机器学习中的各项数学表达式。

线性代数与数理统计需要掌握的知识有：

书籍推荐：《线性代数及其应用》

数据挖掘涉及到数据的清洗、数据挖掘定义，模型理解与运用，模型指标评估等一整套知识体系。

理解并且掌握数据挖掘基础知识，包括代价函数、过拟合、泛化能力、评价标准（精确率、召回率、敏感性、特异性）、划分数据集的方法、处理数据不平衡的方法、bias variance trade-off等
区分监督学习，无监督学习，半监督学习，同时要区分回归于分类模型等常用知识的区别
对于常用模型要有深刻理解并且能够用灵活运用，如随机森林，GBDT， Logistic Regression, svm等，包括每一个算法定义的function、loss function以及求解loss function 的方法。
除了监督学习，还需要掌握主流的无监督学习方法，比如K-MEANS、层次聚类、密度聚类等，掌握评价无监督学习算法优劣的评价标准。
灵活掌握sklearn机器学习库，能有灵活应用到项目实践中
能够高效的检验模型参数，能够正确的运用评估指标进行模型评价

推荐书籍：《机器学习》周志华《统计学习方法》

推荐视频：B站李宏毅机器学习系列课程、吴恩达系列课程