人工智能与机器学习背后的数学

机器学习工程师的核心知识

人工智能与机器学习背后的数学

Photo from movie A Beautiful Mind (2001)

面对现实吧,数学远非一帆风顺。 要学习它,我们经常缺乏时间,最重要的是缺乏动力。 为什么我们需要所有这些符号和一堆数字? 这些有什么意义? 事实证明,很有意义。 特别是如果您与机器学习有关。

这里的重点不是获取知识,而是能够使用知识。 例如,您可能有兴趣通过查看带有超参数的黑框而不是使用随机选择的超参数来查找模型的工作方式。 在没有数学知识的情况下完成此任务,您就像是锤子一样的婴儿。

因此,要处理所有问题,有必要通过研究战士的困难方法并提出许多问题,例如-为什么? 哪里? 为了什么?

但是,如果您有勇气加剧所有动荡,那么最终,您将拥有愉悦的感觉! 有机会成为熟练的机器学习专家的胜利者的感觉。 有趣吗? 这是一个直观且对初学者友好的指南,可帮助您完成此操作。

让我们谈谈科学!

机器学习的基本数学

数学相当艰巨,需要深入理论。 但是对于机器学习而言,数学不是要处理数字,而是要处理正在发生的事情,发生原因的原因以及我们如何处理不同的事物以获得所需的结果。 在深入探讨复杂术语之前,我建议您先依靠直觉,而不要记住公式。

以下是我们学习过程的简要概述:

统计可能性多元微积分线性代数

对于每个组件,我都分享了主要概念和有用的材料供您学习。

统计人工智能与机器学习背后的数学

source: reddit

很难高估统计数据对任何级别的机器学习的重要性。 所有经典的机器学习都基于统计学习,标准的A / B测试也基于此。

统计是工具的集合,您可以使用这些工具来获取有关数据的重要问题的答案。 我们需要它来帮助将观察结果转化为信息,并回答有关观察样品的问题。

要了解的概念:描述性统计,分布,假设检验和回归。 除此之外,我建议特别注意贝叶斯概率论

条件概率,先验概率,后验概率,最大似然估计。 就这样。

书籍和课程:

《All of Statistics: A Concise Course in Statistical Inference》 :统计推断简明课程-拉里·瓦瑟曼(Larry Wasserman)。 本书给出了概率论和统计学的所有基本规定。 它分为三个部分; 它们是:概率,统计推断,统计模型和方法。 这本书确实有参考或百科全书的感觉。 因此,有很多章节,但是每个章节都是独立的。《Introduction to Statistical Machine Learning》统计机器学习简介-Gareth James。 这是另一本优秀的书籍(带有免费的PDF版本),示例是R语言的使用。《Statistics Fundamentals Succinctly》简洁的统计基础知识-Katie Kormanik。 前几节提供了基本定义,包括插图和注释,最后几节揭示了T检验和Z检验的重要性。 这些材料以一种易于使用的语言进行呈现,并具有最少的数学工具。 从实用的角度来看,该指南是对统计的极好的介绍。数据分析和统计课程-统计学初学者课程。 涵盖所有基本概念。 这些课程涵盖机器学习,业务分析,概率,随机化,定量方法等主题。概率论人工智能与机器学习背后的数学

source: giphy

了解了统计学的一些基本概念之后,您可能会发现概率和统计学是两个紧密相关的数学主题,但是有什么区别呢? 概率用于预测未来事件的可能性,而统计涉及对过去事件发生频率的分析。

好吧,不可否认,概率是机器学习领域的支柱。 为什么这样? 机器学习是关于根据不确定的数据开发预测模型。 不确定性意味着使用不完美或不完整的信息。 机器学习的不确定性主要来自三个方面,它们是:嘈杂的数据,问题域的不完全覆盖以及不完善的模型。 是的,我们可以使用概率工具来管理不确定性。

要知道的概念:联合概率,边际概率和条件概率; 分布,最大似然,熵,密度估计,贝叶斯概率,分类。

书籍和课程:

《Probability for Machine Learning — Discover How To Harness Uncertainty With Python》机器学习的可能性-探索如何利用Python把握不确定性-Jason Brownlee。 正如作者所承诺的那样,这本书将有助于您消除等式,希腊字母和混乱,并有可能真正需要知道的主题。 好吧,我完全同意,这是发现概率的最佳书籍之一。《Probability for Machine Learning》机器学习的概率论-一篇不错的文章,提供了根据概率解决问题的技巧。斯坦福大学(Stanford)的"概率与统计"(Probability and Statistics)-这是一门获得有关概率与统计的深刻见解的最佳课程之一,以便为机器学习奠定坚实的基础。多元微积分人工智能与机器学习背后的数学

source: giphy

我们的下一站是多元微积分。 为了填补统计方面的空白,是时候开始研究多元演算了。 尽管乍一看,但这似乎是大学唯一需要的,如果没有微积分,您将无法应对反向传播,也无法以定性的方式掌握深度学习课程。 所有这些东西比您想象的重要。

简而言之,微积分是用于分析函数及其输入之间的关系的一组工具。 在多元演算中,我们可以采用具有多个本科输入的函数,并分别确定每个输入的影响。

要知道的概念:微分和积分,偏导数,向量值函数,方向梯度,hessian,雅可比,拉普拉斯和拉格朗日分布。

课程:

微积分— edX —麻省理工学院的一门课程,包括3个部分:微积分1A:微分-一种寻找导数,其几何解释和物理意义的课程。微积分1B:积分—有关查找积分,积分与导数的联系以及在工程设计,科学分析,概率论和统计中的应用的课程。微积分1C:坐标系和无穷级数—有关计算曲线,坐标系,逼近多项式和无穷级数的课程。 所有这些对于建立现实世界的数学模型都是必需的。可汗学院(Khan Academy)的多变量演算-仅适用于基础内容。 当补充其他资源时,它很棒。线性代数

最后但并非最不重要的。 线性代数-用于机器学习的日常食材。 在这里最好发挥您的大部分注意力。 为什么? 否则,您将无法开发机器学习方法,无法仿真各种对象的行为或无法优化聚类过程并减少数据描述的维度。 换句话说,没有线性代数就无法生存。

毕竟,机器学习程序实际上是线性函数,可用于添加数据以获取一些可预测的结果。 如果您的任务是确定两种现象之间的关系,请使用线性回归。 当某些数据需要分类时,逻辑回归可以为您提供帮助。 主成分分析方法和支持向量机方法,正则化函数,梯度下降-所有这些工具都可以帮助ML工程师进行日常工作。

要知道的概念:向量和向量空间的概念; 线性算子的概念; 操作符和矩阵的沟通; 矩阵分解(至少LU,SVD); 特征向量和特征值; 正交,运算符; 对称和厄米算子; 二次形式,简化为主轴。

书籍和课程:

AppliedAICourse的机器学习线性代数—本课程是学习机器学习线性代数的最佳方法之一。 它有助于从现实世界中的业务问题转变为针对该问题的初切,可工作和可部署的AI解决方案。线性代数麻省理工学院开放课件—本课程涵盖矩阵理论和线性代数,重点介绍在其他学科(例如物理学,经济学和社会科学,自然科学和工程学)中有用的主题。《Matrix Computations》矩阵计算,Gene Golub和Charles Van Loan —理解与矩阵算法实现相关的数值问题的好资源。 您可以定期使用它来编写源代码,以解决需要本书中讨论的概念的问题。我的更快学习数学的技巧认识并接受这样的事实,通过轻按一下开关就不可能成为一名优秀的数学家。 如果您遇到一个比您更能解决数学问题的人,请不要因缺乏对学科的能力或缺乏知识而自责。每天运动。 随时随地锻炼身体。 从您的习惯中消除对社交网络,电视,视频游戏等的漫无目的地的观看。打开您的意志力!不要运动太久。 休息一下。 否则,您可能会面临倦怠和动力不足的风险。 有时可以将活动休息一两天,但不要太频繁,这很有用。确保有两个笔记本:一个用于理论,另一个用于实践。 为每张纸编号。 在理论笔记本的背面页上创建一个目录(主题—页面)。 将来会为您派上用场。如果您在问题中得到的答案错误,请再次解决。 无需提出借口并推迟第二个决定。 在这种情况下,重要的是不仅要找到正确的答案,而且要弄清楚为什么上次您不正确地解决了问题。

我可以在不知道数学的情况下进行机器学习吗? 您可以-使用现成的库,在Internet上为每个任务找到必要的算法,并将其应用于数据。 但是,真正的专业人员可以理解这些工具背后的原理,因此可以更有效地与他们合作。

通常,为了拥有足够的数学背景,您不必长时间陷于每个概念。 仅研究受当前任务范围限制的内容,而不是连续研究所有内容,效率更高。

我还要说的是,一个人的记忆安排得如此之多,以至于忘记了所有不需要的东西。 教授"可能需要"意味着浪费时间。 甚至那些需要它的人也必须再次学习。 记住这一点。

#学习路径#
全部评论
感谢楼主,点赞收藏评论三连了
点赞 回复 分享
发布于 2022-01-21 18:35
有人想试试游戏ai公司吗,启元世界,做rl的,a轮刚融了三亿,最近算法和开发都在大量招,应届基本都能给到30~40k*16薪,额外有期权签字费房补,1075不加班(卷王别来),感兴趣可以找我内推。
点赞 回复 分享
发布于 2022-03-19 04:59

相关推荐

不愿透露姓名的神秘牛友
11-12 08:53
点赞 评论 收藏
分享
评论
点赞
1
分享
牛客网
牛客企业服务