《神经网络基础概念（二)》-入门级AI学习

神经网络基础概念

前言：这个基础概念分为七个部分：

上一章将从1.1神经元-1.2感知器-1.3激活函数

本章从1.4前向传播-1.5反向传播

下一章从1.6卷积神经网络-1.7循环神经网络

前向传播输入信号直至输出产生误差；

误差的接收使用损失函数；

反向传播使用损失函数更新权重矩阵。

输入：样本向量（x）

计算：样本向量各元素经过各隐藏层的逐级加权求和+非线性激活（见底部名词解释）

输出：预测向量（y）

每一个样本经过模型训练后会得到一个预测值，然后得到的预测值和真实值的差值就成为损失（损失越小，说明模型越成功，鲁棒性越好）。损失函数就是为了计算预测值和真实值的差距的一类函数。

均方误差MSE （基于距离度量的损失函数：将数据映射到基于距离度量的特征空间上，将映射后的样本看作空间上的点，采用合适的损失函数度量特征空间上样本真实值和模型预测值之前的距离，距离越小，模型的预测性越好）

公式：

适用于：回归问题（见底部名词解释）求解，度量样本点到回归曲线的距离，通过最小化平方损失使样本点可以更好地拟合回归曲线。

交叉熵损失函数（基于概览分布度量的损失函数：将样本间相似性转化为随机事件出现的可能性，通过度量样本的真实分布于它估计的分布之间的差异情况，交叉熵越小，概览分布越接近）

公式：

适用于：分类问题（见底部名词解释）求解，可以有效避免梯度消散（见底部名词解释）。在二分类情况下也叫做对数损失函数。

输入：损失函数值

计算：链式求导反向传播（求导相乘）

输出：更新每一层 W 网格参数

总结而言，前向传播与反向传播的关系可以如图所示：

附录：（名词解释）

加权求和：权重比求和，比如学校按照不同占比的考试成绩（期中占比40%，期末占比50%，上课占比10%）取最终成绩。
非线性激活：激活函数是为了解决非线性（图像为非直线）问题求解的过程（见上节分享），使用非线性激活，会让隐藏层计算非线性回归问题。
回归问题：机器学习三大模型中重要的一环，功能是建模和分析变量之间的关系。多用来预测一个具体的数值，如预测房价、未来天气情况等等。输出是连续型变量，是一种定量输出。(预测明天的温度是多少度)。
分类问题：分类问题是监督学习的一个核心问题，它从数据中学习一个分类决策函数或分类模型（分类器（classifier）），对新的输入进行输出预测，输出变量为有限个离散值（有一套试卷并有标准答案，写完之后对照正确答案进行比对和学习），包括二分类问题和多分类问题。输出是离散型变量(如: +1、-1)，是一种定性输出。(预测明天天气是阴、晴还是雨)
梯度消散：即梯度消失。是函数上升最快的方向（切线越陡，上升越快）与之相反就是下降最快的方向。