《神经网络基础概念》-入门级AI学习-还学不废,来找打!
神经网络基础概念
前言:这个基础概念分为七个部分:
本章将从1.1神经元-1.2感知器-1.3激活函数
下一章从1.4前向传播-1.5反向传播
下下章从1.6卷积神经网络-1.7循环神经网络
1.1 神经元:
下面将从神经元的组成、特性、类别对生物神经元和人工神经元进行大致的介绍类比。
首先用人脑的神经元类比一下AI里面的神经元,加深一下对神经元的理解:
1. 生物神经元:
在生物上,生物神经元是通过突触进行传递:轴突传导信号、树突接收信号,完成整个的信息交换。而人工神经元也是类比生物神经元进行的设计,具体如下表所示。包括输入、输出、求和、传导内容等。
由于传导的信号不一定是线性的(即一根有斜率的直线),存在非线性的信号(弯曲的非规律的曲线),所以需要引入激活函数去进行所有类型神经信号的还原。即存在公式:
人工神经元=线性函数+激活函数(见1.3具体介绍)
2. 神经元的特性:
生物神经元特性:
兴奋性(达到某个阈值进行传导) 、传导性(信息传导)、时空整合性(对不同时间来的信号、区域分布传递来的信息整合)同样类比生物神经元的特性,人工神经元也存在对应的特性内容:
神经元的类型:
总结:人工神经网络:多个神经元一起协作完成复杂功能,通过一定的连接方式或信息传递方式进行协作的神经元可以看做是一个网络;(ANN)包括输入层、隐藏层、输出层感觉神经元(输入)、运动神经元(输出)、联络神经元(联络)
3. 神经网络类别:
- 前馈网络(一直向前传递,比如卷积神经网络CNN)
- 反馈网络(将信息及时反馈,比如循环神经网络RNN,图中的红色箭头)、
- 图网络(信号无特定方向,保存非结构化数据[即无法用行列表格来表达之间关系的数据],比如知识图谱)
1.2 感知机:最简单的人工神经网络
构造人工神经网络,先要从构造构造神经元的最小节点说起,比如生物神经元的细胞体,而在人工神经元里面,要从感知机说起。
1. 单层感知机:本质是一个二分类器,缺点是:无法处理非线性数据,如下图所示。
-
2. 隐藏层:为了处理非线性问题,需要多个感知机进行处理(多层感知器),即出现隐藏层的概念(隐藏层数越多,分辨能力越强),即更好的线性划分不同类型的数据。用下面图示进行解释:
输入特征是:身高、胸围、腿长、脸长等,输出人名:彭于晏、我、路人
在隐藏层H1表达的特征为身材匀称程度,表现出身材特征如何和五官特征,H1的特征输入H2表达那就是再划分帅气程度、身材好坏,根据这些结果判断:你是路人!
那么是不是隐藏层约多就越好呢,可以特征划分的更清楚?--->答案是否定的,大家可以带着这个问题想一想应该是如何?
多层感知机的出现,让神经元不是一个独立个体,开始形成“群居”现象,即开始出现了网络。在网络扩张反面,可以采用以下三种方式进行扩张:
1.3 激活函数:处理非线性问题,应对复杂的情况
激活函数,在感知器的处理的后端,进行激活函数处理完的数据,开始呈现非线性分布,如下图的红蓝两个区域所示。 常见的激活函数有Sigmoid函数、Tanh函数、Softsign函数、ReLU函数、Softplis函数、Softmax函数等,具体可见下文的简单解释。需要对此类型的激活函数有一个大致的了解,了解不同类型激活函数的好处与坏处,以便在不同的场景选择不同的激活函数进行神经网络的构建。
- Sigmoid函数:中央区信号强,两处信号弱 优点:单调连续,求导容易,输出有界(容易收敛) 缺点:两处导数为0,梯度消失现象明显【在神经网络中,当前面隐藏层的学习速率低于后面隐藏层的学习速率,即随着隐藏层数目的增加,分类准确率反而下降了。 这种现象叫梯度消失。】
- Tanh函数:关于0点对称,变化更加敏感,可以解决梯度消失问题 优:非线性单调上升和下降,容错性较好 缺:饱和状态将会影响结果的精确值
- Softsign函数:变化更加的平坦,更高效的去学习,可以高效解决梯度消失问题
- ReLu函数:优:有效缓解梯度消失问题 缺:没有上界,训练发散;0出不可导;0出导数棱角不够平滑
- Softplus函数:相对ReLu更加平缓
- Softmax函数:函数取值囊括在0-1之间
如何选择激活函数?
非线性、连续可微性、有界性、单调性、平滑性(从以上几个层面的特性组合去选择对应的激活函数)
总结:本章节对神经网络的基础概念中的:人工神经元组成、特性、类别、感知器、激活函数进行了大致的介绍,接下来大家可以阐释一下能否回答以下问题,测试一下掌握程度:
1. 人工神经元的组成?
2. 人工神经元怎么处理非线性数据信号?
3. 人工神经网络类别?
4. 隐藏层的作用?
5. 激活函数的作用?
欢迎留言评论答案,咋们一起监督打卡,互相学习!!!
学习码字不易,希望一键三连~~~祝uu们offer+++++
#在找工作求抱抱##人工智能#
入门级AI学习-深度学习 文章被收录于专栏
内容:入门级AI课程学习(深度学习领域) 适用人群:初学者、入门级小白研发/产品/测试等 覆盖范围: 1.神经网络基础概念 2.数据集处理 3.网络构建 4.正则化 5.优化器 6.初始化 7.参数调节 8.深度置信网络 9.卷积神经网络 10.循环神经网络