AI专业术语(三)
- 机器学习管道(Machine learning pipeline):一种处理原始数据并构建模型的自动化流程。
- 卷积神经网络(Convolutional neural network):一种特殊类型的神经网络,处理图像和视频数据。
- 循环神经网络(Recurrent neuralnetwork):一种特殊类型的神经网络,可以处理序列数据。
- 神经网络架构搜索(Neural architecture search):一种自动寻找神经网络架构的技术。
- 神经元(Neuron):神经网络中的基本单位,接收输入并生成输出。
- 激活函数(Activationfunction):神经网络中的一种函数,用于在神经元之间传递信息。
- LSTM(Long short-term memory):一种循环神经网络架构,可以有效地处理长序列数据。
- GRU(Gated recurrent unit):一种循环神经网络架构,比LSTM更简单且计算成本更低。
- 自注意力机制(Self-attention mechanism):一种用于处理序列数据的注意力机制。
- 梯度下降(Gradientdescent):一种优化算法,用于调整神经网络中的权重,使损失函数最小化。
- 随机梯度下降(Stochastic gradient descent):一种梯度下降的变体,每次更新权重时使用随机的小批量样本。
- 批量归一化(Batch normalization):一种神经网络层技术,加速模型的训练提高模型的泛化能力。
- 参数初始化(Parameter initialization):在神经网络训练之前初始化权重和偏差的过程。
- 正则化(Regularization):一种防止过拟合的技术,包括L1、L2正则化、Dropout等。
- 语义分割(Semantic segmentation):一种将图像分割成语义区域的计算机视觉任务。
- 实例分割(Instance segmentation):一种将图像中的不同实例分割成不同区域的计算机视觉任务。
- 目标检测(Object detection):一种在图像或视频中识别和定位多个物体的计算机视觉任务。
- GAN(Generative Adversarial Network):一种无监督学习方法,用于生成与训练数据相似的新数据。
- CGAN(ConditionalGAN):一种生成对抗网络,根据给定的条件生成新的数据。
- VAE(Variational Autoencoder):一种自编码器,使用概率编码和解码,生成可控制的新数据。
- 单阶段目标检测(One-stage object detection):一种用于目标检测的神经网络架构,不需要先预测物体的位置和大小。
- 两阶段目标检测(Two-stage object detection):一种用于目标检测的神经网络架构,需要先预测物体的位置和大小,然后进行分类。
- 数据增强(Data augmentation):通过对训练数据进行旋转、平移、缩放等变换,扩充训练数据集的大小,从而提高模型的泛化能力。
- 超参数(Hyperparameter):在训练模型之前需要手动设置的参数,例如学习率、正则化强度等。
- 网格搜索(Gridsearch):一种调节超参数的方法,遍历给定的超参数空间,找到最佳超参数组合。
- 随机搜索(Random search):一种调节超参数的方法,随机选择超参数组合进行训练,找到最佳的超参数组合.
- 模型微调(Fine-tuning):在一个预训练模型的基础上,使用新的数据集重新训练模型的过程。
- 迁移学习(Transfer leaning):利用一个训练好的模型参数来初始化另一个模型,解决新的任务。
- 多任务学习(Multi-task learning):在一个神经网络中训练多个相关任务的技术。
- 无监督学习(Unsupervised learning):一种机器学习的范畴,不需要标注数据作为输入,算法能够自己发现数据中的结构。
- 自监督学习(Self-supervised leaning):一种利用数据本身内在结构进行无监督的学习方法。
- 对抗生成网络(Generative Adversarial Network,GAN):一种无监督学习的神经网络,通过训练一个生成器和一个鉴别器来生成逼真的假数据。
- 长短时记忆网络(Long Short-Term Memory, LSTM):一种循环神经网络,能够有效地处理序列数据,具有记忆单元和遗忘门等特性。
- 强化学习(Reinforcement leaning):一种通过智能体与环境的交互学习最优策略的机器学习方法。
- 奖赏(Reward):在强化学习中,智能体从环境中接收到的信号,用于评估其行为的好坏。
- Actor-Critic:一种使用值函数和策略函数的强化学习算法。
- 强化学习环境(Reinforcement learning environment):用于训练强化学习算法的模拟环境。
- 策略(Policy):在强化学习中,智能体采取的动作的规则。
- Q-learning:一种基于动作值函数的强化学习算法,可以学习最优的行为策略。