机器学习概述

一、机器学习的形式

1.建模问题 (构建模型,主要是数学模型)
2.评估问题 根据评估值判断函数的优劣
②  Sm.classification_report()
3.优化问题 不断提升函数预测的准确性,直到获取能够满足实际需求的最优解

评估模型时主要用:①  Sm.r2_score()  【导入模块性能评价模块】

二、机器学习的分类

1.有监督学习----->已知数据输出(正确答案的示例)对模型不断的训练     【已知数据和其一一对应的标签,训练一个预测模型,将输入数据映射到标签的过程】
回归、分类
2.无监督学习------>无输出数据   【具有数据集但无标签的情况,学习模型是为了推测出数据的一些内在结构
聚类
3.半监督学习------->先无监督学习划分类别,再人工标记通过有监督学习方式来预测输出。
例如:先对水果进行聚类,再识别是哪个类别
4.强化学习
5.批量学习、增量学习
6.基于模型学习、基于实例学习

三、机器学习的一般过程

(一)数据预处理
1.数据收集
2.数据清洗
(二)机器学习过程
3.选择模型(算法)
4.训练模型
5.模型评估
6.测试模型
(三)
7.应用模型
8.模型维护

四、机器学习的基本问题

(一)回归问题
根据已知的输入输出,把预测值带入模型,得到连续的输出
(二)分类问题
--------得到离散的输出(输出有两个值 { 是/否,好/坏 },或者句子表达情绪:正面、负面、中性 )
(三)聚类问题
根据已知输入的相似程度,划分为不同群落
(四)降维问题
在性能损失尽可能小的情况下,降低数据的复杂度,数据规模缩小  (高次项模型转为低次项、二维矩阵变为一维、8*8变为4*4矩阵)

五、数据预处理

(一)目的
1.去除无效数据、不规范数据、错误数据
2.补齐缺失值
3.对数据范围、量纲、格式、类型进行统一化处理,更容易进行后续计算
(二)预处理方式
1.标准化   (均值移除/sp.scale
平均值-预处理后均值为0-标准差(均方差)可以反应一个数据集的离散程度
2.范围缩放  (sp.MinMaxScaler)
将样本矩阵中的每一列最小值和最大值设定为相同的区间,统一各特征值的范围。计算完成后,最小值是0,最大值是1.
3.归一化       (sp.normalize)
反应样本所占比率。用每个样本的每个特征值,除以该样本各个特征值绝对值之和,变换后的样本矩阵,每个样本的特征值之和为1 .
4.二值化       (掩码/sp.Binarizer)
根据一个事先给定的阈值,用0和1来表示特征值是都超过阈值。(二值化编码会导致信息损失,是不可以的数值转换。如果进行可逆转换,需要独热编码 OneHot
5.独热编码     (One_Hot_Encoder)
由若干个0和1 组成  [10 100 1000
01 010  0100]
稀疏矩阵,只用坐标表示非0的值,节省内存
6.标签编码  (LabelEncoder
根据字符串形式的特征值在特征序列中的位置,来为其指定一个数字标签,用于提供给基于数值算法的学习模型。







#机器学习#
全部评论
9-11复习第一遍
点赞 回复 分享
发布于 2022-09-11 14:58 北京
9.12复习第二遍
点赞 回复 分享
发布于 2022-09-12 18:33 北京

相关推荐

理想汽车 - 大模型算法实习生(长期有效,HC丰富,校招也开放ing)职位1-描述【大模型推理(Reasoning)与通用Agent AI】:- 研究通用大模型逻辑推理算法;- 研究o1的训练方案,搜索空间的探索与self-play的训练;- 研究Agent AI算法,助力实现L3智能;职位2-描述【大模型推理(Inference)优化】 :- 研究大模型推理阶段的KV cache 优化算法;- 研究分布式GPU训练优化算法,包括但不限于负载均衡、显存优化等;总结:大模型推理方向,GPU资源丰富,实习+论文,我全都要!我们能提供:1.技术沉淀:参与大模型技术研究,培养解决技术难题的能力。2.实战经验:参与真实业务场景的落地和上线。3.论文产出:发表高水平论文,培养顶会写作能力。4.成长支持:Mentor指导,重视成长,和优秀的人做有挑战的事。我们期待的你:必备项:- 专业背景:计算机、数学、人工智能等相关专业的在校生,统计和强化学习相关方向优先;- 基础能力:理论功底扎实,熟悉LLM、NLP相关算法,精通transformer和RL等相关算法优先。- 工作态度:主动积极,自驱能力强,具有创新意识。加分项:(没有也没关系,我们更看重潜力)5.实习时长:能够长期实习,长期合作。6.竞赛大佬:ACM/OI大神,代码能力出众。7.学术研究:在ML顶会发表论文,研究能力出众。8.相关经验:有大模型推理、模型优化、大模型框架优化和强化学习等相关工作经验。工作地点:- 北京朝阳望京心动了?赶紧砸简历过来吧!📧 简历投递:xuhao12@lixiang.com 简历要求:邮件名及简历标题命名为“姓名-学校-专业-实习时长”和我们一起,驰骋未来吧!🚗
投递理想汽车等公司10个岗位
点赞 评论 收藏
分享
评论
5
16
分享
牛客网
牛客企业服务