小水滴真的是太可爱了吧

2020-09-22 20:22 门头沟学院产品经理

关注

【机器学习笔记day27】5.1. 非监督学习之k-means

文章目录

5.1. 非监督学习之k-means
非监督学习之k-means

5.1. 非监督学习之k-means

非监督学习之k-means

K-means通常被称为劳埃德算法，这在数据聚类中是最经典的，也是相对容易理解的模型。算法执行的过程分为4个阶段。

1.首先，随机设K个特征空间内的点作为初始的聚类中心。
2.然后，对于根据每个数据的特征向量，从K个聚类中心中寻找距离最近的一个，并且把该数据标记为这个聚类中心。
3.接着，在所有的数据都被标记过聚类中心之后，根据这些数据新分配的类簇，通过取分配给每个先前质心的所有样本的平均值来创建新的质心重,新对K个聚类中心做计算。
4.最后，计算旧和新质心之间的差异,如果所有的数据点从属的聚类中心与上一次的分配的类簇没有变化，那么迭代就可以停止，否则回到步骤2继续循环。

K均值等于具有小的全对称协方差矩阵的期望最大化算法

sklearn.cluster.KMeans

class sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=1, algorithm='auto')
  """ :param n_clusters:要形成的聚类数以及生成的质心数 :param init:初始化方法，默认为'k-means ++',以智能方式选择k-均值聚类的初始聚类中心，以加速收敛;random,从初始质心数据中随机选择k个观察值（行 :param n_init：int，默认值：10使用不同质心种子运行k-means算法的时间。最终结果将是n_init连续运行在惯性方面的最佳输出。 :param n_jobs：int用于计算的作业数量。这可以通过并行计算每个运行的n_init。如果-1使用所有CPU。如果给出1，则不使用任何并行计算代码，这对调试很有用。对于-1以下的n_jobs，使用（n_cpus + 1 + n_jobs）。因此，对于n_jobs = -2，所有CPU都使用一个。 :param random_state:随机数种子，默认为全局numpy随机数生成器 """
from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0],[4, 2], [4, 4], [4, 0]])
kmeans = KMeans(n_clusters=2, random_state=0)

方法

fit(X,y=None)

使用X作为训练数据拟合模型

kmeans.fit(X)

predict(X)

预测新的数据所在的类别

kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)

属性

clustercenters

集群中心的点坐标

kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])

labels_

每个点的类别

kmeans.labels_

k-means ++

全部评论

推荐最新楼层

昨天 18:05

门头沟学院算法工程师

求助|实习方向

个人情况本硕均为双非。目前研二。小论文是神经网络做车道线检测的，SCI4区还在审，准备25年上半年出来实习。问题想找算法岗，因为我觉得开发岗我卷不过已经干了两三年的同龄人，应该差异化竞争，尽量去做研究生的活，大厂的算法岗干不成就去小厂。关键是什么算法岗？AIGC方面？自动驾驶？亦或者数据科学？？我选择什么比较好，实习我觉得很大程度决定我毕业的就业选择，而且我也需要准备实习的面试，所以必须要做决定，希望能得到各位前辈、各位大佬的指点。

牛客帮帮团来啦！有问必答牛客创作赏金赛

点赞评论收藏

分享

12-06 20:51

淘天集团_HR

淘天补录——算法类

是真没想到算法还要补人，之前T计划已经招了一批，加上陆续发放的offer，可能前面毁约的人还是有一部分，牛客随缘再捞点大佬，各位还没签约或者签了的捞们看看这里，流程处理绝对快（别让我求你投了）岗位算法技术未来生活实验室：算法工程师-机器学习、算法工程师-自然语言处理、算法工程师-多模态部门淘天集团算法技术未来生活实验室建议：熟悉LLM或MLLM的训练等技术，或者有相关领域的研究;在ICCV、CVPR等国际顶级会议、期刊上发表论文，或在相关学术会议组织的权威比赛中获奖或在校园内或互联网公司有相关实习或项目经历更佳;以及熟悉算法和infra的多面手们可以用我的内推链接（点击就是直接内推了）...

投递淘天集团等公司10个岗位 >

点赞评论收藏

分享

11-18 10:36

内蒙古民族大学 Java

二本实习简历，初筛都过不去

狠狠的赚一笔😋

听说改名字就能收到offer哈：Radis写错了兄弟

点赞评论收藏

分享

11-30 10:27

University of Oxford 嵌入式硬件工程师

华为开奖，小奖状

华子终于开奖了， all in 党胜利✌️✌️  #华子oc时间线# #华为求职进展汇总# #华为开奖那些事# #秋招OC许愿#

华子oc时间线华为求职进展汇总

点赞评论收藏

分享

12-04 18:28

内蒙古农业大学售后专员

夸夸我的求职搭子嘿嘿

在这里小小的夸夸我的男票，我是学财会的，男票是学国贸的，我俩是在实习认识的，今年都感受到了秋招的残酷，我们彼此加油鼓励，整理校招信息、互相改简历、模拟面试等等，最终都成功有了秋招offer！虽然不知道遥远的未来会怎样，但至少在当下会好好珍惜，不愧对彼此的感情付出~也祝看到这条内容的牛友们爱情offer双丰收❤

机器小狗史努比：本来尿手上就烦

夸夸我的求职搭子

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 25届秋招总结 #

569110次浏览 5816人参与

# 腾讯求职进展汇总 #

222162次浏览 1787人参与

# 百融云创开奖 #

66079次浏览 660人参与

# 被同事甩锅了怎么办 #

6535次浏览 57人参与

# 如果再来一次，你还会学机械吗？ #

24184次浏览 462人参与

# 你都收到了哪些公司的感谢信？ #

3655895次浏览 32083人参与

# 简历被挂麻了，求建议 #

2609136次浏览 34057人参与

# 牛客帮帮团来啦！有问必答 #

2413692次浏览 24890人参与

# 通信硬件薪资爆料 #

681052次浏览 5695人参与

# 国央企薪资爆料 #

33533次浏览 220人参与

# 求职你最看重什么？ #

21653次浏览 156人参与

# 我的求职思考 #

4338721次浏览 58272人参与

# 现在还是0offer，延毕还是备考 #

841236次浏览 6994人参与

# 大家都开始春招面试了吗 #

437460次浏览 5435人参与

# 秋招结束之后的日子 #

19248次浏览 188人参与

# 秋招后遗症 #

4614次浏览 78人参与

# 产品薪资爆料 #

87868次浏览 791人参与

# 实习想申请秋招offer，能不能argue薪资 #

49581次浏览 398人参与

# 牛客激励计划 #

57197次浏览 1478人参与

# 想实习转正，又想准备秋招，我该怎么办 #

505609次浏览 5119人参与

# 大厂无回复，继续等待还是奔赴小厂 #

56706次浏览 356人参与

牛客网
牛客企业服务