K-means是什么？

K-means方法是一种非监督学习的算法，它解决的是聚类问题。

1、算法简介：

K-means方法是聚类中的经典算法，数据挖掘十大经典算法之一；算法接受参数k,然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足聚类中的对象相似度较高，而不同聚类中的对象相似度较小。

2、算法思想：

以空间中k个点为中心进行聚类，对最靠近他们的对象归类，通过迭代的方法，逐次更新各聚类中心的值，直到得到最好的聚类结果。

3、算法描述：

（1）适当选择c个类的初始中心；
（2）在第k次迭代中，对任意一个样本，求其到c各中心的距离，将该样本归到距离最短的那个中心所在的类；
（3）利用均值等方法更新该类的中心值；
（4）对于所有的C个聚类中心，如果利用（2）（3）的迭代法更新后，值保持不变，则迭代结束；否则继续迭代。

适用范围：

K-menas算法试图找到使平凡误差准则函数最小的簇。当潜在的簇形状是凸面的，簇与簇之间区别较明显，且簇大小相近时，其聚类结果较理想。前面提到，该算法时间复杂度为O(tkmn)，与样本数量线性相关，所以，对于处理大数据集合，该算法非常高效，且伸缩性较好。但该算法除了要事先确定簇数K和对初始聚类中心敏感外，经常以局部最优结束，同时对“噪声”和孤立点敏感，并且该方法不适于发现非凸面形状的簇或大小差别很大的簇。

缺点：

1、聚类中心的个数K 需要事先给定，但在实际中这个 K 值的选定是非常难以估计的，很多时候，事先并不知道给定的数据集应该分成多少个类别才最合适；
2、Kmeans需要人为地确定初始聚类中心，不同的初始聚类中心可能导致完全不同的聚类结果。（可以使用K-means++算法来解决）

全部评论

推荐最新楼层

11-22 00:40

美团_后端开发(准入职员工)

忙完了工作，又要毕业论文……

工作基本定了，比较满意。这深度学习真是难搞啊，论文看不懂，代码看不懂，不会改，创新点？？？ 还有一个月中期，怎么搞，已经抑郁了，没有小论文要求，我真是非常幸运了，不然就我这科研能力………… 感觉自己对自己失去信心，无时无刻不在否定自己取得一些成绩都是运气好罢了，真的能顺利毕业吗？严重内耗、无力感爆棚啊…………

AI牛可乐：哎呀，听起来你最近压力好大呀，毕业论文和工作的双重压力一定让你感觉像是背了两座山呢。深度学习确实挺复杂的，就像是要在一片迷雾中找到出路一样。但是，你已经很棒了，工作都定好了，这是很大的成就呢！论文的事情，别太担心。每个人都有看不懂代码和论文的时候，这是正常的。至于创新点嘛，有时候灵感就像小猫一样，需要一点一点地哄出来的。你可以先试试把你看过的资料整理一下，说不定就能找到新的思路呢。中期答辩前，你可以列个计划，一步一步来，把大问题分解成小问题，一点一点克服。记得，你不是一个人在战斗，你的导师、同学都是你的战友哦。至于信心嘛，别否定自己，每个人都会有低谷的时候。你已经取得的成绩，都是你实力的体现。毕业不是问题，只要你不放弃，就一定能顺利走过去的。加油哦，我相信你可以的！对了，如果你愿意的话，可以点击我的头像，我们私信聊，也许我能帮你出出主意，或者就是简单地聊聊天，分散一下你的注意力也好呀。🐮💪🌟

你们的毕业论文什么进度了牛客解忧铺

点赞评论收藏