牛客题解官

02-05 16:01 清华大学 Java 发布于北京

关注

题解|实现 k-Means 聚类算法

实现 k-Means 聚类算法

https://www.nowcoder.com/practice/dc90d7c8b7bd44ac8b5029f830cd2e65?tpId=377&tags=&title=&difficulty=0&judgeStatus=0&rp=0&sourceUrl=%2Fexam%2Foj

k-Means 聚类算法（k-Means Clustering）是一种常用的聚类算法，用于将数据集分为 $k$ 个簇。具体步骤如下：

随机选择 $k$ 个点作为初始聚类中心。
将每个点分配到最近的聚类中心本题使用欧几里得距离作为距离度量，即 $d(x, y) = \sqrt{(x_1 - y_1)^2 (x_2 - y_2)^2 \cdots (x_n - y_n)^2}$
更新聚类中心为每个簇的平均值。
重复步骤2和步骤3，直到聚类中心不再变化或达到最大迭代次数。

通俗点说，就是把n个人分到k个组中，每次都要计算每个人到每个组的距离，然后选择距离最小的组，然后更新组中心。这样最后每个人都会分到离他最近的组中。

标准代码如下

def euclidean_distance(a, b):
    return np.sqrt(((a - b) ** 2).sum(axis=1))

def k_means_clustering(points, k, initial_centroids, max_iterations):
    points = np.array(points)
    centroids = np.array(initial_centroids)
    
    for iteration in range(max_iterations):
        # Assign points to the nearest centroid
        distances = np.array([euclidean_distance(points, centroid) for centroid in centroids])
        assignments = np.argmin(distances, axis=0)

        new_centroids = np.array([points[assignments == i].mean(axis=0) if len(points[assignments == i]) > 0 else centroids[i] for i in range(k)])
        
        # Check for convergence
        if np.all(centroids == new_centroids):
            break
        centroids = new_centroids
        centroids = np.round(centroids,4)
    return [tuple(centroid) for centroid in centroids]

全部评论

推荐最新楼层

02-05 14:49

济南大学 Java

杭州来未来日常实习二面

2024 9.26自我介绍负责项目的哪一块介绍项目在做项目的过程中遇到什么困难了吗，是怎么解决的用到什么中间件了吗，比如说redis,rabbitmq 是什么场景下用到的呢如何解决消息重复消费如何解决消息重发那你有考虑过这类问题吗如何解决消息丢失项目中如何解决并发的问题除了Redission还有什么方式syconized可以解决分布式下并发的问题吗那除了分布式锁还有什么方式分布式锁能不能解决重复消费的问题Redisson底层源码有看过吗，那你简单介绍一下Redisson限流操作底层是怎么实现的项目中哪里用到多线程了为什么换成消息队列了线程池的核心线程数什么时候下会走拒绝策略你确定是核心线程数吗...

查看22道真题和解析面筋（烤面筋）

点赞评论收藏

分享

02-08 01:01

四川大学 Java

【2.8更新】25届春招汇总

最近神哥贴子的流量好差，希望大家多多送花点赞收藏转发关注~一键五连🤣神哥也整理了电子版表格(每日更新)，可以一起交流，无偿的~春招已开128家接着上一篇贴子更新（每个月会新建一篇贴子，不然每次审核很慢很慢）：【2.1更新】25届春招汇总上海邮电设计咨询研究院有限公司云浮联通湖北日报传媒集团深度求索DeepSeek华芯天微蓝鸽集团AI产品线爱玛中兵智能创新研究院施强集团山东钢铁集团有限公司横店集团常宝股份凌翔磁浮徐州市教育局直属学校湖南省烟草专卖局系统大能创新长航检测科技（武汉)有限公司交银金科广东省事业单位达飞GBS重庆

投递交银金科等公司10个岗位 >

点赞评论收藏

分享

2024-12-23 23:42

东华大学 Java

26届Java日常实习

人在上海，现在是不都不招了，沟通150，投了15个，真的是太菜了嘛😢小厂不看，大厂看了不回

程序员牛肉：不是，年末懒得招人

点赞评论收藏

分享

01-19 16:26

西安财经大学 C++

准备找实习，简历这样写可以吗 #我的简历长这样#

我的简历长这样

点赞评论收藏

分享

02-07 21:42

东北石油大学 Java

作业帮1面面经

面试时长 40分钟 牛客面试系统出了问题导致面试官日期上没有同步导致面试官迟到了10分钟自我介绍项目经历你最有成就感的需求/项目 怎么做的 难点+ 设计点在哪里程序设计题 5000W用户量的博客系统 用户表 + 博客表如何进行分库分表Redis常用的缓存有哪些redis的基本数据结构mysqlmysql中的索引有哪些聚簇索引跟非聚簇索引之间的区别主键索引跟唯一索引的区别，为什么主键索引查找性能更好事务的性质 ——ACID事务隔离级别什么是脏读幻读事物的原子性通过什么技术手段实现的反问环节

查看12道真题和解析工作一周年分享

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 一觉醒来，秋招难度下降一万倍…… #

46252次浏览 462人参与

# 吉利求职进展汇总 #

60479次浏览 352人参与

# 运营人的第一份offer应该如何选 #

101634次浏览 957人参与

# 你今年的平均薪资是多少？ #

89547次浏览 423人参与

# 运营人求职交流聚集地 #

99383次浏览 872人参与

# 非技术2023笔面经 #

184779次浏览 2069人参与

# 聊聊我眼中的AI #

42943次浏览 1396人参与

# 双非本科的出路是什么？ #

101721次浏览 1013人参与

# 互联网回暖，腾讯要招5000+人！ #

252771次浏览 4830人参与

# 考研失败就一定是坏事吗？ #

54262次浏览 532人参与

# 机械制造面试记录 #

169363次浏览 2018人参与

# 机械人面试中的常问题 #

21875次浏览 329人参与

# 秋招感动瞬间 #

9815次浏览 97人参与

# Offer比较，求稳定还是求发展 #

31631次浏览 195人参与

# 通信硬件2024笔试面试经验 #

175933次浏览 1701人参与

# 大厂还是考编 #

75220次浏览 1275人参与

# 如果可以，你希望哪个公司来捞你 #

46659次浏览 223人参与

# 985本硕1个中小厂offer，摆烂or继续努力 #

97442次浏览 674人参与

# 嵌入式转岗的难度怎么样 #

17477次浏览 369人参与

# 你后悔选择现在的专业吗 #

70213次浏览 626人参与

牛客网
牛客企业服务