kmeans算法是什么?怎么选k

kmeans是一种聚类算法,是先选择k个聚类中心然后不断加数据调整簇心直到簇心变化小于一定阈值则停止。
算法有优点也有缺点,优点是快,消耗内存小。缺点是初始簇心不好确定,算法效果对初始簇心的设置敏感,并且kmeans无法聚类环形类。(DB-SCAN可以)

追问一句,k怎么选择?
有两个种评价聚类好坏的指标,第一个不太知名,叫肘部法,仅计算簇心到簇内其他点的距离和,这个和突然下降的时候就是适合的k值。
第二个是通用的,叫轮廓系数法:s = avg(si),既考虑了内聚度也考虑了分离度,s在0~1范围内,越靠近1越好。
si = (bi-ai)/max(bi,ai),其中bi代表簇心到簇内各个点的平均距离,而ai代表簇心到其他簇心的最小平均距离。
全部评论
DB-SCAN解决环形聚类的方式是:先确定一个邻居数量minPts和半径阈值r,如果某个点包含至少minPts个邻居(距离<=r才算邻居)那就可以当做一个簇心聚类,并且递归地对它的邻居继续使用这个算法拓展边界。
点赞 回复 分享
发布于 2023-10-10 17:06 湖南

相关推荐

评论
3
6
分享

创作者周榜

更多
正在热议
更多
# 春招至今,你的战绩如何? #
9068次浏览 83人参与
# 你的实习产出是真实的还是包装的? #
1662次浏览 40人参与
# 巨人网络春招 #
11296次浏览 223人参与
# 军工所铁饭碗 vs 互联网高薪资,你会选谁 #
7382次浏览 40人参与
# 重来一次,我还会选择这个专业吗 #
433301次浏览 3926人参与
# 简历第一个项目做什么 #
31500次浏览 327人参与
# MiniMax求职进展汇总 #
23729次浏览 306人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
186885次浏览 1118人参与
# 不考虑薪资和职业,你最想做什么工作呢? #
152269次浏览 887人参与
# 研究所笔面经互助 #
118851次浏览 577人参与
# 简历中的项目经历要怎么写? #
309944次浏览 4189人参与
# 面试紧张时你会有什么表现? #
30473次浏览 188人参与
# 你今年的平均薪资是多少? #
212980次浏览 1039人参与
# AI时代,哪些岗位最容易被淘汰 #
63310次浏览 798人参与
# 我的求职精神状态 #
447961次浏览 3128人参与
# 你最满意的offer薪资是哪家公司? #
76415次浏览 374人参与
# 高学历就一定能找到好工作吗? #
64294次浏览 620人参与
# 牛客AI文生图 #
21399次浏览 238人参与
# 你怎么看待AI面试 #
179799次浏览 1229人参与
# 正在春招的你,也参与了去年秋招吗? #
363190次浏览 2636人参与
# 腾讯音乐求职进展汇总 #
160562次浏览 1109人参与
# 职能管理面试记录 #
10795次浏览 59人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务