牛客878327618号

2021-04-10 14:47 大连理工大学大数据开发工程师

关注

KNN与Kmeans

KNN
有监督。如果一个样本在特征空间中的个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。
L1范数距离与L2范数距离
K值选择
1）选择较小的K值，就相当于用较小的领域中的训练实例进行预测，“学习”近似误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是“学习”的估计误差会增大，换句话说，K值的减小就意味着整体模型变得复杂(指的是数值发生一点点改变，分类结果就不相同了，模型的泛化性不佳)，容易发生过拟合；
2）选择较大的K值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少学习的估计误差，但缺点是学习的近似误差会增大。这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单。
3）K=N（N为训练样本个数），则完全不足取，因为此时无论输入实例是什么，都只是简单的预测它属于在训练实例中最多的类，模型过于简单，忽略了训练实例中大量有用信息。
K means
无监督。更新中心点直到中心点停止移动。Kmeans一定会收敛，但是不一定是最优解，因此中心点的初始化很重要。
K means++：对中心点的初始化进行了改进，离已选中心点越远的实例越有可能被选为新增的中心点。
关于K值的选择：以轮廓系数来衡量每个K值得聚类效果

全部评论

推荐最新楼层

11-20 14:15

天津大学算法工程师

工作很好但是想辞职。。。

现在工作待遇很好，互联网双休不打卡，月薪两万五，五险一金顶格交，包吃包住，但就是天天想辞职 总结了一下有这几个原因： 不喜欢目前做的产品，一点兴趣都没有。 不喜欢老板，和他的性格不合拍，相处很累。 管理混乱，干活要把一半时间花在走流程上。 不喜欢这个工作，但是公司很好有名气，肯定能给我简历镀金，待遇也好，纠结……

菜狗二号：6

如果再来一次，你还会选择这个工作吗？

点赞评论收藏

分享

11-17 08:28

沈阳工业大学研发工程师

机考E卷100分题 - 最大报酬

题目描述 小明每周上班都会拿到自己的工作清单，工作清单内包含 n 项工作，每项工作都有对应的耗时时间（单位 h）和报酬，工作的总报酬为所有已完成工作的报酬之和，那么请你帮小明安排一下工作，保证小明在指定的工作时间内工作收入最大化。 输入描述 T 代表工作时长（单位 h， 0 < T < 1000000）， n 代表工作数量（ 1 < n ≤ 3000）。 接下来是 n 行，每行包含两个整数 t，w。 t 代表该工作消耗的时长（单位 h， t > 0），w 代表该项工作的报酬。 输出描述 输出小明指定工作时长内工作可获得的最大报酬。 示例1 输入 40 3 20 10 2...

大厂原题(全网最全，持续... 牛客创作赏金赛

点赞评论收藏

分享

09-29 11:31

重庆财经学院前端开发其它

铁子们，觉得我这简历怎么样，能找到什么样的工作😁，或者给我一点学习建议，我主要想走前端方法，大家都可以说一说，谢谢大家我正在学习当中，目前大四了

牛客377725851号：第一个奖项有点幽默了

点赞评论收藏

分享

11-20 19:59

已编辑

湖南工业大学嵌入式工程师

双非本科嵌入式想找工作还有希望吗

微风不断：兄弟，你把四旋翼都做出来了那个挺难的吧

点赞评论收藏

分享

11-18 16:24

武汉理工大学 golang

虾皮2面 11.16

整体大概持续55min，面试官会从项目中去引申问题和拷打八股，无手撕，体验不错，奈何太久没看八股答得磕磕绊绊项目+实习介绍项目中的各种中间件项目重难点设计模式八股mysql范式概念和生产中的运用mysql四大隔离级别，如实现事务，rr隔离级别下实现原理，事务在项目中的具体应用redis常用数据结构使用redis数据结构设计一个带ack的消息队列redis缓存击穿与解决分布式锁设计逻辑分布式锁不可用时服务的err handle（比如：不知道当前线程是否拿到了锁，能直接释放锁吗？不能释放应该怎么做？）对比rabbitmq和kafka，各自的适用场景hr相关问题项目如何协同办公，开发流程编码...

查看15道真题和解析

点赞评论收藏

分享

点赞 1 评论

全站热榜

正在热议

# 晒一晒我的offer #

9704846次浏览 104821人参与

# 机械只有读研才有出路吗？ #

7901次浏览 103人参与

# 北方华创开奖 #

21033次浏览 244人参与

# 地方国企笔面经互助 #

1910次浏览 6人参与

# 滴滴求职进展汇总 #

78768次浏览 688人参与

# 考研失败就一定是坏事吗？ #

36267次浏览 355人参与

# 机械人，签完三方你在忙什么？ #

22967次浏览 119人参与

# 总结:哪家公司面试体验感最差 #

23450次浏览 115人参与

# 机械应届生薪资要多少才合适？ #

11754次浏览 55人参与

# 学历or实习经历，哪个更重要 #

39055次浏览 280人参与

# 选完offer后，你后悔学本专业吗 #

6557次浏览 43人参与

# 查收我的offer竞争力报告 #

13300次浏览 191人参与

# 机械人怎么评价今年的比亚迪 #

40872次浏览 141人参与

# 应届生被毁约被毁意向了怎么办 #

24056次浏览 230人参与

# 00后45度躺现状 #

33490次浏览 294人参与

# 没有合适的工作，你会先找个干着，还是考公考研 #

35301次浏览 392人参与

# 秋招OC许愿 #

224040次浏览 1854人参与

# 如果能重来，就业or读研你选哪个？ #

45268次浏览 333人参与

# 大疆求职进展汇总 #

402640次浏览 2869人参与

# 实习，投递多份简历没人回复怎么办 #

2381564次浏览 34165人参与

# 双非能在秋招上岸吗？ #

98965次浏览 768人参与

牛客网
牛客企业服务