闲敲code落灯花

2020-10-17 16:19 上海交通大学算法工程师

关注

如何处理样本分布不均衡

SMOTE过采样算法

参考https://blog.csdn.net/qq_33472765/article/details/86561557

简单来说smote算法的思想是合成新的少数类样本，合成的策略是对每个少数类样本a，从它的最近邻中随机选一个样本b，然后在a、b之间的连线上随机选一点作为新合成的少数类样本。

    model_smote=SMOTE()    #建立smote模型对象
    x_smote_resampled,y_smote_resampled=model_smote.fit_sample(x,y)
    x_smote_resampled=pd.DataFrame(x_smote_resampled,columns=['col1','col2','col3','col4','col5'])
    y_smote_resampled=pd.DataFrame(y_smote_resampled,columns=['label'])
    smote_resampled=pd.concat([x_smote_resampled,y_smote_resampled],axis=1)
    groupby_data_smote=smote_resampled.groupby('label').count()

全部评论

推荐最新楼层

07-07 15:18

门头沟学院嵌入式工程师

一句话说明现在的就业形势有多差

怎么起名字：早知道就不读书了，害得我送外卖还得扶眼镜

点赞评论收藏

分享

07-10 15:05

天津理工大学测试工程师

大厂实习想跑路，是我抗压能力差吗？

鼠鼠在节子实习两周光速跑路（强度太大，受不鸟），随后入职现在的厂。虽然该厂也素有强度大的名声在外，但刚来的时候觉得组里氛围好，带教有耐心，深感自己终于遇到了命中情组。然而，事情在本周开始发生变故，作为暑期实习生，mt要求我开始独立承担小项目，我手忙脚乱地搞定了，结果发现因为这个项目优先级没那么高，所以mt没有写任何文档，之前汇报的时候都是现写现卖。本周三汇报了项目，可谓是漏洞百出，被ld说了一顿，说没准备好就不要找他聊，我感觉心理压力很大，是我抗压能力太差了吗？

实习生的蛐蛐区

点赞评论收藏

分享

07-03 14:11

广西大学渠道销售

为什么直接被拒绝了，想知道我做错了什么

😭她没看我的简历就把我刷了    

机械打工仔：我来告诉你原因，是因为sobb有在线简历，有些HR为了快会直接先看在线简历，初步感觉不合适就不会找你要详细的了

投了多少份简历才上岸

点赞评论收藏

分享

不愿透露姓名的神秘牛友

07-07 11:20

我也是个找到实习的人了...

通过一个月不停的海投面试被拒绝，也算是接到了offer啊啊啊啊太不容易了😭😭😭

破防地球online...：接好运

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

46141次浏览 357人参与

# 夸夸我的求职搭子 #

199804次浏览 1917人参与

# 你认为小厂实习有用吗？ #

16953次浏览 212人参与

# 三一重工求职进展汇总 #

13007次浏览 60人参与

# 应届生，你找到工作了吗 #

19352次浏览 144人参与

# 硬件应届生薪资是否普遍偏低？ #

75053次浏览 518人参与

# 说说你知道的学历厂 #

32280次浏览 190人参与

# 计算机有哪些岗位值得去？ #

14901次浏览 142人参与

# 下班后的时间你怎么安排 #

8860次浏览 129人参与

# 材料人，你们签了哪个公司 #

7181次浏览 17人参与

# 你找工作的时候用AI吗？ #

16404次浏览 209人参与

# 面试尴尬现场 #

27781次浏览 187人参与

# 哪一瞬间觉得自己长大了 #

8147次浏览 183人参与

# 在职场上，你最讨厌什么样的同事 #

14911次浏览 151人参与

# 社会教会你的第一课 #

32148次浏览 420人参与

# 中核求职进展汇总 #

20498次浏览 152人参与

# 电网笔面经互助 #

36508次浏览 354人参与

# 简历当中有水分算不算造假？ #

25873次浏览 380人参与

# 神州信息工作体验 #

16398次浏览 75人参与

# 学历贬值真的很严重吗？ #

22256次浏览 162人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务