如何处理样本分布不均衡

SMOTE过采样算法

参考https://blog.csdn.net/qq_33472765/article/details/86561557

简单来说smote算法的思想是合成新的少数类样本,合成的策略是对每个少数类样本a,从它的最近邻中随机选一个样本b,然后在a、b之间的连线上随机选一点作为新合成的少数类样本。

    model_smote=SMOTE()    #建立smote模型对象
    x_smote_resampled,y_smote_resampled=model_smote.fit_sample(x,y)
    x_smote_resampled=pd.DataFrame(x_smote_resampled,columns=['col1','col2','col3','col4','col5'])
    y_smote_resampled=pd.DataFrame(y_smote_resampled,columns=['label'])
    smote_resampled=pd.concat([x_smote_resampled,y_smote_resampled],axis=1)
    groupby_data_smote=smote_resampled.groupby('label').count()
全部评论

相关推荐

2025-12-08 15:40
湖南农业大学 Java
双非后端失败第N人:1. 海投2000份,你这个学历不出意外应该可以拿到10个左右的小厂面试机会 2.不用care公司规模,只要是个公司就去,双非没有选择权。 3.进去之后把你简历上的项目都删掉,换成公司的生产项目,产出就看正职做了什么 4.你如果运气比较好,应该可以进个几百人的小厂,运气如果不是很好,那可能就几十人的小作坊。别担心,双非开局就是这样的。大家都这么一步步来的 5.然后开始慢慢跳,一边偷产出一边继续投简历。
简历中的项目经历要怎么写
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务