知识点记录(四)——机器学习相关基础

1.信息增益,信息增益率与Gini系数

  • 信息熵 plogp求和
  • 信息增益
  • 信息增益率
  • Gini系数 1-p^2
  1. 精确率与召回率(Precision and Recall)
  • 精确率:预测为真中真正为真的
  • 召回率:为真的样本被预测正确的比率
  1. bagging与boosting
  • bagging:每次训练一个模型,分类问题进行投票,回归问题进行平均值计算
  • boosting:不断训练模型拟合前一个模型的残差
  • bagging降低方差(variance),boosting降低偏差(bias)
  1. 如何解决过拟合问题
  • 获取更多数据
  • 使用合适的模型,减少网络层数或神经元个数
  • 正则化(L1,L2正则): L1正则:倾向于产生少量特征,其他特征为0,增加网络稀疏程度; L2正则:选择更多特征,这些特征都趋向于0,使用更多 可以从L1,L2正则公式入手理解,L1为特征绝对值之和,L2为平方和,求导以后的函数图像
  • dropout:神经元随机失活,减少固定神经元之间的关联,类似于bagging策略
  • 提前停止
全部评论

相关推荐

小红书 后端选手 n*16*1.18+签字费期权
点赞 评论 收藏
分享
沉淀一会:1.同学你面试评价不错,概率很大,请耐心等待; 2.你的排名比较靠前,不要担心,耐心等待; 3.问题不大,正在审批,不要着急签其他公司,等等我们! 4.预计9月中下旬,安心过节; 5.下周会有结果,请耐心等待下; 6.可能国庆节前后,一有结果我马上通知你; 7.预计10月中旬,再坚持一下; 8.正在走流程,就这两天了; 9.同学,结果我也不知道,你如果查到了也告诉我一声; 10.同学你出线不明朗,建议签其他公司保底! 11.同学你找了哪些公司,我也在找工作。
点赞 评论 收藏
分享
在评审的大师兄很完美:像这种一般就是部门不匹配 转移至其他部门然后挂掉 我就是这样被挂了
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务