携程面试-机器学习问题求教

今天面携程的时候被问了这两个问题,求大佬指导
1. 逻辑回归在数据量特别大的时候,能不能用极大似然估计求损失函数,如果不能的话用什么方法(逻辑回归损失函数难道不都是极大似然求的吗?)
2. 类别不平衡怎么处理。我回答上下采样和调整阈值。面试官说调整阈值是为了增大少类别的训练,那还有没有别的方法可以做到这点呢,不能改变样本
#携程#
全部评论
2.如果一类样本是在太少的话,可以变成异常检测,或者是将二分类问题转化成多分类问题
点赞 回复 分享
发布于 2020-08-18 17:44
1、极大对数似然法? 2、scale_pos_weight\max_delta_step?
点赞 回复 分享
发布于 2020-08-18 17:47
第二个或许可以更改损失函数的权重,但我觉得这和上采样等价呀
点赞 回复 分享
发布于 2020-08-18 18:08
问题1或许可以改成[-1,1]的逻辑回归,如此一来样本空间就大了,不知道可不可行?
点赞 回复 分享
发布于 2020-08-18 19:59
data augmentation
点赞 回复 分享
发布于 2020-08-18 22:07
第一问的话可能面试官想知道具体怎么求极大似然吧😂可以对函数直接求极值点,也可以用梯度下降法求,数据多的话还可考虑随机梯度下降或者小批量
点赞 回复 分享
发布于 2020-08-18 22:18
楼主你的问题也太难了,感觉我这个没问多少技术,好水啊,可能我太菜,问不出个啥
点赞 回复 分享
发布于 2020-08-19 14:39

相关推荐

11-22 16:49
已编辑
北京邮电大学 Java
美团 质效,测开 n*15.5
点赞 评论 收藏
分享
点赞 评论 收藏
分享
头像
10-09 19:35
门头沟学院 Java
洛必不可达:java的竞争激烈程度是其他任何岗位的10到20倍
点赞 评论 收藏
分享
点赞 15 评论
分享
牛客网
牛客企业服务