首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
想吃烤肉的长颈鹿风度翩翩
关注
已关注
取消关注
mark
@林小白zii:
机器学习面经-LR
一、简介 LR(Logistic Regression,逻辑回归)虽然名字中带有"回归",但实际上是一种用于分类问题的统计学习方法,而不是传统的回归问题。它是一种广泛应用于机器学习和统计分析的算法,特别适用于二分类问题,也可以扩展到多分类问题。LR的基本思想是,通过一个线性函数的组合,将特征和类别之间的关系建模为一个概率。然后,通过一个逻辑函数(通常是sigmoid函数)将这个概率转化为一个落在0到1之间的数,表示某样本属于某一类别的概率。在训练过程中,LR会调整模型参数,使得模型预测的概率与实际类别标签尽可能一致。 二、面经 1、写一下LR的公式,它的损失函数是什么,推导一下? 参考回答:它的公式就是里面一个线性的函数,然后通过一个sigmoid激活函数组成,能够将所有的输入映射到[0,1]这个一个区间中。逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。 LR的公式如下: LR的损失函数如下: 损失函数的推导如下: 2、介绍一下逻辑回归和线性回归的关系? 参考回答:逻辑回归和线性回归虽然在名称上很相似,但实际上是两个不同的算法,用于解决不同类型的问题。以下是它们之间的关系和区别: 1、逻辑回归用于解决分类问题,线性回归用于解决预测回归问题; 2、逻辑回归的输出是一个概率值,表示属于某一类别的概率,范围在0到1之间;线性回归的输出是一个连续的数值,可以是任意实数; 3、逻辑回归使用交叉熵损失函数,衡量模型预测概率与实际标签之间的差距;线性回归通常使用均方误差(MSE)等损失函数,衡量预测值与真实值之间的差距。 4、逻辑回归通过最小化损失函数来估计参数,通常使用梯度下降法或其他优化算法。线性回归也通过最小化损失函数来估计模型参数,通常使用最小二乘法或梯度下降法。 3、LR的损失函数以及逻辑回归和最大似然的关系? 参考回答:LR的损失函数为交叉熵损失,也可以叫做logloss对数损失,它的具体公式也在面经1中已经介绍了,可以返回详细看下。简单来说,它就是假设样本服从伯努利分布(0-1),我们就能求的单个样本的极大似然函数,然后扩散到整个样本集,就能得到整个样本的似然函数,我们的目的就是要求得这个似然函数的最大值,也就是极大似然。 4、LR为什么用sigmoid函数? 参考回答:1、Sigmoid函数将任意实数映射到区间(0, 1),在逻辑回归中,这个区间可以被解释为概率。这样,模型的输出可以被理解为样本属于正类的概率,符合逻辑回归的目标。2. Sigmoid函数的导数可以用Sigmoid函数本身表示,这使得梯度计算相对容易。在梯度下降等优化算法中,梯度的计算是很关键的,而Sigmoid函数的导数可以用数学上的简单形式来表示。3. Sigmoid函数的公式相对简单,便于处理和计算。 5、逻辑回归是一个分类算法,可以用来解决回归问题吗? 参考回答:逻辑回归是一个分类算法,通常用于解决分类问题,而不是回归问题。虽然名称中包含了"回归"一词,但实际上是因为它在数学形式上与线性回归有些相似,但用途和应用是不同的。逻辑回归的目标是预测一个样本属于某个类别的概率,输出结果是一个介于0和1之间的概率值。这样的输出适用于分类问题,例如判断电子邮件是否为垃圾邮件、疾病是否发生等。对于回归问题,目标是预测一个连续的数值输出。典型的回归算法包括线性回归、决策树回归、神经网络回归等。这些算法用于预测房价、销售额、温度等连续数值。虽然逻辑回归主要用于分类问题,但它也可以用于处理多类别分类问题,或者在一些情况下可以进行变种以适应回归问题,例如在逻辑回归的基础上进行拓展,但通常在解决回归问题时会选择专门的回归算法来获得更好的性能。 6、逻辑回归怎么做多分类? 参考回答:多分类问题一般将二分类推广到多分类的方式有三种,一对一,一对多,多对多。一对一:将N个类别两两配对,产生N(N-1)/2个二分类任务,测试阶段新样本同时交给所有的分类器,最终结果通过投票产生。一对多:每一次将一个例作为正例,其他的作为反例,训练N个分类器,测试时如果只有一个分类器预测为正类,则对应类别为最终结果,如果有多个,则一般选择置信度最大的。多对多:若干各类作为正类,若干个类作为反类。注意正反类必须特殊的设计。 7、线性回归用平方和损失、逻辑回归用logloss,为什么逻辑回归不用平方和损失? 参考回答:逻辑回归使用交叉熵损失(Log Loss)而不是平方和损失,主要是因为逻辑回归的目标函数和输出特性与平方和损失不太匹配。以下是一些原因解释为什么逻辑回归通常不使用平方和损失: 不适合概率预测: 逻辑回归的输出是一个介于0和1之间的概率值,而平方和损失在计算误差时会对较大的误差更加敏感。由于逻辑回归的输出范围限制在0到1之间,使用平方和损失可能会导致训练过程不稳定,不适合对概率预测进行建模。 非凸优化问题: 使用平方和损失的线性回归问题是一个凸优化问题,但将其应用于逻辑回归时,由于逻辑函数的非线性变换,损失函数会变成非凸的。这样的非凸优化问题可能会导致训练过程陷入局部最小值,并影响模型的性能。 不平衡类别: 在分类问题中,类别不平衡(即正负样本数量差异较大)是常见情况。平方和损失在这种情况下可能会导致模型偏向于预测数量较多的类别,而忽略数量较少的类别。 概率交叉熵的信息论解释: 交叉熵损失在信息论中有着明确的解释,与概率分布之间的差异有关,适用于逻辑回归的概率预测问题。 8、LR的使用场景,怎么引入的非线性?为什么要特征离散化? 参考回答:我们在使用逻辑回归的时候很少会把数据直接丢给LR来训练,我们一般会对特征进行离散化处理。离散后稀疏向量内积乘法运算速度更快,计算结果也方便存储,容易扩展。离散后的特征对异常值更具鲁棒性,如age>30为1否则为0,对于年龄为200的也不会对模型造成很大的干扰。其次LR属于广义线性模型,表达能力有限,经过离散化后,每个变量有单独的权重,这相当于引入了非线性,能够提升模型的表达能力,加大拟合。离散后特征可以进行特征交叉,提升表达能
点赞 9
评论 8
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-09 09:26
门头沟学院 Java
别再吵了!学历VS实习
天天在牛客上刷到“双非本科没实习是不是没救了”“985硕士零实习能冲大厂吗”,吵来吵去就是学历和实习哪个更重要,我真的看烦了。今天必须说句大实话:校招里,学历和实习哪个更重要,完全取决于你有什么、缺什么。你缺的那个,就是对你来说最重要的。网上那些极端言论,要么说“学历至上,双非根本没机会”,要么说“实习为王,学历没用”,全是站着说话不腰疼,根本没搞懂校招的残酷真相。先揭穿第一个真相:学历,是给你开门的钥匙;实习,是让你留下来的门票。很多双非的同学说,我投了几百份简历,全石沉大海,实习再牛有什么用?连面试机会都拿不到。这太真实了。大厂校招,简历池里几万份简历,HR根本没功夫一份一份看你的实习项目...
学历VS实习,哪个更重要...
点赞
评论
收藏
分享
04-10 14:18
已编辑
门头沟学院 研发工程师
4.10- 阿里云agent-一面
🕐面试时间:60min❓面试问题:前半小时正常问问题,后面ai coding自我介绍实习拷打,发现面试官之前也在那个公司工作过3年,参与过公司平台的创建,然后问我在实习过程中有触及到公司其他的产品或业务吗拷打项目,开发过程中有遇到什么难题,以后想怎么改善工作流和agent的区别,什么时候用哪个一个分布式系统,进程间通信的方式有哪些,哪个是最高效的(我答共享内存最高效,其他的方式还有信道,消息队列kafka,管道通信),如果是跨主机通信呢(我想不出其他的,只能想到消息队列中间件,还有通过http和rpc通信)突然扯到http 和rpc的区别,为什么公司选择rpc,rpc为什么快(没答上来,让面...
查看12道真题和解析
点赞
评论
收藏
分享
不愿透露姓名的神秘牛友
04-02 10:41
小厂实习怎么了,不耽误我拿offer
之前一直在牛客刷大家帖子,看到了很多人吹捧大厂多好多好。但是说个会被喷的事实:双非本,秋招拿了5个offer,比我那个在某大厂实习的室友还多一个。他在大厂做了三个月,负责链路中的一个中间模块。听起来很厉害对吧?但面试的时候面试官追问这个特征是怎么选的召回策略谁定的,他只能说这部分是算法团队负责的。我在旁边听得都替他尴尬。我呢?在一家不过百人的小公司做了个后台管理系统,全流程就我一个人。你问我任何一行代码为什么这么写,我都能给你掰碎了讲,因为踩过的坑我全记得——凌晨两点调CORS跨域问题的那种刻骨铭心你懂吗。说到底面试官要的不是你title多好看,是你到底有没有真正做过这件事。大厂名字能帮你过简历关,但到了面试那一步,你做的东西是不是你的,一问就知道了。后来我室友也想明白了,他说我那三个月最大的收获就是知道了食堂哪个窗口最好吃。我不知道他是在自嘲还是在认真的。
沉淀小子:
能力就是大于title的,支持楼主。你的室友吃方面你还得跟他学
大厂实习和小厂实习最大的...
点赞
评论
收藏
分享
03-17 21:11
硬件简历求改
末9工科混子,考研下岸了,想找份硬件的工作,没做过什么项目,这简历能找到工作吗,求大佬指点,或者有什么学历厂能进的
求职遇到的搞笑事件
点赞
评论
收藏
分享
04-09 12:22
已编辑
武汉大学 Java
美团 业务研发平台 一面(复活赛)
自我介绍拷打实习拷打项目动态线程池怎么实现,有没有思路全局唯一id生成算法还了解哪些怎么保证不超卖的(答了乐观锁悲观锁与乐观锁的使用场景手撕:数组中第K大元素平时怎么使用ai
查看7道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
我感觉我遇到神仙mentor了
1.0W
2
...
入职翼支付2年多,聊聊感受
5261
3
...
招行给AI时代数字金融人的答案
2210
4
...
腾讯云智暑期~
1687
5
...
软件测试简历点评第三期,你以为写的很好的简历,为什么约不到面试呢?
1277
6
...
只有我觉得暑期很难找吗?!
1041
7
...
招银网络面试
909
8
...
暑期结束吧 不想再面了🔚
794
9
...
27届-日常实习-金山云-AI应用平台开发-一面
686
10
...
双非暑期终于结束了
674
创作者周榜
更多
正在热议
更多
#
我的求职进度条
#
986654次浏览
6545人参与
#
实习教会我的事
#
73568次浏览
506人参与
#
厦门银行科技岗值不值得投
#
18990次浏览
422人参与
#
哪些公司一直卡在简历筛选
#
106098次浏览
363人参与
#
我想象的实习vs现实的实习
#
332881次浏览
2298人参与
#
Agent面试会问什么?
#
39258次浏览
1435人参与
#
米哈游笔试
#
655919次浏览
1160人参与
#
一人分享一个skill
#
10178次浏览
243人参与
#
总结:哪家公司最喜欢泡池子
#
168006次浏览
571人参与
#
拿到offer之后,可以做些什么
#
104896次浏览
511人参与
#
春招至今,你收到几个面试了?
#
103865次浏览
1276人参与
#
说说你知道的学历厂
#
401873次浏览
1434人参与
#
拼多多工作体验
#
55417次浏览
389人参与
#
我是XXX,请攻击我最薄弱的地方
#
73508次浏览
498人参与
#
中国电信笔试
#
40818次浏览
399人参与
#
面试体验最好和最差的公司
#
25779次浏览
173人参与
#
国企秋招,你投了吗?
#
72033次浏览
424人参与
#
通信/硬件的薪资开多少,才值得去?
#
76823次浏览
407人参与
#
给工作过的公司写一条大众点评,你会怎么写?
#
12632次浏览
144人参与
#
米哈游工作体验
#
29949次浏览
145人参与
#
你觉得专业和学校哪个对薪资影响最大
#
104594次浏览
620人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务