shopee 算法 面经
头铁投算法,小小期待一下hr面吧,虽然概率不大,如果得到hr面通知就来更新二面面经
==================================================================
一面:(记不全了,感觉面了很久很久,挑记得住的写)
1.自我介绍
春招就投了shopee一家,太久没说自我介绍都忘了说自己用的是什么算法了,最好还加了个自己的爱好。面试官憨憨一笑说:头一次听见有人自我介绍说爱好的~羞愧- -
2.因为强化学习与推荐不太匹配,不问项目了直接问题吧
问知不知道Auc,写一道题
答不知道,项目做的强化学习,对这方面都是按面经有啥准备啥,当时找的面经没提到Auc
但是面试官说没事,我给你讲,让我硬做(这里有个插曲,长春现在封寝,我笔试面试都赶上上门捅核酸,于是我做题时候就去做核酸了,回来我说做完了,面试官说做完了你写成代码阿,我说核酸做完了。。。。
题目:给两个列表,一个列表元素为1/0代表正/负样本,一个列表对应他们的概率,求Auc,Auc等于组合里面正样本打分高于负样本打分的组合个数/一正一负样本对的所有组合数
一开始算是暴力解法吧,面试官要时间复杂度O(nlogn),于是用排序+二分查找做的,结果跟暴力解法不一致,但面试官说思路可以代码写的也还行,下去自己调吧就过了
3.这期间问了一堆我听过但还没学到的:word2vec、XGboost、交叉熵...
我太菜了,当时交叉熵还没看过呢,面试官说这不应该是分类算法最简单的。。
下面是一些回答上来的问题,感觉面试官还觉得回答的不错
-->LR的损失函数是什么,我说叫logistic loss,面试官说不是,但是他的解释我记不清了,下来重新理解应该就是那个样本集概率取log似然值加负号(说错了请纠正我)
-->正则化方法都有什么
-->L1正则为什么具有稀疏性
-->为什么正则化能防止过拟合【我说对权重加约束,有的权重就没了】-->【没答上来】如果说L1能防止过拟合的原理是让权重没了,那L2呢?【我说限制权重取值范围,面试官显然不满意】
-->树的算法都了解哪些?答CART、随机森林、GBDT-->讲讲GBDT的思想
-->经验风险和结构风险都是什么?【回答的面试官也不满意,说原则上没错,但觉得没有说到根本】
4.一道情景题,【因为有些概念不太懂,勿喷,理解我大概要表达的意思吧】在推荐系统里,如果训练的时候标签1表示展示在页面用户点击了0代表用户未点击,该标签与模型得到的打分相关性很高,但测试时不高,为什么?
答我当时就懵住了。面试官引导我的例子我懂了,但后来他说因为推荐系统是优化每个人的List而不是整体的List,现在又有点不太懂了,是模型打分高代表用户愿意点的多,但实际测试时一个用户上线了就可能不点了嘛,因为这不是这个用户喜欢的?请大佬解答,感激不尽
5.最后面试官推荐我最近学点推荐有关的东西...我觉得凉凉无疑
6.反问
不过后来也有收到二面通知,希望大家一切顺利吧= =