百度提前批末班车,搜索技术研发部--搜索算法,一二三面经

一面1h:(8.17,时间隔得有点久记不太清了,反正感觉面的不好)
女面试官
说说自己用过不同分类模型的区别,我随便说的感觉没有头绪。
介绍过拟合,梯度消失,
transformer的优缺点
LSTM+attention这个模型为什么要在加attention,这个我没答好
(基础知识记得不清了)
模型评估指标知道哪些?
然后是一些场景下的问题:
query短文本长文本的一些处理,短文本不能很好的表达语义怎么解决,
(倒排?向量化召回)
然后问项目,说我做过推荐,简单的介绍了一下项目。
Linux一些小问题
算法题:
两数之和,但是让我考虑输入的类型判断,忘了isinstance()这个函数
反问:
公司做哪一块的搜索业务的,base地在哪里,过往经历是否match。

-------
二面1h:(8.26,隔了9天,1面感觉面的真的很拉,一度觉得自己挂了)
自我介绍
问推荐实习项目,业务背景,一些细节:特征有哪些,怎么处理,加了那些特征,
怎么评估特征有效,nn模型特征怎么改造。
问NLP项目,质疑了我某一个小trick的有效性,我说是别人工作中借鉴来的。
八股文:
好像没咋问八股,记性也太差了。
算法题:
1.n个点(x,y),求每个点的max(|x1-x2|,|y1-y2|),简单题
2. n个10进制的数,求这些数中存在相同的位数的pair对的个数,比如(12,13这2个数,其中1是相同的位数,所以这算1个pair对,12,21也只能算1个)
反问:
希望能换base到上海,然后后来打电话和我说上海没hc了。
-----------
三面40min:(8.27,下午突然发来邮件面试,下午我一共3场面试,累的一批)
自我介绍完后,
怼基础,
LR,SVM,LSTM,CNN,xgboost, LDA。
LR的原理,手写损失,手写反向传播
SVM的原理,核函数的有什么特点
CNN原理,RNN原理,LSTM的公式
LDA主题模型原理,我其实不太懂这个,瞎说了几句什么学习文档-主题分布和主题-词汇的分布,矩阵分解类似。
快排复杂度,堆排复杂度,建堆复杂度。
能不能毕业前来实习,答:导师不放
问职业规划,家乡哪里等等
反问:
先表明一下有些基础挖的很深自己需要再补一补,
然后问了团队做的啥,然后我就舔了一波百度搜索,
问他对应届生求职选择方向的建议。
-----------
27晚上发了测评了,不知道能不能等到oc,
感觉只有二面面的还凑合,二面面试官很和善。

#百度提前批##面经##校招##百度##算法工程师#
全部评论
我和你同一个部门 三面问题也几乎一样 我怀疑我们是同一个面试官
1 回复 分享
发布于 2021-09-02 23:56
许愿oc!
点赞 回复 分享
发布于 2021-08-28 08:07
测评会挂人吗
点赞 回复 分享
发布于 2021-08-28 13:22
八股文大全啊
点赞 回复 分享
发布于 2021-08-29 12:59
部门不错,真心羡慕了
点赞 回复 分享
发布于 2021-09-01 18:40
可以加个wx吗楼主 后续offer交流一下
点赞 回复 分享
发布于 2021-09-02 23:56

相关推荐

刚刚做了华为Java机考,人是懵的。三道题两小时,每道题都看着不难都有思路结果写完过了测试一提交只有10%通过率,最后只有第一题提到了85%,最后算下来135分过不了150线,我愧对期待值拉满的HR,愧对我自己的复习。。。还是没刷够和基础不足,但至少把题目发这里大伙帮我解决一下这个遗憾吧。(不是,哥们。发现十拿九稳的主思路只能过10%,真得懵吧)第一题100:游客参观总时长问游乐园每天开放多久能招待所有游客。游乐园每一段时间能接受任意个数游客。每一行给一个游客的参观时长[1,5],[1,2], [10,11],输出总时长 4+1=5. 数值全在10^6以下。(确认输入无误)我一开始想做合并时间段最后算累加,结果Arraylist写下来边界判断什么的瞎闹连测试案例都过不了。三道题都写完之后回来检查,改了方法,求出参观时长的最大值,以它为长度建立空数组,再遍历游客时间插入1.最后数1,数到0就断掉算长度累加。通过率到了85%,但是给的反馈是测试用例运行错误,不是超时,我就只能继续检查下一题去了。(没想到后续检查没救得了我)第二题200:字符串集合求交集(这个是我最懵的,教教)(不需要检查输入)题目意思非常简单,给你输入几个字符串集合,{3(长度) 123 456 789}第一个集合.{ 2 456 789}第二个集合。输出每个集合交集最大的集合和长度 2 2 \n 1 2 。字符串完全相等就是交集的元素。就这么简单。 我Hashmap存集合的输入顺序,也就是集合的序号,value存的是字符串ArrayList。然后按总输出的值遍历这个输入顺序下标获取那个字符串集合,然后和另一个下标对应的字符串集合遍历。四层遍历求个相等的情况+1,记录最长值和最长集合序号。过了测试例以后提交,10%,还是答案错误不是超时,我人懵了,回来检查的时候也还是懵的。各路大神务必教教我这必须查相等的遍历为什么过了基础例子然后只能过10%的测试。有什么优化办法能既考虑边界值也能简化时长的?第三题300:摘水果也蛮直白的,给你个正方形地图,然后每个格子上是水果的数量,如果不能走就是-1. 果农要从左上角走到右下角,只能向下或向右。走到右下角以后他再从右下角折回来走(没限制怎么走回来)到左上角,问你他能采摘的最大水果数量。这题我承认肯定是算法没想明白,漏了什么很关键的东西。(应该早点放弃检查的,很烦)这题我一开始想搞个递归往下找记录总数改变地图数字,然后往上找再递归找路最后加起来。但是写出来了向下找路然后发现这个找路和求最大值的路想做复原太诡异了,(现在想想完全可以找到路了记下来再找到最大值,很有可能能避免一些case)就放弃了递归投向动态规划。我累加了一次dp所有值抵达右下角以后,发现这个格子里的值正好是走下去走上来能拿到的最大值,想了一下应该也对,如果从左上角走不下来,那也不可能从那条路折回来,所有通路值加到最后应该就是答案。(难道说!是多个通路,只能取2条最大?!状态转移没这么简单才对!)状态转移方程就是等于非-1的左侧和上侧的格子的值相加再加上本来格子里的值。如果左上都是-1那我直接设为0.(难道该设为-1?复盘才发现槽点太多)(给地图加了一行一列全设为0,从1开始遍历到n。)往回走也不可能走这里。最后得分10%。求解!
牛客141057821号:我用python做的 第一道题记得leetcode有原题,先用开始参观时间sort一下然后指针遍历求set union 第二道题我python暴力解法全过。。 第三道题我是两遍dp,已从从左上到右下一次右下到左上,中间把第一次遍历走过的格子设成0就完了。 话说150是分数线吗?可以问下哪里的消息么
查看3道真题和解析 投递华为等公司10个岗位
点赞 评论 收藏
分享
1 35 评论
分享
牛客网
牛客企业服务