百度AIDU - 推荐策略部面经(凉)
7/18 一面
自我介绍
问实习(讲了讲搜索和推荐的区别,搜索的相关性怎么控制,用的什么特征,baseline是什么;序列建模DIN,我说可以用一些统计类特征来代替DIN,时延会有所降低,但效果可能不如DIN;问deep hash embedding怎么做的,被怼说这样会导致时延增高,不划算—嗯,的确是这样的)
问另一段实习(多目标预估,这个没有问很深,就问了问原来的baseline是啥,业务场景是啥)
推荐方面扩展问题(一个是他们现在都没有解决的问题,好像是说item侧有文本和图片,然后图片只占5%,所以学的不好,该怎么办??emmm 我也不知道… 我就说了预训练模型提特征,面试官问如果用bert提取文本特征,然后加到item 侧,模型效果会有所提高吗?我说,这是content特征,自然会有所提升的;然而面试官说他们发现不会提升…我实在难以理解,就开始怼他,说了feature-based extractor和finetune-based extractor,并举现在的实习作为论据,于是这个事不了了之。)
代码:写个快排。然后又问最坏时间复杂度是多少,我答:当数组近乎有序,为O(n^2),面试官含含糊糊的,好在我很确定自己的答案,很坚定。又问如何解决,我说随机选轴点;又问如果本来数组就是随机排列的呢,如何避免最坏情况?(面试官说就是如何找到数组中不是最大值的那个值),我真的智商太低了,竟没想出O(1)的解,还在想什么堆、拒绝采样,后来面试官说,取两个数较小的那个一定不是最大值…我都被自己蠢笑了😂
后面没有反问环节,但面试官说"应该"会有二面…许愿一面过!🍀🍀