拼多多学霸批NLP面经
时间:2019/08/04 岗位:NLP算法工程师
三场面试,1面2面技术面,3面HR面。2礼拜后出结果,回馈一下牛客网,顺便攒个RP,希望能拿到秋招第一个offer QAQ。
1面
1.简要介绍自己(其实一直不知道这儿说啥好,我一般就把研究方向说一下)。
2.问项目。华为实习做的数据挖掘项目,一整套流程全部说明一下。实体识别项目,把网络结构图画一下。面试官问的挺细的,还讨论了一下怎么优化。
3.基础知识。word2vec原理。LightGBM和XGBoost,GBDT的区别(LGB=GBDT+GOSS+EFB),基本上要点都回答了,并行化那一块有点遗忘。DEEP&WIDE模型是怎么组合起来的(这个模型没答好,因为只是当tool用的,没有深入研究)。DEEP FM知道吗?没了解,但是我对于Transformer,BERT和XLNET比较了解,好那你仔细说说这几个模型(成功转移话题hhh),然后就说了说self-attention什么的。
def quicksort(li,start,end): if start > end: return left = start right = end mid = li[left] while left < right: # 让右边游标往左移动,目的是找到小于mid的值,放到left游标位置 while left < right and li[right] >= mid: right -= 1 li[left] = li[right] # 让左边游标往右移动,目的是找到大于mid的值,放到right游标位置 while left < right and li[left] < mid: left += 1 li[right] = li[left] li[left] = mid quicksort(li,start,left-1) quicksort(li,left,end)总共1小时
2面
1.简要介绍自己。
2.问项目。和上一面大同小异。
3.基础知识。词性标注(序列标注问题),分词一般你是怎么分的,用什么工具:jieba,gensim,hanlp,说说jieba怎么用的,gensim和hanlp涉及的算法(double-trie),(这里吃了大亏,因为只是当工具用的都怎么清楚)。文本生成都用过那些模型(textCNN,BiLSTM+Attention,Transformer,BERT)。知道哪些分布式表达方式(one-hot,tf-idf,n_gram,word2vec,fastText),fastText和word2vec的区别。
4.算法题。
给定dic=['ab','abc','abcd','bcd','bcde','bde','efg'],str='abcdefg',求最长匹配dic中的元素,比如本例就是输出['abcd','bcde','efg']。
实现:把dic的元素建成前缀树,然后搜索前缀树根节点,如果匹配就一直搜到根节点。
这面时间短一些,大概40分钟,因为面试官不问那些网红模型或者常考的知识点,说你们这些家伙都太熟了,不知道怎么搞的每个结构都倒背如流(因为大家都是理论巨人...),然后问更多和NLP相关的东西,还是挺突然的,回答的一般般吧。
3面
HR面
这面就瞎聊,感觉部门怎么样啊,有没有女朋友啊,对工资要求啊(这个我真的没啥经验,就说按能力给吧,给的多我就动力大,求老哥评论区指点。。。),工作地点期望啊,如果公司突然让你做你不喜欢的工作你能不能接收啊什么的,反正很轻松的氛围,就差当场给HR小姐姐讲个单口相声了(职业病职业病。。。)
总结:这是秋招第三次面试了,心态也越来越好,要用更豪迈的姿态迎接秋招,这样也更开心点呀。最后,不要在简历上写你不能熟练说出大部分细节点的知识!!!面试官基本还是看你简历提问多的。
#拼多多##面经##算法工程师##校招#