斗鱼算法一面凉经
31号那天没能去面,然后另约了2号到斗鱼总部去面。
上来面试官就让我介绍项目,然后我说不用自我介绍吗,他说不用。
1. 介绍知识图谱的项目。
2. 你觉得知识图谱的难点在哪(我想了一下随口说了实体链接、抽取新关系困难等等)
3. schema怎么定义的,实体定义了多少种,关系定义了多少种。
4. 实体识别和关系抽取都是自己手标的训练数据吗?(我回答暂时是,他说那你们也太耗人力了吧,我说后期可能用远程监督标,他说远程监督那些方法不能落地工程的,我尴尬的笑笑说是啊。)
5. 你讲讲最有难度的项目(他觉得我们做的都太简单了。。我回答,难度都差不多。。。)
6. 情感分析这个项目怎么做的(seq2seq,encoder用双向lstm,decoder是一个带attention的rnn。)
7. 讲清楚什么是带attention的解码器
8. 介绍一下attention有几种类别,attention权重的计算方式
9. 几种权重计算方式都解决了什么问题
10. encoder用的是双向lstm,介绍一下lstm
11. 你写一下lstm的输出(公式)
12. lstm的输入是什么(我说是分词后,词的word embedding,他再三让我确认真的是词吗,我说是的,是用的搜狗训练好的一个词向量,他觉得很惊讶,问我怎么可能输入是词呢,没有的词怎么办,我说就统一用unk啊,他后来说我觉得我来教教你吧,中文一般用的是字,不是词,字一共就5w多个,词是无穷的,用字和词提升的效果是不一样的巴拉巴拉。但我项目里用的确实是词。)
13. 哪个项目最能展示你的水平?(我说论文算吗?他说只要能落地解决实际问题的都算,我说那我这个估计还不能落地。然后他就不问了。。。)
14. 工程能力咋样?(还行吧,只用python)
15. 写深度学习多还是机器学习多(都差不多)
16. 写个题吧,平时用过numpy,pandas这些吧?(用过)然后就出了个什么输出成绩大于80的什么的。因为我实在忘记了pandas这些怎么写了,所以题目也没认真听,他说完后我就表示不会。
17. 你有什么要问我的
面完之后他让我在那个会议室里等,我说是等下一面通知吗,他说是的,然后五分钟之后进来了一个小哥,我问他是二面面试官吗?他说不是,他是hr,然后就开始尬聊,问我感觉面得咋样什么的,我以为是他们怕我等太久,派个人和我聊聊天,结果突然小哥和我说你今天的面试就到这了。。。。。
面试的感受是,我太菜了,面试官还经常反问我,真的是这样吗?你想好再说,你这个做得也太简单了吧,这个能落地吗?搞得我经常怀疑人生。我以为我面了很久,出来一看时间才27分钟。。。真的是凉透了。