#无语的百度算法二面
百度两面凉经(这已经是第二次感受到百度的恶意了,上一次是面实习)
笔试:过
一面:
1. 根据简历内容进行考察
2. 二分查找
3.正则表达式匹配
二面:
吐槽:我建议加强面试官语文水平,这里说一下核心的被拒点,我不认为是我的问题
主要有两点:1。 我和面试官对于“现成的模型”理解不同 2. 面试官根本没有理解我的项目的核心痛点,只在复述他自己的项目,来套到我的项目上
以下是面经,大家注意
1. 扣项目细节,如果您自己从头到尾不依靠任何外部资源,自己设计了神经网络,那么以下内容可以略过
2. 我的项目主要是从无标签毛文本中提取实体,因此,对于准确度要求较高不宜采用模型提取,他问我为什么不用序列标注,我说没有足够的标注人员,他理解为。。。我不理解模型原理,只是简单复用已经finetune过的模型。事后,我问他序列标注花多少时间,他说。。。没花多少时间,标出来让别人去标就好了。。。(废话,我不知道?你给我100个标注人员我自己一秒都不用标呢。。。)
3. 我的另一个项目,用到了bert 词向量,我说bert部分由于已经训练好,我们不需要在意细节,我们只需要关注后续如何finetune(我自己设计了五个finetune模型去集成),然后,灵魂一问来了,他问:这些模型是现成的么?我说是啊。。只是具体结构需要自己再调整(难道不是么?比如Resnet LSTM这种已经发表过的模型难道需要自己再设计一遍么)。
4. 算法题: 求字符串最长回文子串
这已经。。。我也不知道如何形容,也许是中午没吃饭造成的理解偏差。。。anyway,大家再遇到,一定要抠字眼,一定要跟他明确清楚,什么叫“现成的”。。。
#百度面试##百度##面试题目#