360现场面8月29日--智慧城市-NLP岗位
一面: 11点20的场次,面试时间40分钟
问项目:客服对话系统怎么做的?数据怎么获取标注,数据量级多大?具体采用的核心算法是什么?
问项目:实体关系抽取怎么做的?数据长什么样子?采用了什么方法?
实体识别这块怎么做了解吗?(说了一下深度学习领域,转换为序列标注任务)
序列标注的原理是什么?为什么实体识别可以用序列标注来做?
情景题:假设现在想让你抽取医疗领域内的实体,你打算怎么做?
(回答了两个方面:1,有标注大规模数据,采用深度学习BILSTM-CRF的方法训练序列标注模型,评估指标PRF1,
2, 数据无标注,由于医疗领域具有一定的垂直领域的特性,可以假设已经收集了一定的医疗实体,反过来对文本进行标注,得到部分数据,由这部分数据来训练模型,进行泛化;如果存在数据量不够的情况,可以对实体词进行扩展或者爬取更多的文本,如果泛化能力不强,可以采用迁移学习的思想,从相似的其他领域迁移模型;评估的内容分为两个方面,是否具有抽取出新实体的能力,已有实体抽取的准确性)
LSTM的内部公式和门控机制(要求手写lstm的公式),LSTM是如何记住前面的依赖信息的?
反问面试官:对新人有什么培养机制?(面试官回答的特别详细,还介绍了部门的一些业务相关的消息)
面试结束后一分钟短信通知过了一面
二面: 等到了4点36分开始,面试时间20分钟左右
自我介绍
介绍实习主要做了什么(相似度模型)(面试官不太感兴趣,也没有打断提问)
你对NLP了解多少?(回答了实验室做的一些方向,对信息抽取这个方向做了一下介绍,具体介绍了一下项目:实体关系抽取的项目)
你知道知识推理吗?(回答了知识推理的一个应用场景,面试官说你说的这个只是其中一个最简单的场景,我后来回答了不太了解知识推理)
spark会吗?(不会)
sql会吗?(本科学过数据库的知识,会简单的sql语句)
平时用什么语言,我回答python
java会吗?(正在自学,还不太熟悉)
面试官问我有什么问题吗?
反问面试官:对新人有什么培养机制?(面试官回答:我主要看新人的学习能力,你还有什么问题吗?)
我就知道凉凉了,出来后快速收到了拒信。
结束360的秋招
想吐槽几个点:
1 等待时间太长了,一面和二面相差了四个小时,
2 回顾了一下,还是不知道自己挂在了哪里?