一面: 11点20的场次,面试时间40分钟 问项目:客服对话系统怎么做的?数据怎么获取标注,数据量级多大?具体采用的核心算法是什么? 问项目:实体关系抽取怎么做的?数据长什么样子?采用了什么方法? 实体识别这块怎么做了解吗?(说了一下深度学习领域,转换为序列标注任务) 序列标注的原理是什么?为什么实体识别可以用序列标注来做? 情景题:假设现在想让你抽取医疗领域内的实体,你打算怎么做? (回答了两个方面:1,有标注大规模数据,采用深度学习BILSTM-CRF的方法训练序列标注模型,评估指标PRF1, 2, 数据无标注,由于医疗领域具有一定的垂直领域的特性...