2020-05-27 上午10点 自我介绍,然后开始讲我的两个项目:第一个项目:问数据集大小,数据来源,如何进行预处理,如何划分训练集和测试集,如何验证未标注的数据!问如何将知识图谱的信息嵌入到预训练模型中,项目有什么不足,哪里需要改进,怎么改进。第二个项目:问如何爬取结构化数据,如何定义爬取非结构化数据是我们需要的,并获得需要的实体和关系,如何实现了ner和etl。实体,关系的数据类型的定义,如何进行实体消歧,融合归并。如何设置对话管理模块,包含对话策略,策略优化等。如何设置自然语言理解模块包含意图识别、slot提取、情感分类,写了个cypher查询语句,还问了知识图谱的定义,我讲成了图数据...