- 岗位职责
1、参与国内外多语种文本分类、信息抽取、实体识别、情感分析等NLP算法模型开发,迭代,上线部署;
2、针对多个场景,应用多种数据分析和挖掘手段,有效的进行数据关键信息的抽取,难样本挖掘提升模型泛化性能;
3、利用深度学习关键技术,从极端不平衡的海量的文本数据中,识别出具有违规语义的变形文本,增加文字内容风控能力;
4、参与文字内容安全防御体系构建,综合运用多种算法和多模态信息完善内容风险防御体系,构建文字违规知识图谱和文字信号系统,快速响应业务文字内容安全需求。
- 岗位要求
1、自然语言处理、模式识别、机器学习、计算机等相关专业本科及以上学历;
2、具备优秀的编程能力,熟练掌握Python/C++等编程语言,有Linux开发经验,熟练使用TensorFlow/Pytorch;
3、熟悉NLP相关基础应用,包括短文本分类,信息抽取,序列标注,语言模型,同义词挖掘等;
4、熟练使用自然语言常用算法,熟悉bert,albert等相关语言模型理论,具备相应实践经验,有很强的自学能力;
5、有知识图谱开发经验,在海量用户评论数据上进行知识抽取,知识图谱构建以及违规推理;
6、做事认真细致,善于思考,有责任心及结果导向意识,良好的合作沟通能力。