分享下腾讯暑期实习提前批面试过程,3.10官网投递简历。 一面 3.25 电话面试 TEG(数据分析)40分钟 1. 文本分类预处理过程?如何生成词向量?如何抽取特征?去除停用词?(分词-去停用词-文本向量化) 2. fasttext的过程 3. word2vec的训练过程 4. 命名实体识别模型介绍?评价标准 ROC 5. 命名实体识别模型的参数量??(没准确计算过) 6. 标签抽取模型的技术选型如何确定的? 7. 如何解决过拟合的问题? 8. 模型训练的停止标准是什么?如何确定模型的状态(指标不再提升) 9. 命名实体识别过程做了哪些参数的调整? 10. 有没有用过spark? 1...