部门:AI Force10.21 一面1、讲项目2、检索器怎么训练的?3、召回不准有什么方法提升召回率?4、reranker有什么方法?5、检索器和reranker的得分太相近,不可靠如何解决?6、怎么解决模型输出有害的问题?7、如何设计损失函数让两个分布尽可能的远?8、决策树有哪些?9、简单说一下GBDT的算法原理10、HMM大概是怎么样的11、口述编辑距离算法============================10.24 二面1、项目2、你的CoT是一步的推理吗?3、ToT如何选取推理路径?4、如果query和document字面上很相似,但实际上不一样,应该怎么避免召回?5、我看你的项目基本都是pipeline的搭建,你有什么微调经验吗?6、你怎么确定数据配比呢?7、上采样和下采样是什么?8、蒙特卡洛树搜索(MCTS)了解过吗?9、微调出现灾难性遗忘怎么办?10、rnn和Transformer的区别11、你觉得mamba有可能取代Transformer吗12、你会java和c++吗?13、传统机器学习学过吗?14、天池的比赛参加过吗?===============================10.28 hr面===============================10.30 三面主要问实习===============================没发意向,现在还在泡池子