自我介绍八股(可能遗漏):1. 讲讲推荐系统流程2. Transformer 位置编码是什么3. QKV 注意力公式为什么除以根号 d4. 简单讲讲 GCN5. 简单讲讲 RNN6. RNN 里的参数是什么样的(答:参数共享)7. Dropout 是怎么做的?有什么作用?推理和训练时 Dropout 的区别?如果推理也用 dropout 会怎么样?8. 讲讲 BN?BN 训练和推理什么区别?有什么用?9. 用 CNN 把 (64, 64, 128) 变成 (x,y,z)(具体数字忘了),卷积层参数量是多少,计算一下(没答上来)。10. 我看你上过最优化方法?什么问题才是一个凸问题?凸集和仿射集的定义是什么?算法题:LC233(Hard),纯初见,没做出来,勉强讲了一下初步思路。反问:对我有什么建议,答建议提升算法能力,建议多搞点相关度高的实习和项目。言下之意应该是匹配度有点低。全程对面没开摄像头,回答卡住时无引导,面试体验一般。