一面 20mins 实际30mins左右了。 问的问题有点多,跟电信研究院不是一个水平。 1.自我介绍 2.介绍下transformer模型架构, 编码和解码有啥不同,多头是指什么。 3.介绍LSTM的架构,那几个门分别是什么,干什么。与RNN区别。 4.梯度消失,梯度爆炸,怎么回事,怎么解决 5.激活函数都有啥 6.详细介绍下某个论文,怎么设计和实现的。 7.有没有别的offer 8.对户口要求 9.加班接不接受 ————————————- 重要时间点 9月22日,通知9月25日通知笔试2小...