百度搜推 一面面经

算法题: 树的直径,子数组和等于k的数目
问项目,实习,竞赛,论文
八股:transformer的结构,注意力机制为什么除以缩放因子,为什么要使用不同的线性变化矩阵,transformer中哪些阶段是并行的,哪些阶段是并行的为什么。

一面过了,攒攒人品写个面经,许愿offer
全部评论

相关推荐

点赞 5 评论
分享
牛客网
牛客企业服务