二面凉凉 差不多面了一个多小时,实际由于网络问题,应该没有50分钟,一开始的问题还是从项目展开的,问的很细,有些问题的确没考虑过,当时就直接按照要求做的。然后问的很细节的一些问题,比如注意力机制里面的Q,K,V3个模块怎么产生,这的确没有自己实现过,接着就是原地修改操作,也是没复习到,后面结束查了才想起来是会覆盖梯度。最后代码没按照原地修改要求写,也没能运行,时间不太够了,就直接结束了。总体来说还是自己复习的不够仔细吧,有的没考虑到,代码没写出来一方面的确是自己有可能能力不太够,另一方面,老是断网断网,搞得很烦躁,心态太急了,嗨 一共差不多50多分钟 ...