实习是一方面,但大部分人都还是没有实习的,说实话这些问题应该是比较基础的了resnet模块那个就不说了,pytorch那个是因为动态图,相比tf方便搭模型和debug,社区维护也比较好,坑比较少;NN训练时GPU里存网络参数、参数梯度、前向激活、优化器参数;并行训练要看是数据并行还是哪种分布式并行,比如流水线并行,这些都要了解下。这些老哥平时可以多留意加强下,加油
8 2

相关推荐

点赞 评论 收藏
分享
牛客网
牛客企业服务