2021.7.29 百度分布式计算研发工程师一面相关问题 1.自我介绍 2.项目介绍 3.用户可控的代码量有多少 4.还有什么其他数据并行的方式 5.ring allreduce 相关知识 6.ring allreduce增加节点会增加数据量传输吗(不会) 7.ring allreduce 一个节点挂掉有什么方法解决导致的问题吗。(相邻节点存梯度,问存梯度还是存参数,存参数没有意义我说的) 8.参数服务器一个worker节点挂掉,会影响梯度的汇总吗。又什么解决办法吗? 9.知道现在...