24.08.17-14:00 记录一波1. 自我介绍2. 项目中模型如何训练3. 目标函数用的什么4. 训练的计算资源和时间用了多少4. 手撕:寻找字符串中最长有效括号子串5. 梯度消失和梯度爆炸如何缓解6. batchnorm中可学习参数如何获得,是反向传播吗?7. l1正则和l2正则的区别8. 如果要筛掉大量数据中的一些无用数据,用l1还是l2,为什么9. 树模型和LR区别10. 给定mlp输入和各层神经元个数,计算参数量11. 现在有1B参数量的一个大模型,使用32/64混合精度训练,需要的显存是多少12. 给定一个数组,如何快速找到第k大的数注:以上不分先后顺序,其余的忘了。。。反问1. 公司部门业务?答:统一的技术面试,目前不细分到部门岗位2. 还需要学习什么?答:根据上面问的想想有哪些盲区,就学什么3. 面试结果什么时候出?答:得问hr,我也不知道寄,好多没答上来,不过其实投的岗位与我的项目和技术栈也不是很符合,算是一次有价值的面试,查漏补缺,继续精进吧。