2024届暑期实习蚂蚁一面面经(AIGC)

1. 论文细节(模型是怎么工作的, 各个模块的作用,怎么选择损失函数等)。

2. 防止过拟合的方法。

3. 几种优化器的区别。

4. 交叉熵函数是怎么计算的以及其物理意义。

5. 图像怎么作为序列信息输入transformer。

6. 为什么选择patch的方式,有什么意义。

7. 你平时有没有遇到过梯度爆炸的现象,解释其产生的原因(怎么根据链式法则解释)

(目前想到的就这些,后续想起来会在评论区更新)

coding:快排

#我的实习求职记录#
全部评论
补充一个问题:卷积网络中经常使用的下采样方法是什么,他们的特点分别是什么
点赞 回复 分享
发布于 2023-03-15 22:27 上海
电话面了后笔试之后还会有面试嘛
点赞 回复 分享
发布于 2023-03-16 09:15 福建
coding的话要用什么语言
点赞 回复 分享
发布于 03-02 09:22 上海

相关推荐

斑驳不同:还为啥暴躁 假的不骂你骂谁啊
点赞 评论 收藏
分享
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-26 15:46
已编辑
字节国际 电商后端 24k-35k
点赞 评论 收藏
分享
评论
8
81
分享
牛客网
牛客企业服务