03-24 15:25 华东师范大学算法工程师发布于上海

关注

蚂蚁一面被拷打

1.DeepSpeed Zero(123)
2.流水线并行
3.显存中模型参数，梯度，优化器参数的比例
4.混合精度，在模型训练的过程中混合精度的变化过程
5.流水线并行的时候气泡现象
6.介绍PPO，DPO，GRPO
7.Prompt设计
8.模型重复输出应该如何解决
9.TopK,TopP,Temperature
10.介绍Encode结构
11.有哪些位置编码
12.RoPE如何实现
13.DeepSeek的注意力机制MLA
14.DeepSeek的混合专家模型MoE
15.模型的外推性
16.Layer normalization在前面和在后面的区别和优缺点
17.Batch norm相比Layer norm
18.RMS norm为啥去掉减去均值的步骤也可以有效？
19.word embedding
20.有哪些高效微调的方法
21.了解QWQ模型吗

全部评论

推荐最新楼层

03-18 16:21

已编辑

哈尔滨工业大学（威海） Java

【面经】蚂蚁网商银行 Java暑期实习

时间线：25.3.14 投递、一面、面完秒挂3.14 蚂蚁网商银行一面 30min本来上午面了80分钟就累了，下午突然一个电话打过来要面试，实习经历没听懂，八股也拉，寄实习面试官没懂为什么这么设计，很多问题时间有限没继续问直接过去了，可惜八股操作系统进程和线程有什么区别？协程了解吗？Java 共享变量如何实现可见性synchronized 和 juc 包里锁实现原理上的区别MySQL 可重复读是如何实现的，ReadView 如何工作RocketMQ 和 Kafka 区别，RocketMQ 顺序消息，事务消息，消息内部实现，确认机制的原理（全忘了）

查看7道真题和解析

点赞评论收藏

分享

03-24 16:55

已编辑

华东师范大学 golang

蚂蚁一面拷打麻了

https://www.yuque.com/ligejiuye/ywqcga/dqhvgnaw1t343lto?singleDoc# 《蚂蚁一面(mentor》 只面了28分钟

点赞评论收藏

分享

03-28 18:53

游卡_HR(准入职员工)

游卡内推游卡内推

真的，全程太魔幻啦！🎮💫是的，就是那个做《三国杀》的公司！本以为是个很老派的企业，没想到这里完全就是一个充满活力和创意的游乐场。早上，当我迈进这个充满创造力的空间时，咱们的心跳就加速了。办公室里处处充满了游戏元素的装饰，这才是游戏公司的上班氛围。🌍🕹️然后我被介绍给了我的团队。每个人都非常友好，他们的热情让我立刻感到温暖。我们一起进行了一场轻松的欢迎会，团队成员们分享了自己在游戏开发中的有趣经历，我也分享了我的游戏梦想。👥🎉午餐一起大家休息区享用美食。吃完饭再打个牌，美滋滋🍔🕹️下午开了个会，学习很多有用的知识，这里不仅是我的工作场所，更是一个学习和成长的地方。【游卡2025届...

游卡公司氛围 140人发布

点赞评论收藏

分享

03-29 17:36

已编辑

门头沟学院 Java

“主播主播，你的项目技术确实很强，但还是太吃并发量了，有没有简单又强势的技术”“有的有的，这么强的技术当然不止一个，一共有9个，都是当前版本T0.5的强势技术”；好好准备项目，电话面为了防止你看电脑背诵，会问很多的场景题，脑子要灵光，面试官会引导你，大胆说你的思路，表达即合理，面试官注重你的临场的发挥，八股背到极致就要求融会贯通（我还差很远），后续要多看一下别人的技术方案，扩展思路；1. 什么是session共享问题？怎么解决2. redis存储中数据丢失(回答的构建集群)3. 讲一下redis集群构建4. 讲一下redis集群中的故障转移(主节点挂掉时，从节点如何上位)5. 缓存穿透？怎么解决，bitmap里存储的是mysql上的数据吗，和缓存空值的方法相比好处是什么？6. mysql增删时bitmap是如何更新的，mysql，redis缓存，bitmap是什么样的关系？(这部分从应用层面巧妙的回答了一下：mysql增加商品信息时，异步去构建bitmap，因为我的应用场景可以不保证商品上线的及时性，只需要保障原始商品的有效性)------这部分问了好长时间、有点乱说的成分7.缓存一致性问题8.消息队列出现了问题，会带来什么问题9.很多连接打到Mysql上，Mysql有没有自己的保护机制(Mysql连接池)10.事务隔离级别11.幻读是什么？出现在什么隔离级别12.为什么会出现秒杀超卖现象13.CAS原理，CAS在mysql上的具体应用答的一般，希望能有二面最后没有手撕。---------------------------------------------更新已约二面，3.24————————————————————————更新：视频面了半小时，主要是线程和进程之间的问题，加锁的代码也要写一些，就面了半小时，凉凉了，没有秒挂就是胜利3.25更新 已结束流程#蚂蚁#

查看28道真题和解析

点赞评论收藏

分享

03-29 08:14

门头沟学院前端工程师

美团内推美团面经

美团内推啦~ 内推码：SBH55RV 投递链接： https://zhaopin.meituan.com/m/campus?staffSsoId=20507416 在美团待了挺久了，感觉 美团值得拥有，祝大家一切顺利嗷～ 与美团一起，探索未知领域！我们致力于创造创新的解决方案，引领行业发展！ 以下是面经分享： 第一轮技术面 自我介绍 强缓存与协商缓存机制实现原理 HTTP/1、HTTP/2、HTTP/3的核心区别 Set与WeakSet的区别及弱引用特性 闭包与V8垃圾回收机制 React Hooks的设计动机及函数组件与类组件的差异 React Fiber架构解决的问题及实现思路 手写...

点赞评论收藏

分享

评论

1

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

2303317次浏览 26993人参与

# 实习期间如何提升留用概率？ #

6982次浏览 134人参与

# 腾讯云智研发2025实习生招聘 #

121255次浏览 1442人参与

# 牛友故事会 #

465357次浏览 11007人参与

# 应届生简历当中，HR最关注哪些？ #

10741次浏览 141人参与

# 什么专业适合考公 #

24423次浏览 181人参与

# 招行数字金融训练营 #

192596次浏览 568人参与

# 大厂还是考编 #

80126次浏览 1300人参与

# 求职你最看重什么？ #

57381次浏览 330人参与

# 机械/制造每日一题 #

53189次浏览 944人参与

# 毕业季，你想好怎么跟生活对线了吗？ #

183558次浏览 3420人参与

# 牛友春招想让哪家公司来捞你？ #

26682次浏览 166人参与

# 虾皮求职进展汇总 #

208833次浏览 1452人参与

# 机械人，说说你的烦心事 #

57014次浏览 783人参与

# 京东工作体验 #

11387次浏览 82人参与

# 实习必须要去大厂吗？ #

81613次浏览 1225人参与

# 我想象的实习vs现实的实习 #

267355次浏览 2160人参与

# 得物app工作体验 #

14324次浏览 52人参与

# 你的秋招简历被谁挂了？ #

244742次浏览 2652人参与

# 文科生还参加今年的春招吗 #

8005次浏览 87人参与

# 职场破防瞬间 #

72643次浏览 894人参与

# 牛友的五一计划 #

60368次浏览 665人参与

牛客网
牛客企业服务