03-24 19:18 南京大学算法工程师发布于广东

关注

一些凉经

Shoppe

一面

简历项目
如何估算显存开销
优化器中会保存哪些数据
为什么会保存一份模型参数
Llama Factory中的padding，当多条数据拼接时如何处理，对attention有什么影响
优化器状态里面包括什么
pytorch中的calculator如何进行梯度累积
Code：一个骰子投n次，求概率分布

字节抖音搜索

一面

简历实习项目1，数据构建？评估？如果再做一边如何来进行优化？
简历实习项目2，难点？挑战？如果再做一边如何来进行优化？
算法手写LayerNorm最多k个不同字符的最长字串
模型参数如何计算？
MHA中有哪些额外计算？
GQA，MLA？

二面

拷打
Code 编辑距离

蚂蚁数字支付自然语言处理

一面

简历项目
QKV的含义
机器翻译任务中kv可以是同一个吗？
RL中Model based和Model free的区别？
MCTS属于哪一种？介绍一些MCTS的过程？
Policy Based和Value Based的区别？
GRPO和DPO的区别？
Code：打家劫舍
平时如何学习新知识？
对大模型的未来的看法？
选择岗位看中什么？
反问

阿里淘天

一面

自我介绍
介绍一下口语化的流程，数据集大小，如何构造，为什么用Qwen不用混元？
如何评估？如何迭代？上线之后如何面对保证响应速度？
有哪些微调方式，Lora了解吗？Adaptor放在哪里？
为什么要用RLOO？和PPO比有什么优势，Reward怎么构造？
介绍一下PPO，DPO，GRPO等等？有什么异同？
介绍一下Cpt的数据大小，为什么要混入通用数据？怎么配比？
Cpt和Pretrain的区别？用了多少张卡，训练了多久
介绍一下RAG的项目，检索的数据准确性？具体场景？
介绍一下Encoder-Decoder的异同
位置编码，相对、绝对，RoPE，有什么好处？
常见Tokenizer有哪些，subword分词有什么好处？
Transformer中包含哪些块？MLP，Attention，Embedding，LayerNorm？
Attention计算流程，QKV如何得到？
Code：手写MLP以及训练过程
到岗时间？

全部评论

推荐最新楼层

03-18 16:21

已编辑

哈尔滨工业大学（威海） Java

【面经】蚂蚁网商银行 Java暑期实习

时间线：25.3.14 投递、一面、面完秒挂3.14 蚂蚁网商银行一面 30min本来上午面了80分钟就累了，下午突然一个电话打过来要面试，实习经历没听懂，八股也拉，寄实习面试官没懂为什么这么设计，很多问题时间有限没继续问直接过去了，可惜八股操作系统进程和线程有什么区别？协程了解吗？Java 共享变量如何实现可见性synchronized 和 juc 包里锁实现原理上的区别MySQL 可重复读是如何实现的，ReadView 如何工作RocketMQ 和 Kafka 区别，RocketMQ 顺序消息，事务消息，消息内部实现，确认机制的原理（全忘了）

查看7道真题和解析

点赞评论收藏

昨天 10:46

已编辑

东南大学 Java

2025.3.24蚂蚁电话面

1.linux的ip table2.java的垃圾回收机制3.spring怎么解决循环依赖4.操作系统进程相关的#蚂蚁求职进展汇总#5.项目相关的6.设计模式7.arp怎么优化8.mysql的事务隔离机制

查看16道真题和解析蚂蚁求职进展汇总

点赞评论收藏

03-06 21:10

门头沟学院 C++

腾讯PCG客户端一面

之前面完忘记写了，补一下。2.27 第一次面试，没啥经验3分钟自我介绍 + 40分钟常规八股（没怎么碰项目，可能是太垃圾了），20分钟LRU手撕，比想象中的快面试官人挺好没有为难，平易近人项目为什么用多线程不用多进程共享内存的底层原理虚拟地址空间相关平时什么情况下遇到崩溃，怎么解决（结合虚拟内存提问）数组越界一定会崩溃吗c++的new和malloc有什么区别free 释放 new 会怎么样，free 两次呢tcp和udp的区别（太紧张居然没答出几个）tcp怎么实现可靠传输三次握手和四次挥手可以少一次吗四次挥手过程tcp数据到达是有序的还是乱序的，交给上层是有序的还是乱序的浏览器输入网址过程（吟...

喜欢吃卤蛋的肖恩在参加牛客活动：单例模式的缺点好像是可能会造成内存泄露，之前背Android八股时了解过

查看16道真题和解析

点赞评论收藏

昨天 10:18

已编辑

蚌埠坦克学院前端工程师

蚂蚁国际前端一面3.24（和群友对线后发现是kpi面）

面试官脸特别黑，像我欠了他三百万…而且中间人直接消失了接近10min，而且问问题有的问题奇奇怪怪搞不懂想问啥 最后手写题LRU众所周知代码比较长，一到一小时整点就让我别写了，第一题写的代码也没看，直接就是反问了，反问介绍业务也是有种敷衍+心不在焉的感觉…体验不咋地，评价为已经不太想去了…自我介绍拷打项目（他一直问方案设计和业界其他的方案调研，说实话我觉得我答的不好，但我又不知道该怎么答）方案设计 技术选型 技术方案扩展性 稳定性登录态的设计 jwtjwt和session cookie的区别为什么要用jwt做登录怎么理解session呢js事件循环机制宏任务和微任务有哪些输入一个url到页面显示的过程js加载会阻塞页面渲染吗async和defer的区别css解析会解析页面渲染吗link慢的话 网络加载比较慢 页面也会比较慢（omg 我没懂他想问啥）如何获取页面的性能数据除了工具之外 还有其他方法衡量页面的方法吗如何在全局捕获一些js异常如何解决跨域问题用了cors请求跨域 但比正常请求慢 可能是什么原因vue2和vue3的区别vue2的响应式设计有什么问题？为什么需要在vue3的时候做调整？vue2怎么实现对数组更新的响应式劫持？数组原生方案怎么做到对数组的更新操作带响应式的？（问的莫名其妙 不知道想让我回答什么 我说了数组的遍历方式他又说不是这个）要自动打印的数组的当前所有元素要怎么做怎么做到push的时候自动打印（不知道他想问啥）vue2数组的响应式原理 怎么改变原始的push方法让他做到自动化响应式输出结果（问的奇奇怪怪算法手写题promise.allLRU反问

查看26道真题和解析

点赞评论收藏

03-14 14:28

蚂蚁集团_网络工程部_软件开发工程师(准入职员工)

蚂蚁集团内推

阿里巴巴 蚂蚁集团 国际事业群，摘自优秀牛油一面 (70 分钟)30 分钟 7 道题目 (排序, 发布订阅, lodash.get, DOM / CSS 熟练度等) 笔试复盘 为什么要阻止跨域? 有具体例子嘛? 如何实现跨域 聊聊 HTTP 缓存 聊聊 HTTPS 聊聊 HTTP2 vs HTTP3 聊聊 CDN 聊聊实习接口的安全性和可靠性你做了什么? 后端监控? 你对 Node.js 多了解 History 改动怎么监听 React key 有什么用 React class 组件和 functional 组件区别 React 组件通信方式 React useMemo vs useCallb...

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 投递几十家公司，到现在0offer，大家都一样吗 #

# 总结:offer选择，我是怎么选的 #

# 22届毕业，是读研还是拿外包offer先苟着 #

# 选了这个offer，你有没有后悔？ #

496539次浏览 3553人参与

# 远程面试的尴尬瞬间 #

72229次浏览 629人参与

一些凉经

Shoppe

一面

字节 抖音搜索

一面

二面

蚂蚁 数字支付 自然语言处理

一面

阿里 淘天

一面

全站热榜

创作者周榜

字节抖音搜索

蚂蚁数字支付自然语言处理

阿里淘天