首页 / 26届实习
#

26届实习

#
370227次浏览 5186人互动
此刻你想和大家分享什么
热门 最新
美团日常实习面经(已oc)
#软件开发笔面经# #26届实习# #Java# 一面:1. 了解Redis分布式的部署方法吗?了解主从集群搭建吗?2. 论坛项目里面的维护帖子的排行的Zset如果数据量很大应该怎么办,取数据花的时间比较长,怎么办?3. 为什么要用二级缓存?Redis如果是分布式的话你害怕过期的话,把过期时间设置的长一点不就可以了吗?4. Redis的淘汰策略?5. 讲一讲Redis的缓存三剑客的各种触发原因和解决办法?6.  Quartz  你是单节点还是多节点部署?如果是线上系统多节点的情况下,单个结点的定时在节点宕机的情况下话,怎么去保证定时任务能够有效执行?7. kafka和RocketMQ有什么区别,实现细节上有了解吗?8. kafka怎么处理消息积压?9. 怎么保证kafka处理消息是有序且不重复的?10. SpringBoot框架有什么优势?核心注解有哪些?11. springboot的自动装配有了解吗?12. @AutoWire和@Resource区别?13. springboot启动流程?14. 实现多线程编程的方式有哪些?15. 线程池的核心参数?执行流程?16. 线程有哪些状态?17. 讲一下你熟悉垃圾回收器?18. 新生代和老年代的占比有了解吗?19. 如果服务器出现了线程泄露,你应该怎么怎么去排查解决?20. 实习中遇到了什么技术难点吗?手撕:删除倒数第k个结点 二面:手撕:重排链表1. 介绍实习2. 用RocketMQ主要是用来解决什么问题的?3. RocketMQ什么情况下会出现重复消费的问题?4. 实习中Redis分布式锁的实现原理5. Redis集群部署有哪些方式?6. 在主从集群上使用setnx分布式锁,可能会有哪些问题,怎么解决?7. 实习的模块流量大小8. MySQL什么情况下需要分库分表9. 创建线程池有哪些方式?10. 现在有线程A和B如何实现A运行完以后可以再运行B?11. 乐观锁和悲观锁了解吗?12. http常见的方法有哪些?13. get和post方法的区别?14. 用过RPC框架吗?介绍一下dubbo。流程非常快,面完当天就oc了
暖阳漫行:兄弟在哪投的
点赞 评论 收藏
分享
【26届三段大厂】聊聊大一大二速成秒杀大厂
对27,28届想入门或者刚入门迷茫的同学,这是一部分学习路线分享✨✨✨。【在校阶段-优先基础-构建知识体系】计算机科班:1.(C语言、数据结构、算法)系统入门基础知识,面试必考算法🤛2.(机组、数电、模电、操作系统、计算机网络)传统认识计算机,在部门大厂面试里涉及,计网更是大厂面试必问选项🤟3.(实训:算法,数据库,数据结构)实践能力(复杂课设) 🎁【题外话】:虽然学校课程和部分实训的水分不明,但是把自己在准备实习学的技术与方案融合到日常课设实训,加深了技术理解+老师留下好印象,以后实习被逮捕的可能性降低🎁非科班三大建议:1. 本专业前途渺茫,想换行搞钱2. 公司招聘的技术要求是什么,你就要学些什么。面试必问的计算机专业知识,找面经系统刷过去。(比如小林计网等)🎉3. 面试问你为什么“换行学计算机”,问答要依靠✨本专业学习中有涉及计算机部分,感兴趣检查自学,未来可期更有自驱力✨,虽然你懂我懂他也懂这是什么p话,但是面子上过得去就行。总不能说“我就是来搞钱,就是来卷你的”【一定基础-如何突破-提升实力】1.实践: 特色项目、丰富实习经验、有idea立刻动手2.工程: 参加青训营等进行,团队协作、Coding 能力。锻炼团队开发,git能力,代码规范3.刷题: ************,动态规划,回溯,贪心,树4.额外: 独立搜索,遇到问题自己解决,熟练使用gpt,习惯看官方文档。杜绝学生思维💊💊💊 【实习生阶段】1.独立解决业务问题,遵守技术规范不要制造问题线上bug2.独立分析问题,边学边做3.GPT 编写基础代码,明白基础逻辑4.尝试发现组内业务问题,自驱使用技术解决问题💋💋💋,提升实力,给老大留下印象,算是0风险下独立发现解决需求🎁(详情看我的主页贴- “实习生爆卷产出”)🎁特色项目特点🍎🍎🍎:【字节跳动青训营项目】:关于文档协同编辑。传统的文档编辑方式存在版本管理困难、实时协作受限等问题。提升团队协作效率,支持多人实时协同编辑的在线文档平台。1. 文档管理模块:支持文件夹创建、删除、重命名、嵌套,具备权限控制与共享设置;文档可新建、导入(如Word、PDF、Markdown等格式)、导出(多种格式),并进行分类管理、删除与恢复。2. 在线编辑器:- 基础编辑:实现文本、段落格式化,可插入图片、表格、链接等媒体元素,支持撤销/重做操作。- 协同编辑:具备实时同步编辑内容、光标位置同步展示功能,设有编辑冲突解决机制与用户在线状态显示。- 版本控制:自动保存,支持历史版本管理、比较回滚及编辑历史记录。3. 实时协作功能:- 文档共享:通过链接分享,设置查看、评论、编辑权限及访问有效期。- 实时通信:集成在线评论、即时消息交流、@提及功能及变更通知推送。- 协作管理:涵盖成员管理、权限分配、操作日志记录与协作统计分析。 二、技术栈 1. 前端技术栈:- 框架:React 结合 TypeScript 构建用户界面。- 状态管理:运用 Redux 搭配 Redux - Saga 管理应用状态。- UI 组件:选用 Ant Design 提供美观易用的组件。- 编辑器核心:采用 Slate.js/ProseMirror 实现编辑功能。- WebSocket:借助 Socket.IO client 实现实时通信。- 其他:利用 Draft.js 处理富文本,通过 Operational Transformation 算法处理协同编辑,使用 IndexedDB 进行本地存储。2. 后端技术栈:- 核心框架:基于 Node.js 搭配 Express/Koa 搭建后端服务。- 数据库:MongoDB 存储文档数据,Redis 缓存实时协作数据。- 消息队列:采用 RabbitMQ 处理异步任务。- WebSocket:依靠 Socket.IO 实现实时通信。- 文件存储:选用阿里云 OSS/AWS S3 存储文件。- 搜索引擎:使用 Elasticsearch 实现文档搜索。 三、核心技术难点 1. 实时协同编辑:采用 Operational Transformation 算法保证一致性,实现冲突解决机制,确保多用户编辑数据一致。2. 性能优化:通过文档分片加载、增量更新机制、WebSocket 连接管理及缓存策略优化提升性能。3. 离线支持:借助 Service Worker 实现离线编辑,搭配本地存储与同步机制,并处理断线重连。 四、系统架构 1. 用户层:涵盖 Web 客户端、移动端及桌面客户端。2. 接入层:包含负载均衡、CDN 及 API 网关。3. 应用层:设有文档服务、协同服务、用户服务及消息服务。4. 数据层:涉及 MongoDB、Redis、Elasticsearch 及对象存储。 五、安全考虑 1. 数据传输:采用 HTTPS 加密传输。2. 文档存储:对文档加密存储。3. 权限控制:进行细粒度权限控制。4. 操作审计:记录操作审计日志。5. 安全防护:实施 XSS/CSRF 防护及敏感信息过滤。#牛客激励计划# #实习# #前端# #面试时最害怕被问到的问题# #非科班# #转码# #大厂# #技术岗# #26届实习# #牛客AI配图神器#
Testbupter:太牛了,我从去年大三开始才有意识找实习,不过好在也都熬过来,告一段落了
投递字节跳动等公司10个岗位
点赞 评论 收藏
分享
3.4 阿里-橙狮体育 一面凉经
面试时间:1h20min面试问题1:自我介绍2:ArrayList和LinkedList的区别3:HashMap是否可以存储空值4:HashMap1.7和1.8的区别和数据结构以及扩容机制5:HashSet和TreeSet的区别6:JVM容器,和JMM7:线程池的创建方式8:线程池的参数9:线程池的运行流程和常用的线程池10:线程池的任务拒绝策略11:mysql的事务隔离级别12:mvcc原理13:在可重复读级别下什么情况会发生幻读14:mysql执行计划要看什么字段15:redis常用的数据结构16:RDB,AOF17:缓存三剑客---开始问项目(点评+RPC)18:Redis在项目中的应用19:分布式锁的实现20:看门狗机制21:布隆过滤器的数据结构,怎么进行预热,如何进行增量保存22:用户签到的实现23:一个场景题,使用Redis保存用户排行榜,从两个维度(点赞量和点赞时间)考虑该怎么实现24:缓存一致性的实现25:全局ID生成器的实现,如何考虑时钟回拨26:Redis的事务27:Lua语句的考虑,为社么使用lua语句,他的效果是什么28:AOP的实现29:动态代理,jdk和cglib的区别30:Spring事务失效的场景31:Spring事务的传播机制32:synchronized的底层原理33:CAS的原理和缺陷34:CAS和synchronized在锁中的使用35:偏向锁,轻量级锁和重量级锁的转化机制36:乐观锁37:ReentrantLock38:项目中用到的和知道的设计模式39:设计对象时需要考虑的原则40:1G的数据,1M内存,如何获取出现次数最多的100个词手撕:三数之和#面试常问题系列##大家都开始春招面试了吗##26届实习##26实届找工作求助阵地##牛客AI配图神器#
点赞 评论 收藏
分享
03-19 14:58
腾讯_HR
腾讯-混元大模型面经-华5硕
部门与岗位:TEG - 混元大模型团队 - 大模型对齐一面自我介绍,过实习,讲论文,论文过的比较细,有说的笼统的地方面试官会实时进行询问交流了解哪些大模型,简要挑一两个介绍一下,当时说了 Qwen 和 DeepSeek,然后面试官又问了这两个有什么区别接着上一问,为什么大家都开始探索 MoE 架构,MoE 相比 Dense 有什么好处在之前实习的时候用 LoRA 微调过 Qwen,于是问了有没有全量微调过,有没有对比过两者的性能表现讲一下大模型训练和推理的流程,SFT 和 RLHF 的作用分别是什么在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式代码:22. 括号生成代码:多头自注意力一面问的八股还是比较多的,问的也比较细,而且还写了两道代码题,整个面试花的时间也比较多,大概一个半小时左右二面自我介绍,过实习和论文,面试官会一起进行探讨,包括工作的动机、贡献和结果,也会提一些问题和建议之前实习用 DeepSpeed 微调过 Qwen2-72B,于是面试官问了 ZeRO-1,ZeRO-2,ZeRO-3 三个模式的区别当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存除了 DeepSpeed,还用过其他的什么优化方法吗我看你也用到了 LoRA,知道 LoRA 的原理吗,A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗对 RLHF 了解的多吗代码:3. 无重复字符的最长子串二面更多的是结合具体的工作来问的,从用到的东西来引出问题,问的也比较灵活。当然因为部门主要是做对齐的,所以也大概聊了聊 RLHF三面自我介绍,挑一个觉得做的比较好的论文和实习讲一下,面试官问的比较详细,为什么选现在这种方案,为什么 work,其他方案有考虑吗在微调 Qwen 的时候,数据是怎么构造的,有用到什么数据清洗方法吗,数据配比是怎么做的讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗在做对齐的时候,为什么 SFT 之后还要做 RLHF,只用 SFT 可以吗知道哪些强化学习算法,除了 PPO 和 DPO 这些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进开放题:对目前大模型的发展有什么看法代码:零钱的两个题 322. 零钱兑换518. 零钱兑换 II三面面试官更聚焦于对齐这一块的内容,考的比较深。由于之前没有接触过强化学习,答得还是比较吃力的,不过面试官还挺好的,会一起讨论来做引导四面自我介绍,过论文和实习,问的也比较细,这里能明显的感受出来面试官的视角更系统,会把这些工作串起来问我看你简历上没写 RLHF,平常有用过 RLHF 吗推导一下神经网络反向传播的过程一道排列组合的概率题开放题:你觉得大模型目前还有哪些可以改进的点四面整体更看重思维和基础,没有考察什么八股总结一共四轮技术面,整体来说强度比较大,对于大模型八股的考察比较细,对大模型的理解问的也比较深刻,包括一些数理逻辑基础,考察的比较全面需要内推码的可以用下面这个链接:内推链接:https://join.qq.com/resume.html?k=ANQI6RfQ3rhPS2dpyIkeSw#26届实习##大模型##八股##面经##腾讯##内推#
腾讯
|
实习
|
超多精选岗位
点赞 评论 收藏
分享
03-26 13:17
腾讯_HR
腾讯-混元大模型面经-华5硕
部门与岗位:TEG - 混元大模型团队 - 大模型对齐一面自我介绍,过实习,讲论文,论文过的比较细,有说的笼统的地方面试官会实时进行询问交流了解哪些大模型,简要挑一两个介绍一下,当时说了 Qwen 和 DeepSeek,然后面试官又问了这两个有什么区别接着上一问,为什么大家都开始探索 MoE 架构,MoE 相比 Dense 有什么好处在之前实习的时候用 LoRA 微调过 Qwen,于是问了有没有全量微调过,有没有对比过两者的性能表现讲一下大模型训练和推理的流程,SFT 和 RLHF 的作用分别是什么在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式代码:22. 括号生成代码:多头自注意力一面问的八股还是比较多的,问的也比较细,而且还写了两道代码题,整个面试花的时间也比较多,大概一个半小时左右二面自我介绍,过实习和论文,面试官会一起进行探讨,包括工作的动机、贡献和结果,也会提一些问题和建议之前实习用 DeepSpeed 微调过 Qwen2-72B,于是面试官问了 ZeRO-1,ZeRO-2,ZeRO-3 三个模式的区别当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存除了 DeepSpeed,还用过其他的什么优化方法吗我看你也用到了 LoRA,知道 LoRA 的原理吗,A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗对 RLHF 了解的多吗代码:3. 无重复字符的最长子串二面更多的是结合具体的工作来问的,从用到的东西来引出问题,问的也比较灵活。当然因为部门主要是做对齐的,所以也大概聊了聊 RLHF三面自我介绍,挑一个觉得做的比较好的论文和实习讲一下,面试官问的比较详细,为什么选现在这种方案,为什么 work,其他方案有考虑吗在微调 Qwen 的时候,数据是怎么构造的,有用到什么数据清洗方法吗,数据配比是怎么做的讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗在做对齐的时候,为什么 SFT 之后还要做 RLHF,只用 SFT 可以吗知道哪些强化学习算法,除了 PPO 和 DPO 这些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进开放题:对目前大模型的发展有什么看法代码:零钱的两个题 322. 零钱兑换518. 零钱兑换 II三面面试官更聚焦于对齐这一块的内容,考的比较深。由于之前没有接触过强化学习,答得还是比较吃力的,不过面试官还挺好的,会一起讨论来做引导四面自我介绍,过论文和实习,问的也比较细,这里能明显的感受出来面试官的视角更系统,会把这些工作串起来问我看你简历上没写 RLHF,平常有用过 RLHF 吗推导一下神经网络反向传播的过程一道排列组合的概率题开放题:你觉得大模型目前还有哪些可以改进的点四面整体更看重思维和基础,没有考察什么八股总结一共四轮技术面,整体来说强度比较大,对于大模型八股的考察比较细,对大模型的理解问的也比较深刻,包括一些数理逻辑基础,考察的比较全面需要内推码的可以用下面这个链接:内推链接:https://join.qq.com/resume.html?k=ANQI6RfQ3rhPS2dpyIkeSw#26届实习##大模型##八股##面经##腾讯##内推#
腾讯
|
实习
|
超多精选岗位
点赞 评论 收藏
分享
📣【华为 2012 实验室26届实习/校招启动】嵌入式软件开发 / 通用软件开发 / 电机控制算法
📍工作地点:东莞松山湖 / 上海青浦(双基地可选)💼 招聘岗位:嵌入式软件开发工程师通用软件开发工程师电机控制算法工程师🎯 招聘对象:▫️ 2026 届毕业生(可投实习 / 校招)▫️ 实习要求:2025 年 6-9 月任选 2 个月全职实习▫️ 校招要求:2026 届本科 / 硕士 / 博士毕业生(仅算法招聘博士)🚀 业务方向:无线通信 | 网络设备 | 智能汽车 | 终端产品 | 计算硬件(东莞 / 上海双研发中心,覆盖华为核心产品线)🌟 岗位亮点:✅ 华为研发平台部门,业务稳定,技术沉淀多✅ 双城市可选:东莞松山湖 / 上海青浦✅ 跨领域项目机会:对接5G 通信 / 智能车载 / 计算硬件等多产品线,转换方向容易✅ 工作节奏合适 + 弹性工作制度 + 技术专家导师制🔧 任职要求:▫️ 专业背景: 计算机 / 软件 / 机器人 / 电信 / 自动化 / 电气工程 / 机械工程 等相关专业▫️ 技术能力(满足部分即可):▪️ C/C++ 编程能力(熟悉常用数据结构、开发模式等)▪️ Linux 系统开发经验▪️ 实时操作系统(FreeRTOS/RTX 等)应用经验▪️ CAN/RS485/ETH 等总线协议开发经验▪️ 电机控制算法设计能力▫️ 加分项:开源项目贡献 / 竞赛获奖 / 专利成果✂️---------------------------#华为2012实验室##26校招##26届实习##C++##嵌入式#
王敢敢:欢迎感兴趣的小伙伴私聊,提供全流程指导和进展跟踪
投递华为等公司10个岗位
点赞 评论 收藏
分享
2024-10-09 10:27
已编辑
中央民族大学 Java
26届后端实习总结
下面图给出了timeline。不知道有没有一样走后端开发的小伙伴们,看着身边走前端方向的同学实习offer拿到手软,自己后端这里颗粒无收,连面试都没有。介绍一下bg,鼠鼠是一个末9本学历,大一原定走读研方向,但是看到大二一堆硬件课程学起来人想4,遂放弃读研开始走后端开发。本鼠的后端开发技术栈方向有些曲折,我从刚开始其实学的python用的flask+django,后来发现python后端开发岗位过少,遂转Java。开始学了黑马spring一套,等非常多的技术栈。后来又觉得Java过于卷,又转了golang,学了gin框架一套开发。本鼠非常幸运,凭借着就学了两个月的go技术栈找到了第一份大厂实习,美团,在大二的暑假。在美团写了两个月的Java,然后细细研究,golang好像主要只有字节和腾讯在用,而这两个公司的暑期实习转正又非常不稳,所以又转回了Java。过程中我相信是每一个开发er都经历过的,图书馆早出晚归,背不完的八股,刷不明白的算法,基本全靠记忆。这个过程中我基本上把所有大厂(除了字节)投了个遍,好多都是一直泡池子然后挂掉 这个过程真的很难熬,一边痛苦地刷着面经,一边发现连面试邀约都没有,每天都在怀疑自己是不是要换方向,是不是学历不行要考研,不断内耗,一边内耗一边emo,这期间女朋友还跟我分手了,雪上加霜在这样不断内耗不断崩溃的一个月之后,我开始减少了学习时间开始多一些放松的机会,不让自己经常处于崩溃边缘。把以前的跑步,游戏都捡了起来,这期间我通关了大表哥2还玩了估计起码200盘的极地大乱斗 每天学到九点之后就是娱乐时间,天塌了也不学。这样反而时来运转,慢慢有了面试邀约。所以各位牛友们,如果没有面试或者面试秒挂,有时候真的不是个人的问题,就是没有hc和当前严酷的就业环境问题,希望大家能放平心态,减少内耗,把学习和生活平衡好,大家都可以收获到心仪的offer哒#26届实习##日常实习##实习#
HHHHaos:26届那么多实习,明年秋招稳啦
点赞 评论 收藏
分享
2024-11-03 10:34
南京技师学院 Java
这辈子有了
geiedaada:还是不够大胆,朋友来深圳实习,直接买个睡袋睡公司会议室,晚上门会议室们直接反锁。还有24小时空调
点赞 评论 收藏
分享
最速通pdd
别像我这样不及时填写个人信息不知道哪个hr给我扔暑期了,还没来得及填写就挂了
小狐狸爱睡觉觉:我宣布,这是我今天看到最好笑的笑话,谢谢你
投递拼多多集团-PDD等公司10个岗位 >
点赞 评论 收藏
分享
03-24 14:48
腾讯_HR
腾讯-混元大模型面经-华5硕-附内推链接
需要内推码的可以用下面这个链接:内推链接:https://join.qq.com/resume.html?k=ANQI6RfQ3rhPS2dpyIkeSw#26届实习##大模型##八股##面经##腾讯##内推#腾讯-混元大模型面经-华5硕部门与岗位:TEG - 混元大模型团队 - 大模型对齐一面自我介绍,过实习,讲论文,论文过的比较细,有说的笼统的地方面试官会实时进行询问交流了解哪些大模型,简要挑一两个介绍一下,当时说了 Qwen 和 DeepSeek,然后面试官又问了这两个有什么区别接着上一问,为什么大家都开始探索 MoE 架构,MoE 相比 Dense 有什么好处在之前实习的时候用 LoRA 微调过 Qwen,于是问了有没有全量微调过,有没有对比过两者的性能表现讲一下大模型训练和推理的流程,SFT 和 RLHF 的作用分别是什么在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式代码:22. 括号生成代码:多头自注意力一面问的八股还是比较多的,问的也比较细,而且还写了两道代码题,整个面试花的时间也比较多,大概一个半小时左右二面自我介绍,过实习和论文,面试官会一起进行探讨,包括工作的动机、贡献和结果,也会提一些问题和建议之前实习用 DeepSpeed 微调过 Qwen2-72B,于是面试官问了 ZeRO-1,ZeRO-2,ZeRO-3 三个模式的区别当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存除了 DeepSpeed,还用过其他的什么优化方法吗我看你也用到了 LoRA,知道 LoRA 的原理吗,A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗对 RLHF 了解的多吗代码:3. 无重复字符的最长子串二面更多的是结合具体的工作来问的,从用到的东西来引出问题,问的也比较灵活。当然因为部门主要是做对齐的,所以也大概聊了聊 RLHF三面自我介绍,挑一个觉得做的比较好的论文和实习讲一下,面试官问的比较详细,为什么选现在这种方案,为什么 work,其他方案有考虑吗在微调 Qwen 的时候,数据是怎么构造的,有用到什么数据清洗方法吗,数据配比是怎么做的讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗在做对齐的时候,为什么 SFT 之后还要做 RLHF,只用 SFT 可以吗知道哪些强化学习算法,除了 PPO 和 DPO 这些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进开放题:对目前大模型的发展有什么看法代码:零钱的两个题 322. 零钱兑换518. 零钱兑换 II三面面试官更聚焦于对齐这一块的内容,考的比较深。由于之前没有接触过强化学习,答得还是比较吃力的,不过面试官还挺好的,会一起讨论来做引导四面自我介绍,过论文和实习,问的也比较细,这里能明显的感受出来面试官的视角更系统,会把这些工作串起来问我看你简历上没写 RLHF,平常有用过 RLHF 吗推导一下神经网络反向传播的过程一道排列组合的概率题开放题:你觉得大模型目前还有哪些可以改进的点四面整体更看重思维和基础,没有考察什么八股总结一共四轮技术面,整体来说强度比较大,对于大模型八股的考察比较细,对大模型的理解问的也比较深刻,包括一些数理逻辑基础,考察的比较全面
腾讯
|
实习
|
超多精选岗位
点赞 评论 收藏
分享
03-27 16:31
腾讯_HR
腾讯-混元大模型面经-华5硕-主页内tui
腾讯-混元大模型面经-华5硕部门与岗位:TEG - 混元大模型团队 - 大模型对齐一面自我介绍,过实习,讲论文,论文过的比较细,有说的笼统的地方面试官会实时进行询问交流了解哪些大模型,简要挑一两个介绍一下,当时说了 Qwen 和 DeepSeek,然后面试官又问了这两个有什么区别接着上一问,为什么大家都开始探索 MoE 架构,MoE 相比 Dense 有什么好处在之前实习的时候用 LoRA 微调过 Qwen,于是问了有没有全量微调过,有没有对比过两者的性能表现讲一下大模型训练和推理的流程,SFT 和 RLHF 的作用分别是什么在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式代码:22. 括号生成代码:多头自注意力一面问的八股还是比较多的,问的也比较细,而且还写了两道代码题,整个面试花的时间也比较多,大概一个半小时左右二面自我介绍,过实习和论文,面试官会一起进行探讨,包括工作的动机、贡献和结果,也会提一些问题和建议之前实习用 DeepSpeed 微调过 Qwen2-72B,于是面试官问了 ZeRO-1,ZeRO-2,ZeRO-3 三个模式的区别当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存除了 DeepSpeed,还用过其他的什么优化方法吗我看你也用到了 LoRA,知道 LoRA 的原理吗,A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗对 RLHF 了解的多吗代码:3. 无重复字符的最长子串二面更多的是结合具体的工作来问的,从用到的东西来引出问题,问的也比较灵活。当然因为部门主要是做对齐的,所以也大概聊了聊 RLHF三面自我介绍,挑一个觉得做的比较好的论文和实习讲一下,面试官问的比较详细,为什么选现在这种方案,为什么 work,其他方案有考虑吗在微调 Qwen 的时候,数据是怎么构造的,有用到什么数据清洗方法吗,数据配比是怎么做的讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗在做对齐的时候,为什么 SFT 之后还要做 RLHF,只用 SFT 可以吗知道哪些强化学习算法,除了 PPO 和 DPO 这些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进开放题:对目前大模型的发展有什么看法代码:零钱的两个题 322. 零钱兑换518. 零钱兑换 II三面面试官更聚焦于对齐这一块的内容,考的比较深。由于之前没有接触过强化学习,答得还是比较吃力的,不过面试官还挺好的,会一起讨论来做引导四面自我介绍,过论文和实习,问的也比较细,这里能明显的感受出来面试官的视角更系统,会把这些工作串起来问我看你简历上没写 RLHF,平常有用过 RLHF 吗推导一下神经网络反向传播的过程一道排列组合的概率题开放题:你觉得大模型目前还有哪些可以改进的点四面整体更看重思维和基础,没有考察什么八股总结一共四轮技术面,整体来说强度比较大,对于大模型八股的考察比较细,对大模型的理解问的也比较深刻,包括一些数理逻辑基础,考察的比较全面需要内推码的可以用下面这个链接:内推链接:https://join.qq.com/resume.html?k=ANQI6RfQ3rhPS2dpyIkeSw#26届实习##大模型##八股##面经##腾讯##内推#
腾讯
|
实习
|
超多精选岗位
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务