太初 大模型算法 一面

两个岗位同时约面,进错会议了尴尬

面试时长:50min

面试内容:
* 自我介绍
* 实习内容介绍
* 数据并行
* ft框架
* 随机森林
* gbdt
* 优化器了解哪些
* bert和gpt
* transformer结构
* 线上服务推理如何提高吞吐量
* 手撕:链表加法
全部评论
赛文哥你是真全栈工程师,顶层到大模型,底层到c,Java,Python,Linux,深度学习,cv,统计学,数据科学你都会。你要是哪天告诉我你会手搓芯片我都不意外
40 回复 分享
发布于 2023-11-09 13:23 浙江
赛文他还在输出!还在输出!
11 回复 分享
发布于 2023-11-09 12:47 湖北
赛文哥,你现在说你会ic,我都信
6 回复 分享
发布于 2023-11-09 12:18 四川
赛文哥不是面过太初么
3 回复 分享
发布于 2023-11-09 14:40 江苏
赛文你是不是一个面试团队,怎么啥都会😭
3 回复 分享
发布于 2023-11-09 17:52 湖北
不是,你啥都会啊
3 回复 分享
发布于 2023-11-09 21:24 北京
赛文赛文,我的超人
2 回复 分享
发布于 2023-11-09 12:14 四川
大模型也能面啊😍
2 回复 分享
发布于 2023-11-09 15:46 湖北
赛文佬你怎么还在面!
2 回复 分享
发布于 2023-11-09 16:24 陕西
我现实中的超人,赛文!!!❤️
1 回复 分享
发布于 2023-11-10 10:40 湖北
哥,你咋啥都会啊
1 回复 分享
发布于 2023-11-10 22:31 北京
我咋没看懂呢。哥 本科生也能面大模型了吗😂
1 回复 分享
发布于 2024-01-05 03:31 广东

相关推荐

个人经验总结,觉得有用的话,直接收藏背诵(一)深度复盘体系要想在秋招里突围,先得建立三维度复盘模型,精准找到自己的短板。技术硬伤矩阵,看看自己在算法、系统设计、领域知识哪块不行;面试表现热力图,分析自己表达结构、应变能力、业务理解哪些地方差点;投递策略漏斗,评估企业匹配度、流程管理、信息获取效率。只有全面复盘,才能对症下药。(二)笔试效能提升方案笔试这块,咱得用 STAR-Matrix 训练法来提升。S 阶段,LeetCode 企业题库 TOP200 强化,把高频考点拿捏住;T 阶段,大厂真题分类击破,按题型专项训练;A 阶段,全真 IDE 环境压力训练,模拟真实考试场景;R 阶段,建立知识图谱漏洞标记,把错题溯源,把知识漏洞补上。(三)战略级日常实习选择日常实习也得讲究策略,遵循 BAT 法则。B(Branding): 优先选有行业认证背书的项目,这样简历好看;A(Alignment): 确保工作内容和目标岗位 JD 匹配度超过 70%,积累相关经验;T(Timeline): 控制实习周期在 3 - 4 个月,实现经验快速转化,别浪费时间。秋招就是一场持久战,关键在于不断提升自己的竞争力。企业要的是能解决问题的人,而你要做的,就是成为那个人,用实力去赢得秋招。加油!!接offer #牛客激励计划#
点赞 评论 收藏
分享
一、训练范式与核心技术1. 强化学习主导- DeepSeek-R1基于大规模强化学习(RL)完成后训练,其强化学习训练占比超过95%,甚至存在完全依赖RL的DeepSeek-R1-Zero版本。- 传统指令模型(如文心、ChatGPT O1)则更依赖监督微调(SFT)和人类反馈的强化学习(RLHF)。2. 冷启动与多阶段训练- DeepSeek-R1通过引入高质量“冷启动”数据辅助初始阶段学习,并结合多阶段训练策略(如拒绝采样)提升推理能力。- 而指令模型通常直接从预训练模型通过SFT对齐人类偏好。二、能力与任务适配性1. 复杂推理能力- DeepSeek-R1专门针对数学推导、代码生成、逻辑分析等复杂任务优化,其推理过程中支持自我验证、错误检测及多路径探索。- 指令模型更侧重通用对话和指令理解,在复杂推理任务中表现较弱。2. 生成质量差异- DeepSeek-R1的纯RL版本(R1-Zero)存在生成内容可读性较低的问题,需通过混合训练策略改进,- 而指令模型因依赖SFT数据,输出更符合人类语言习惯。三、架构设计与成本效率1. 优化算法创新- DeepSeek-R1采用Group Relative Policy Optimization(GRPO)等新型RL算法,支持无监督条件下的推理能力进化。- 指令模型通常沿用PPO等传统RLHF算法。2. 成本优势- DeepSeek-R1在同等性能下成本比OpenAI o1系列低30倍,且在数学、代码基准测试中达到甚至超越Claude 3.5 Sonnet等模型。四、应用场景与合规性1. 垂直领域适配- DeepSeek-R1更适用于科研、金融等高精度推理场景,- 而ChatGPT O1等指令模型偏向通用客服、教育等泛化场景。 #产品经理#  #Ai产品经理#  #AI#  #牛客创作赏金赛#  #牛客激励计划#
点赞 评论 收藏
分享
评论
7
20
分享

创作者周榜

更多
牛客网
牛客企业服务