小北的求职树洞

03-22 12:28 哈尔滨工业大学产品经理发布于北京

关注

面试官：Deepseek推理大模型与指令大模型（如豆包、文心）等有什么不同？

一、训练范式与核心技术
1. 强化学习主导
- DeepSeek-R1基于大规模强化学习（RL）完成后训练，其强化学习训练占比超过95%，甚至存在完全依赖RL的DeepSeek-R1-Zero版本。
- 传统指令模型（如文心、ChatGPT O1）则更依赖监督微调（SFT）和人类反馈的强化学习（RLHF）。
2. 冷启动与多阶段训练
- DeepSeek-R1通过引入高质量“冷启动”数据辅助初始阶段学习，并结合多阶段训练策略（如拒绝采样）提升推理能力。
- 而指令模型通常直接从预训练模型通过SFT对齐人类偏好。

二、能力与任务适配性
1. 复杂推理能力
- DeepSeek-R1专门针对数学推导、代码生成、逻辑分析等复杂任务优化，其推理过程中支持自我验证、错误检测及多路径探索。
- 指令模型更侧重通用对话和指令理解，在复杂推理任务中表现较弱。
2. 生成质量差异
- DeepSeek-R1的纯RL版本（R1-Zero）存在生成内容可读性较低的问题，需通过混合训练策略改进，
- 而指令模型因依赖SFT数据，输出更符合人类语言习惯。

三、架构设计与成本效率
1. 优化算法创新
- DeepSeek-R1采用Group Relative Policy Optimization（GRPO）等新型RL算法，支持无监督条件下的推理能力进化。
- 指令模型通常沿用PPO等传统RLHF算法。
2. 成本优势
- DeepSeek-R1在同等性能下成本比OpenAI o1系列低30倍，且在数学、代码基准测试中达到甚至超越Claude 3.5 Sonnet等模型。

四、应用场景与合规性
1. 垂直领域适配
- DeepSeek-R1更适用于科研、金融等高精度推理场景，
- 而ChatGPT O1等指令模型偏向通用客服、教育等泛化场景。

#产品经理# #Ai产品经理# #AI# #牛客创作赏金赛# #牛客激励计划#

全部评论

推荐最新楼层

给一个好offer吧

江苏科技大学 Java

mark

点赞回复分享

发布于 03-24 19:50 江苏

不进华为就延毕

桂林电子科技大学 Java

mark

点赞回复分享

发布于 03-24 19:55 广西

03-24 15:30

已编辑

门头沟学院算法工程师

大模型面经每日总结

BP16 和 FP16 在存储结构、精度表现、数值范围以及适用场景方面有什么不同？训练时使用bf16更稳定，表示范围大，并且自带隐式正则化buffer；推理时使用fp16比bf16更好，因为fp16表示精度高。 https://www.zhihu.com/question/616600181/answer/3194881239怎么解决训练使用float16导致溢出的问题？使用 缩放因子 trick混合精度训练kv-cache的作用一种缓存技术，通过存储键值对的形式来复用计算结果，以达到提高性能和降低内存消耗量化方法的分类按量化对象分：KV Cache量化、模型权重量化、激活值量化-按量化阶段分...

查看6道真题和解析

点赞评论收藏

分享

03-21 11:52

哈尔滨工业大学产品经理

面试官：大模型评测的核心指标有哪些？

一、模型核心能力评估1. 认知准确性   1.1 基础准确率       - 通用场景Top-1准确率＞82%（置信区间±2%）   1.2 领域专精度       - 医疗QA准确率≥89%（USMLE测试集）       - 法律条文解析准确率≥91%（Bar Exam基准）   1.3 抗幻觉指数       - TruthfulQA准确率＞65%        - 事实错误率＜3%（5000次对话统计值）2. 生成品质   2.1 语义相关度       - BERTScore＞0.85（阈值参考MS MARCO标准）   2.2 逻辑连贯性       - 人工评估8分制达6.5+        - 跨段落验证通过率＞80%   2.3 创新多样性       - Distinct-3＞0.45（开放域对话场景）       - 生成重复率＜15%（连续3轮对话）3. 交互流畅度   3.1 响应效能       - 端到端P95时延＜1.8s（含网络传输）       - 首token延迟＜400ms（视觉感知临界值）   3.2 多轮记忆       - 32k上下文窗口下话题保持率＞92%       - 实体记忆准确率＞88%（10轮对话测试）   3.3 容错机制       - 错误应答自主修正成功率＞70%       - 歧义澄清触发准确率＞85%4. 价值感知   4.1 任务达成率       - 工具类场景＞93%（如代码生成/文档摘要）       - 客服场景＞88%（含工单转接场景）   4.2 用户粘性       - 7日留存＞35%（工具类产品基准）       - 日均对话轮次＞5.2（社交类场景）   4.3 心智占位       - NPS净推荐值＞65（超越ChatGPT 45基准）       - 品牌提及率＞40%（未提示场景调研）5. 成本效益   5.1 推理经济性       - 7B模型单次请求成本＜$0.0008（动态量化后）       - 千次调用成本＜$0.8（考虑流量折扣）   5.2 资源利用率       - 动态批处理QPS＞60（A10 GPU基准）       - 显存占用＜12GB（INT8量化后）   5.3 冷启动优化       - 容器化部署＜25s（含模型预热）       - 自动扩缩容响应＜8s（突发流量场景）6. 场景适配   6.1 领域扩展性       - 新业务适配周期＜3人日（基于LoRA微调）       - 跨领域迁移准确率＞75%（少样本场景）   6.2 风险控制       - 敏感内容拦截率＞99.5%（AUC＞0.98）       - 合规审核通过率100%（GDPR/HIPAA场景）   6.3 商业转化       - 线索转化率提升＞15%（对比规则引擎）       - 人工替代率＞40%（客服场景实测）1️⃣技术验证阶段     对抗测试集验证         TruthfulQA/LAMBADA2️⃣用户体验验证     眼动实验+行为埋点      Hotjar/Mixpanel3️⃣业务价值验证     A/B测试+转化漏斗分析  Optimizely/GrowthBook指标健康度看板：技术指标权重40% | 体验指标30% | 商业指标30%异常波动阈值：单项指标周环比变化＞15%触发告警  #牛客激励计划#  #产品经理#  #Ai产品经理#  #研发#  #面试#  #百度求职进展汇总#  #AI# #牛客AI配图神器#

牛客激励计划百度求职进展汇总

点赞评论收藏

分享

03-24 10:18

米哈游_sre工程师

AI研发工程师|社招|米哈游|内推

内推码：J4VQ9 岗位链接：链接 投递的时候，请填写内推码，方便我跟进后续流程；社招岗位一般2-3个工作日会有进度更新，请耐心等候； 岗位名称 AI研发工程师（游戏方向）-崩坏IP预研 工作职责 1.研究前沿AI技术（如大语言模型、多智能体系统、生成式AI等），探索其在游戏研发管线优化及体验升级中的应用场景； 2.设计并开发基于AI Agent的研发工具链。覆盖代码审查、自动化测试、美术资源生成和优化、策划配置生成等环节； 3.定制引擎和工具流。协同策划、美术、程序团队重构工业化管线，建立AI驱动的敏捷研发新模式。 任职要求 1.深入了解大模型的原理、能力边界及应用场景，具备实际项目中...

投递米哈游等公司10个岗位 >

点赞评论收藏

分享

03-20 17:04

门头沟学院算法工程师

快手-多模态大模型实习生-一面可灵视频生成团队

情况: √ 一面结束没多久就反馈了大概1个小时不到1、为什么大模型会出现复读机现象2、从Transformer介绍大模型的前世今生3、请介绍你的论文和实习的项目4、为什么使用多头注意力5、sft过后的模型提取不了prompt，视而不见，能不能通过cot来缓解(推理速度变慢)6、leetcode-最长回文子串基本都是简历面反问:1、具体是干嘛的沿着可灵团队的多模态，做一些多模态的理解，也是业务导向的发论文和出成果#快手##大模型实习##算法岗面试#

查看7道真题和解析

点赞评论收藏

分享

03-17 14:47

已编辑

武汉大学算法工程师

大模型算法实习/秋招简历求建议

BG：双非本、985硕现状：拿下了鹅厂IEG算法暑期offer，但个人不太想去深圳（优先杭州），阿里卡BG（淘天92、阿里云99）都快麻了，想问下大家秋招去杭州其他大厂还有机会吗？求建议。

投递阿里巴巴集团等公司10个岗位 > 简历被挂麻了，求建议笔试

点赞评论收藏

分享

评论

11

14

招聘动态

阿里大文娱

25届补录&26届实习

招商银行数字金融训练营

火热报名中

小米集团

25届校招+26届实习

26届实习生双选会报名开启

满帮集团

2025春季校园招聘

网易游戏雷火

25届校招&26届精英实习招聘

华泰证券Fintech金融科技

2025届及2026届校园招聘

字节跳动

25届补录&26届实习

亚信安全

2025届校园招聘

神策数据

2025校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 腾讯音乐求职进展汇总 #

71953次浏览 398人参与

# 你收到美的的感谢信了吗 #

30948次浏览 208人参与

# 腾讯云智研发2025实习生招聘 #

68419次浏览 934人参与

# 牛友故事会 #

396437次浏览 9993人参与

# 米哈游工作体验 #

4798次浏览 53人参与

# 产品人求职现状 #

170435次浏览 1724人参与

# 招行数字金融训练营 #

60995次浏览 298人参与

# 职场破防瞬间 #

18112次浏览 332人参与

# 秋招后遗症 #

19997次浏览 218人参与

# 同程求职进展汇总 #

7168次浏览 71人参与

# 如何看待应届生身份？ #

30315次浏览 398人参与

# 你知道哪些职场黑话？ #

24847次浏览 189人参与

# 中核求职进展汇总 #

16075次浏览 141人参与

# 机械人的薪资开到多少，才适合去？ #

92964次浏览 411人参与

# 面试之前应该如何准备？ #

16761次浏览 421人参与

# 你的实习什么时候入职 #

122271次浏览 1172人参与

# 美的集团工作体验 #

17604次浏览 53人参与

# 投格力的你，拿到offer了吗？ #

65645次浏览 518人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

187125次浏览 1366人参与

# 上班到公司第一件事做什么？ #

33073次浏览 329人参与

# 深信服提前批进度交流 #

85196次浏览 673人参与

# 查收我的offer竞争力报告 #

139211次浏览 889人参与

牛客网
牛客企业服务