确实是五五开了，方向和背书都差不多，你要现在就呆在蚂蚁确实没必要动，或者再参考下_牛客网

2024-05-20 15:51 百度_C++

关注

确实是五五开了，方向和背书都差不多，你要现在就呆在蚂蚁确实没必要动，或者再参考下地点租房什么的其他影响

2 1

03-18 17:31

TP-Link联洲国际_人力资源部_HR(准入职员工)

TP-LINK内推TP-LINK内推TP-LINK内推

面经；(7.19座谈会，7.31oc，sp+5)岗位：系统硬件工程师（杭州）面试轮次：三轮/终面/主管面p.s. 万万没想到，从投错岗位到二面答得非常乱，居然还能进终面，这就是学历厂吗二面经历见个人主页上一条动态面试流程(共30分钟)：1. 自我介绍2. 项目/实习经历介绍（这里我只放面试官提问的内容）1）某半导体厂的封装设计工程师（本人现在正在实习的岗位），主要做车载SiC的散热pin-fin的结构优化设计，涉及CFD仿真与CAD制图2）导师公司的结构工程师（实习结束），做一些结构件的设计，包含动力学与运动学仿真3）工程训练竞赛物流小车（二面问过）3. 项目/实习提问（主管面不太聚焦于专业知...

点赞评论收藏

分享

03-03 20:25

天津大学算法工程师

26届🐭，求建议

bg985本硕，方向是ai相关的，医学图像处理，非科班出身，目前有一篇论文在投，应该现在找暑期实习吗(但是hot100才刷了一半，还是直接准备秋招啊

点赞评论收藏

分享

03-20 19:20

西安电子科技大学天线工程师

只要报名参加中兴捧月赛事并提交相关比赛资料，即可获得秋招免笔试资格。请点击链接: https://uchallenge.cn/zte-student-match/login?inviteCode=S00807注册后，根据提示完善信息，并填写推荐码：S00807

点赞评论收藏

分享

昨天 11:52

哈尔滨工业大学产品经理

面试官：大模型评测的核心指标有哪些？

一、模型核心能力评估1. 认知准确性   1.1 基础准确率       - 通用场景Top-1准确率＞82%（置信区间±2%）   1.2 领域专精度       - 医疗QA准确率≥89%（USMLE测试集）       - 法律条文解析准确率≥91%（Bar Exam基准）   1.3 抗幻觉指数       - TruthfulQA准确率＞65%        - 事实错误率＜3%（5000次对话统计值）2. 生成品质   2.1 语义相关度       - BERTScore＞0.85（阈值参考MS MARCO标准）   2.2 逻辑连贯性       - 人工评估8分制达6.5+        - 跨段落验证通过率＞80%   2.3 创新多样性       - Distinct-3＞0.45（开放域对话场景）       - 生成重复率＜15%（连续3轮对话）3. 交互流畅度   3.1 响应效能       - 端到端P95时延＜1.8s（含网络传输）       - 首token延迟＜400ms（视觉感知临界值）   3.2 多轮记忆       - 32k上下文窗口下话题保持率＞92%       - 实体记忆准确率＞88%（10轮对话测试）   3.3 容错机制       - 错误应答自主修正成功率＞70%       - 歧义澄清触发准确率＞85%4. 价值感知   4.1 任务达成率       - 工具类场景＞93%（如代码生成/文档摘要）       - 客服场景＞88%（含工单转接场景）   4.2 用户粘性       - 7日留存＞35%（工具类产品基准）       - 日均对话轮次＞5.2（社交类场景）   4.3 心智占位       - NPS净推荐值＞65（超越ChatGPT 45基准）       - 品牌提及率＞40%（未提示场景调研）5. 成本效益   5.1 推理经济性       - 7B模型单次请求成本＜$0.0008（动态量化后）       - 千次调用成本＜$0.8（考虑流量折扣）   5.2 资源利用率       - 动态批处理QPS＞60（A10 GPU基准）       - 显存占用＜12GB（INT8量化后）   5.3 冷启动优化       - 容器化部署＜25s（含模型预热）       - 自动扩缩容响应＜8s（突发流量场景）6. 场景适配   6.1 领域扩展性       - 新业务适配周期＜3人日（基于LoRA微调）       - 跨领域迁移准确率＞75%（少样本场景）   6.2 风险控制       - 敏感内容拦截率＞99.5%（AUC＞0.98）       - 合规审核通过率100%（GDPR/HIPAA场景）   6.3 商业转化       - 线索转化率提升＞15%（对比规则引擎）       - 人工替代率＞40%（客服场景实测）1️⃣技术验证阶段     对抗测试集验证         TruthfulQA/LAMBADA2️⃣用户体验验证     眼动实验+行为埋点      Hotjar/Mixpanel3️⃣业务价值验证     A/B测试+转化漏斗分析  Optimizely/GrowthBook指标健康度看板：技术指标权重40% | 体验指标30% | 商业指标30%异常波动阈值：单项指标周环比变化＞15%触发告警  #牛客激励计划#  #产品经理#  #Ai产品经理#  #研发#  #面试#  #百度求职进展汇总#  #AI# #牛客AI配图神器#

牛客激励计划百度求职进展汇总

点赞评论收藏

分享

03-13 00:40

浙江大学算法工程师

硕士去算法预研还是算法工程化部署哪个发展好

双985 一篇accept 一篇再投 再找实习有一个对口公司 一个部门里面有 预研组和一个将算法工程化部署的请问 硕士进哪个部门能收获的多一些  后期发展空间大一些 请各位前辈指教能分享这俩个日常工作状态就更好了

点赞评论收藏

分享

牛客热帖

更多

正在热议

更多

# 实习要如何选择和准备？ #

8141次浏览 225人参与

# 正在实习的你，几点下班 #

98116次浏览 706人参与

# 携程求职进展汇总 #

202347次浏览 1701人参与

# 美团求职进展汇总 #

1619256次浏览 14601人参与

# 面试等了一周没回复，还有戏吗 #

97512次浏览 891人参与

# 字节求职进展汇总 #

706409次浏览 7169人参与

# 面试被问第一学历差时该怎么回答 #

103820次浏览 657人参与

# 中广核工作体验 #

10736次浏览 50人参与

# 蚂蚁集团工作体验 #

9228次浏览 67人参与

# 科大讯飞工作体验 #

15561次浏览 46人参与

# 满分简历要如何准备？ #

14225次浏览 272人参与

# 稳定和高薪机械人更看重哪个？ #

421622次浏览 5293人参与

# 金蝶求职进展汇总 #

39660次浏览 227人参与

# 牛友打假中心 #

36526次浏览 2309人参与

# 我想去国央企的原因 #

52976次浏览 319人参与

# 讲讲我的真实离职原因 #

32878次浏览 621人参与

# 通信硬件2023笔面经 #

30379次浏览 234人参与

# 听到哪句话就代表面试稳了or挂了？ #

120635次浏览 1092人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

87005次浏览 626人参与

# 用表情包形容我的2023 #

6728次浏览 46人参与

# 工作两年想退休了 #

98229次浏览 1030人参与

牛客网
牛客企业服务