首页 / 研发
#

研发

#
78699次浏览 907人互动
此刻你想和大家分享什么
热门 最新
2024-09-13 10:08
已编辑
金发科技_研发工程师
金发科技内推:IVK8SH
金发科技简历筛选和面试正在进行中,同时在各大城市开始线下宣讲,关注“金发科技招聘”微信公众号,可查看具体宣讲行程,参与线下宣讲会,有机会拿到面试直通卡,更有超多礼品赠送。金发科技第一批面试将在宣讲会结束后马上进行,各位25届小伙伴们抓住机会,拿下500强上市公司的offer吧。投递简历时填下我的内推码:IVK8SH,简历优先筛选,我将全程追踪面试进展哈。此外,在面试前后有任何问题都可以咨询我,想对公司有更多的了解也可以私信我哦💰 薪资待遇 金发在材料/化工领域具有top薪资,25届的应届生会进一步涨薪20%,具体薪资以线下宣讲会公布为主。📚 简历优化技巧 突出专业背景和实习经历📑 面试经验 一面为无领导小组面试,淘汰比例很高,需要在面试过程中积极主动,尽可能为小组多做贡献,此外,自信大方的状态是最好的加分项。二面为技术面,主要考察专业背景和实习经历,多突出自己和岗位的匹配度,硕士及博士可多与面试官沟通研究成果(论文,专利,项目经验等),本科生可多与面试官沟通项目经历和实习经历。🍰 部门/团队氛围 团队氛围nice,今年有600人的招聘指标,各位小伙伴们要抓住机会啦🏝 工作环境 总部位于广州科学城,旗下拥有60家子公司。金发科技:改性塑料龙头企业,全国500强上市公司,全球化工新材料行业产品种类最为齐全的企业之一,同时是全球规模领先、产品种类最为齐全的改性塑料生产企业。 #金发科技# #金发科技内推# #金发科技全球校园招聘# #offer# #面试# #材料# #营销# #研发# #运营#       #25秋招# #上市公司# #改性塑料# #无领导小组讨论如何脱颖而出# #技术面经#   #25届金发科技全球校园招聘# #内推#  #面经# #选offer# #面试直通卡#
金发科技
|
校招
|
54个岗位
点赞 评论 收藏
分享
面试官:大模型评测的核心指标有哪些?
一、模型核心能力评估1. 认知准确性   1.1 基础准确率       - 通用场景Top-1准确率>82%(置信区间±2%)   1.2 领域专精度       - 医疗QA准确率≥89%(USMLE测试集)       - 法律条文解析准确率≥91%(Bar Exam基准)   1.3 抗幻觉指数       - TruthfulQA准确率>65%        - 事实错误率<3%(5000次对话统计值)2. 生成品质   2.1 语义相关度       - BERTScore>0.85(阈值参考MS MARCO标准)   2.2 逻辑连贯性       - 人工评估8分制达6.5+        - 跨段落验证通过率>80%   2.3 创新多样性       - Distinct-3>0.45(开放域对话场景)       - 生成重复率<15%(连续3轮对话)3. 交互流畅度   3.1 响应效能       - 端到端P95时延<1.8s(含网络传输)       - 首token延迟<400ms(视觉感知临界值)   3.2 多轮记忆       - 32k上下文窗口下话题保持率>92%       - 实体记忆准确率>88%(10轮对话测试)   3.3 容错机制       - 错误应答自主修正成功率>70%       - 歧义澄清触发准确率>85%4. 价值感知   4.1 任务达成率       - 工具类场景>93%(如代码生成/文档摘要)       - 客服场景>88%(含工单转接场景)   4.2 用户粘性       - 7日留存>35%(工具类产品基准)       - 日均对话轮次>5.2(社交类场景)   4.3 心智占位       - NPS净推荐值>65(超越ChatGPT 45基准)       - 品牌提及率>40%(未提示场景调研)5. 成本效益   5.1 推理经济性       - 7B模型单次请求成本<$0.0008(动态量化后)       - 千次调用成本<$0.8(考虑流量折扣)   5.2 资源利用率       - 动态批处理QPS>60(A10 GPU基准)       - 显存占用<12GB(INT8量化后)   5.3 冷启动优化       - 容器化部署<25s(含模型预热)       - 自动扩缩容响应<8s(突发流量场景)6. 场景适配   6.1 领域扩展性       - 新业务适配周期<3人日(基于LoRA微调)       - 跨领域迁移准确率>75%(少样本场景)   6.2 风险控制       - 敏感内容拦截率>99.5%(AUC>0.98)       - 合规审核通过率100%(GDPR/HIPAA场景)   6.3 商业转化       - 线索转化率提升>15%(对比规则引擎)       - 人工替代率>40%(客服场景实测)1️⃣技术验证阶段     对抗测试集验证         TruthfulQA/LAMBADA2️⃣用户体验验证     眼动实验+行为埋点      Hotjar/Mixpanel3️⃣业务价值验证     A/B测试+转化漏斗分析  Optimizely/GrowthBook指标健康度看板:技术指标权重40% | 体验指标30% | 商业指标30%异常波动阈值:单项指标周环比变化>15%触发告警  #牛客激励计划#  #产品经理#  #Ai产品经理#  #研发#  #面试#  #百度求职进展汇总#  #AI# #牛客AI配图神器#
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务