烤点老白薯

06-06 10:40 已编辑京东_零售_拣货员(实习员工)

关注

如何对大模型的业务进行测试？

昨天面试遇到了这个问题，对这个有些疑问

我的回答是：

1.提供不同的提示词，查看返回结果的质量，与正确答案的差异

2.查看返回的响应速度

3.提供一些涉及隐私安全的、不适合的提示词，查看是否会被拒绝回答

面试官不是很满意，说我这些偏向于应用层面

刚刚查阅了一下：

可以数据收集、数据预处理、模型训练、模型验证、模型评估这样的普适方法

评价指标有F1（精确率和召回率的调和平均值）、RougeL（生成摘要和基准摘要的最长公共子序列）、sacreBLEU（生成文本与参考文本在不同长度的N元组的匹配情况）

有兄弟做实际的相关业务吗，这个问题应该怎么回答呢？求解

6.6号更新：

1.使用一些通用的数据集对模型效果进行评测（GLUE、superGLUE）

2.使用不同的任务进行评测，数学题，编程题，阅读理解，自然知识，科学知识，文本生成，翻译等

3.鲁棒性测试，提示词中间存在拼写错误，错别字，模糊提示等

4.不同的硬件资源对响应进行测试（类似对接口进行性能测试）

5.模拟实际用户使用场景进行提示，并收集用户反馈

#牛客解忧铺##牛客在线求职答疑中心##我的实习求职记录##帮帮团#

全部评论

推荐最新楼层

北海勇将王冲

中国银行_运钞员(准入职员工)

码住

点赞回复分享

发布于 05-24 13:53 北京

求求给我一个offer8

北京邮电大学 Java

我也被问过如何进行模型评估，我答了评价指标

点赞回复分享

发布于 05-24 14:50 北京

上海精神病人

蔚来_测(准入职员工)

根据指标调参，反转了算法就是测试，测试就是算法

点赞回复分享

发布于 05-24 16:49 上海

在努力的小牛

北京邮电大学 Java

哥，我看你面了一个春天了，咋还没找到实习。我找实习之前就看你了，找实习还看你在面，我都快实习一个月了打开牛客看你还在面！

点赞回复分享

发布于 06-07 15:26 山西

11-08 20:59

厦门大学产品经理

25秋招选意向，听劝

佬们 想问下建议 都在意向池中泡着ing 百度-地图出行服务部-策略产品； 鹅厂-s3职能线-招聘系统产品； 科大讯飞-星火军团-b端大模型用产品 华为-终端bg-消费者服务管理培训生

投递腾讯等公司10个岗位 > 你的秋招进展怎么样了如果可以选，你最想去哪家公司

点赞评论收藏

10-30 12:33

去哪儿_测试开发(准入职员工)

优必选测试面经：一面+二面

一面 10.23  30min1. 为什么离职读研，为什么不留转正2. 讲一下你实习的完整测试流程，有什么印象深刻的bug3. 你说的这个辅助脚本怎么写的4. UI自动化怎么做的，代码走查呢5. 让你设计测试大模型方案怎么设计，职业规划是怎么想的二面 10.29  35min1. 聊聊你的工作的经历，为什么要离职2. 你的职业规划是怎么样的，为什么往业务方面发展3. 开发和业务关系也很紧凑，为什么不选择开发选择测试呢4. 你对未来发展的需求，业务方面呢，具体一点(前沿技术)5. 还有对公司有什么需求(团队、氛围，提升)6. 反问资深测试的素养，反问业务总的来说体验还可以，就是感觉他家流程怪怪的，是所有人都会面完最后泡池子吗

查看11道真题和解析

点赞评论收藏

不愿透露姓名的神秘牛友

11-12 08:53

西安昆仑工业offer

晒一晒我的offer

点赞评论收藏

10-29 13:31

University of York Java

南瑞信通哪个部门部门好一点？

投票

💼公司岗位🫶️团队氛围💢工作强度 #我的岗位说明书#  #安利/避雷我的岗位#  #如果可以选，你最想去哪家公司#  #南瑞#

南瑞集团工作强度 52人发布

投递南瑞集团等公司10个岗位我的岗位说明书

点赞评论收藏

11-10 22:18

华南理工大学 Java

南瑞信通的offer突然降临！

之前我投递了软件开发岗，面试通过钉钉线上会议进行，十几分钟就结束了，似乎只问了些实习和项目经历，心里没抱太大希望。结果今天收到南瑞的录用通知，真是太开心了！期待下周的线上沟通会议，准备好材料，准备迎接新的挑战！

牛客创作赏金赛

点赞评论收藏

8 30 评论

招聘动态

字节跳动

2025校园招聘

阿里云管培生

2025届校园招聘

快手Star

2025届招聘

快手

销售类投递专区

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #

# 如果有时光机，你最想去到哪个年纪？ #