烤点老白薯

06-06 10:40 已编辑京东_零售_拣货员(实习员工)

关注

如何对大模型的业务进行测试？

昨天面试遇到了这个问题，对这个有些疑问

我的回答是：

1.提供不同的提示词，查看返回结果的质量，与正确答案的差异

2.查看返回的响应速度

3.提供一些涉及隐私安全的、不适合的提示词，查看是否会被拒绝回答

面试官不是很满意，说我这些偏向于应用层面

刚刚查阅了一下：

可以数据收集、数据预处理、模型训练、模型验证、模型评估这样的普适方法

评价指标有F1（精确率和召回率的调和平均值）、RougeL（生成摘要和基准摘要的最长公共子序列）、sacreBLEU（生成文本与参考文本在不同长度的N元组的匹配情况）

有兄弟做实际的相关业务吗，这个问题应该怎么回答呢？求解

6.6号更新：

1.使用一些通用的数据集对模型效果进行评测（GLUE、superGLUE）

2.使用不同的任务进行评测，数学题，编程题，阅读理解，自然知识，科学知识，文本生成，翻译等

3.鲁棒性测试，提示词中间存在拼写错误，错别字，模糊提示等

4.不同的硬件资源对响应进行测试（类似对接口进行性能测试）

5.模拟实际用户使用场景进行提示，并收集用户反馈

#牛客解忧铺##牛客在线求职答疑中心##我的实习求职记录##帮帮团#

全部评论

推荐最新楼层

北海勇将王冲

中国银行_运钞员(准入职员工)

码住

点赞回复分享

发布于 05-24 13:53 北京

求求给我一个offer8

北京邮电大学 Java

我也被问过如何进行模型评估，我答了评价指标

点赞回复分享

发布于 05-24 14:50 北京

上海精神病人

蔚来_测(准入职员工)

根据指标调参，反转了算法就是测试，测试就是算法

点赞回复分享

发布于 05-24 16:49 上海

在努力的小牛

北京邮电大学 Java

哥，我看你面了一个春天了，咋还没找到实习。我找实习之前就看你了，找实习还看你在面，我都快实习一个月了打开牛客看你还在面！

点赞回复分享

发布于 06-07 15:26 山西

10-28 10:31

北京师范大学测试工程师

蔚来测试开发一面

蔚来一面：python中的装饰器c++的内存回收手撕算法：合并两个有序数组，如果输入的是字母，该如何合并linux基本命令，其中如何用命令替换txt文件中的制定命令基本的mysql语句如何编写docker file 说说你对docker的理解大模型的微调、训练线程

查看7道真题和解析

点赞评论收藏

10-30 12:33

去哪儿_测试开发(准入职员工)

优必选测试面经：一面+二面

一面 10.23  30min1. 为什么离职读研，为什么不留转正2. 讲一下你实习的完整测试流程，有什么印象深刻的bug3. 你说的这个辅助脚本怎么写的4. UI自动化怎么做的，代码走查呢5. 让你设计测试大模型方案怎么设计，职业规划是怎么想的二面 10.29  35min1. 聊聊你的工作的经历，为什么要离职2. 你的职业规划是怎么样的，为什么往业务方面发展3. 开发和业务关系也很紧凑，为什么不选择开发选择测试呢4. 你对未来发展的需求，业务方面呢，具体一点(前沿技术)5. 还有对公司有什么需求(团队、氛围，提升)6. 反问资深测试的素养，反问业务总的来说体验还可以，就是感觉他家流程怪怪的，是所有人都会面完最后泡池子吗

查看11道真题和解析

点赞评论收藏

10-28 18:51

华东理工大学 Java

南瑞信通单2硕有签约的吗

国庆前电话说通过了，现在等了一个月官网状态还是面试安排中，是不是等不到吃剩饭了，有没有拿到信通的非本地2硕佬告知下，网上看都9本，2本都签约多少批了

幸运的鲸鱼为你答疑解惑：今天刚打电话，说下周

点赞评论收藏

10-24 16:01

已编辑

南京航空航天大学 Java

字节-安全与风控hr面结束

投票

字节一面感觉答得很好，实习项目拷打回复的比较完整。虽然二面三面磕磕绊绊，感觉没回答好，但最终还是成功挺进hr面了，hr说要等部门内review横向排序，大概一周左右给结果，在这许愿求一波意向吧~主要timeline：10.11 一面，面完俩小时通知二面时间，因为面试官出差二面时间延迟了几天；10.18 二面，过了一个周末后周一早上通知三面；10.22 三面，本来以为要挂了，没想到第二天早上约了hr面；10.23 hr面，告知要内部review一下决定是否录用，说顺利的话一周内会有mentor加微信通知。大佬们知道字节hr面后排序排不出来的可能性高吗？不知道华子啥时候出结果，还想等波华子。。。#牛客解忧铺##字节##字节求职进展汇总##字节跳动工作体验##华为#想知道一下大家目前什么进度，路过的大佬投个票

投递字节跳动等公司10个岗位牛客解忧铺字节求职进展汇总

点赞评论收藏

10-31 19:10

西安电子科技大学算法工程师

offer 二选一科大讯飞 vs 海康

安徽人，都是算法工程师，求大佬们帮忙看看offer科大讯飞目前有意向了 海康在池子躺着。求大佬们帮忙看看哪个合适谢谢大佬们，大佬们offer多多

投递海康威视等公司10个岗位 > 选了这个offer，你有没有后悔？晒一晒我的offer

点赞评论收藏

8 30 评论

招聘动态

字节跳动

2025校园招聘

杉川机器人

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #