税友集团一面上来一道 easy 题介绍项目有个很值得探讨的问题，如何评估一_牛客网

重庆范冰冰

09-25 12:19 南京航空航天大学算法工程师发布于江苏

关注

税友集团一面
上来一道 easy 题
介绍项目
有个很值得探讨的问题，如何评估一个模型评分可不可靠
我的做法是生成的文本送给 gpt4去评分，

但是面试官说怎么证明 gpt4就是对的，他分享了下他的思路，应该让人类先对这样的回复进行评分，给定一个标准然后再给看gpt 的打分是否和人类一致

我反问那如果人类的打分水平参差不齐呢

“这样的话就规定一群人投票表决什么样的评分是好的”

我说那这样的话不是很消耗人力成本

“但是你只需要标定一次如果结果和预期符合，就说明这个模型可信”

我说那如果换一个场景，这就要重新再做一次

“理论上每个场景都要这样做”

我说那如果假设打分的人类服从高斯分布中间的人肯定占的分布比较多，假设 gpt4是最右边高质量的分布，怎么能证明中间分布的人的打分，就一定比 gpt4好呢

“如果是这样就需要分别针对什么样的人群去设置一个打分如果你想卖给中间人群，就找一个中间的人群的水平打分”

大模型是不是真的能够理解人类的指令 🤔

全部评论

推荐最新楼层

喜欢走神的莲雾在做测评

清华大学 Java

佬是线下手撕吗

点赞回复分享

发布于 10-14 12:52 浙江

11-06 10:59

莆田学院产品经理

哇嘶嗒科技产品经理面试 11.5面

1、自我介绍2、XX项目里面用到的大模型是哪个？3、介绍下XXX项目的背景4、简单说下之前的经历当中你觉得最有亮点的5、你有什么要问我的？

查看5道真题和解析非技术面试记录

点赞评论收藏

分享

11-16 09:42

门头沟学院运营

#你都收到了哪些公司的感谢信？# 😭

你都收到了哪些公司的感谢信？

点赞评论收藏

分享

11-05 16:35

复旦大学产品专员

知乎产品岗实习体验

园区是老厂房改造的，整体不大，但有种赛博朋克的感觉，三层的小洋房还带阳台，风景还可以。我在增长部做产品，工作内容有点单调不过，接触到SQL和数据分析的机会也让我学到了不少东西。公司包两餐，可以在企业微信上点自己喜欢的，到了时间去取就行。周五的自助餐特别丰盛，楼下的咖啡机还有半价的星巴克。整体氛围轻松，人际关系简单，开会也很务实。总的来说，我还是挺满意的

知乎公司氛围 43人发布

点赞评论收藏

分享

11-19 11:46

已编辑

湖南工商大学管理培训生

#找工作，你会甘心进小厂还是猛冲大厂# #美团求职进展汇总# 双非面大厂进了一面表现感觉还不错最后说要全国调动我说不太能接受然后就g了但是感谢团子的大家秋招进展如何？

找工作，你会甘心进小厂还是猛冲大厂美团求职进展汇总

点赞评论收藏

分享

10-31 19:10

University of Wollongong 服装/纺织设计

新华三有人一面了吗，都问了些什么呀?

点赞评论收藏

分享

2 2 评论

全站热榜

正在热议

# 25届秋招总结 #

296423次浏览 2605人参与

# 美团求职进展汇总 #

1326012次浏览 12438人参与

# 阿里云管培生offer #

16067次浏览 291人参与

# 地方国企笔面经互助 #

3684次浏览 8人参与

# 如果不工作真的会快乐吗 #

58642次浏览 508人参与

# 选完offer后，你后悔学本专业吗 #

19334次浏览 140人参与

# 百度开奖 #

159299次浏览 955人参与

# 国央企薪资爆料 #

7449次浏览 55人参与

# 学历or实习经历，哪个更重要 #

50505次浏览 398人参与

# 海康威视求职进展汇总 #

398458次浏览 3405人参与

# 正在实习的你，几点下班 #

51364次浏览 382人参与

# 米哈游求职进展汇总 #

175642次浏览 1456人参与

# 投递实习岗位前的准备 #

1178589次浏览 18387人参与

# 面试体验感最好的是哪家？ #

84940次浏览 844人参与

# 如何一边实习一边秋招 #

991180次浏览 12632人参与

# 得物求职进展汇总 #

66071次浏览 680人参与

# 实习生应该准时下班吗 #

167305次浏览 1159人参与

# 求职遇到的搞笑事件 #

70531次浏览 575人参与

# 网申一定要掌握的小技巧 #

5295次浏览 52人参与

# 0offer是寒冬太冷还是我太菜 #

897331次浏览 8005人参与

# 腾讯求职进展汇总 #

195502次浏览 1639人参与

# 提前批简历挂麻了怎么办 #

146238次浏览 1944人参与

牛客网
牛客企业服务