税友集团一面上来一道 easy 题介绍项目有个很值得探讨的问题，如何评估一_牛客网

重庆范冰冰

09-25 12:19 南京航空航天大学算法工程师发布于江苏

关注

税友集团一面
上来一道 easy 题
介绍项目
有个很值得探讨的问题，如何评估一个模型评分可不可靠
我的做法是生成的文本送给 gpt4去评分，

但是面试官说怎么证明 gpt4就是对的，他分享了下他的思路，应该让人类先对这样的回复进行评分，给定一个标准然后再给看gpt 的打分是否和人类一致

我反问那如果人类的打分水平参差不齐呢

“这样的话就规定一群人投票表决什么样的评分是好的”

我说那这样的话不是很消耗人力成本

“但是你只需要标定一次如果结果和预期符合，就说明这个模型可信”

我说那如果换一个场景，这就要重新再做一次

“理论上每个场景都要这样做”

我说那如果假设打分的人类服从高斯分布中间的人肯定占的分布比较多，假设 gpt4是最右边高质量的分布，怎么能证明中间分布的人的打分，就一定比 gpt4好呢

“如果是这样就需要分别针对什么样的人群去设置一个打分如果你想卖给中间人群，就找一个中间的人群的水平打分”

大模型是不是真的能够理解人类的指令 🤔

全部评论

推荐最新楼层

喜欢走神的莲雾在做测评

清华大学 Java

佬是线下手撕吗

点赞回复分享

发布于 10-14 12:52 浙江

11-06 10:59

莆田学院产品经理

哇嘶嗒科技产品经理面试 11.5面

1、自我介绍2、XX项目里面用到的大模型是哪个？3、介绍下XXX项目的背景4、简单说下之前的经历当中你觉得最有亮点的5、你有什么要问我的？

查看5道真题和解析非技术面试记录

点赞评论收藏

分享

11-19 11:46

已编辑

湖南工商大学管理培训生

#找工作，你会甘心进小厂还是猛冲大厂# #美团求职进展汇总# 双非面大厂进了一面表现感觉还不错最后说要全国调动我说不太能接受然后就g了但是感谢团子的大家秋招进展如何？

找工作，你会甘心进小厂还是猛冲大厂美团求职进展汇总

点赞评论收藏

分享

11-05 16:35

复旦大学产品专员

知乎产品岗实习体验

园区是老厂房改造的，整体不大，但有种赛博朋克的感觉，三层的小洋房还带阳台，风景还可以。我在增长部做产品，工作内容有点单调不过，接触到SQL和数据分析的机会也让我学到了不少东西。公司包两餐，可以在企业微信上点自己喜欢的，到了时间去取就行。周五的自助餐特别丰盛，楼下的咖啡机还有半价的星巴克。整体氛围轻松，人际关系简单，开会也很务实。总的来说，我还是挺满意的

知乎公司氛围 43人发布

点赞评论收藏

分享

11-19 22:31

博尔塔拉职业技术学院 Java

海颐软件感谢信

#你都收到了哪些公司的感谢信？# 自己问题😂

你都收到了哪些公司的感谢信？

点赞评论收藏

分享

10-31 18:46

已编辑

广东碧桂园学校 C++

佑驾创新的面试

在网上基本上看不到他家的面经，想问一下各面过的佬他家C++开发岗主要问什么更新：面完了，两个面试官一起面的，没开摄像头。面试官人很好，问的问题会引导，会肯定你的回答，就是问的比较偏门，是对几个C++的点一直问，到你说不知道为止，另外还问了Linux的一些操作，项目一句没问。反问说二面会问项目，内部很多部门都在招C++，就怕这个时候的面试是KPI面

改名拿offerrrrr：好不容易面完了，他要最少实习3个月。麻了

面试中，你被问过哪些奇葩问题？

点赞评论收藏

分享

2 2 评论

全站热榜

正在热议

# 晒一晒我的offer #

9701092次浏览 104808人参与

# 机械只有读研才有出路吗？ #

7847次浏览 103人参与

# 北方华创开奖 #

20955次浏览 243人参与

# 地方国企笔面经互助 #

1858次浏览 6人参与

# 滴滴求职进展汇总 #

78568次浏览 687人参与

# 考研失败就一定是坏事吗？ #

36196次浏览 355人参与

# 机械人，签完三方你在忙什么？ #

22900次浏览 119人参与

# 总结:哪家公司面试体验感最差 #

23268次浏览 115人参与

# 机械应届生薪资要多少才合适？ #

11652次浏览 54人参与

# 学历or实习经历，哪个更重要 #

39007次浏览 280人参与

# 选完offer后，你后悔学本专业吗 #

6359次浏览 43人参与

# 查收我的offer竞争力报告 #

12989次浏览 190人参与

# 机械人怎么评价今年的比亚迪 #

40812次浏览 141人参与

# 应届生被毁约被毁意向了怎么办 #

23841次浏览 228人参与

# 00后45度躺现状 #

33034次浏览 294人参与

# 没有合适的工作，你会先找个干着，还是考公考研 #

35238次浏览 392人参与

# 秋招OC许愿 #

223758次浏览 1852人参与

# 如果能重来，就业or读研你选哪个？ #

45176次浏览 332人参与

# 大疆求职进展汇总 #

402486次浏览 2868人参与

# 实习，投递多份简历没人回复怎么办 #

2380755次浏览 34157人参与

# 双非能在秋招上岸吗？ #

98479次浏览 767人参与

牛客网
牛客企业服务