两杯冰可乐

2023-03-05 15:39 百度_B2B_策略工程师

发布于北京

关注

职场成长过程就是ChatGPT的进化过程！！

如果说当前深度学习领域最火的模型有哪些，ChatGPT一定排在前列。从流畅对话到“无所不知”的问答；从学术到商业，无不充斥这ChatGPT的身影。在OpenAI公布相关的API后，其火爆程度更上一层楼，纷纷讨论其带来的影响。

这么爆火的ChatGPT，我们作为技术人员，能够知其应用场景，也应该知其背后训练过程。OpenAI没有公布ChatGPT的训练细节，只有一个官方博客，目前网上讲解ChatGPT的训练，均以InstrctGPT为例进行讲解。这本身没有问题，从官方公布的博客看，也仅是数据和使用的base模型存在一点差异，其他的训练过程是完全类似的。

在学习了训练过程后，感觉应届生进入公司的成长历程，就是ChatGPT的训练过程。从应届生进入公司成长看ChatGPT训练过程。

本文不涉及任何公式推导，只从定性的角度进行类比，旨在理解其大概的想法，细节上不做太多讲解。

每一个毕业生，都是在学校预训练好的“大模型”，见证了许许多多的数据。在本文中，假定有三个毕业生A、B和C。

从官方公布博客看，InstrctGPT和ChatGPT大概经历了三个步骤：1、**微调：**收集一定问题后，人工对齐进行标注书写期望的输出，对GPT3模型微调，得到SFT模型2、**模仿：**基于GPT模型，进行问题和模型输出的收集，人工对输出数据标注顺序，通过监督学习得到RM模型3、**反馈：**以SFT初始化GPT，利用PPO策略对模型进行迭代更新，最终得到终态模型

微调

在刚进入公司的时候，会有各类的文档：编码规范、上线流程、立项说明等等，经过学习入手文档（微调）后，可以应对基础的工作知识了，实现第一步进化（微调）。

相比学校学习的海量知识（数据），在上手工作的时候，接触的文档要少的多；微调，或者说从学校到职场的转变，是必须的过程。在这个过程中，不是从头学习编程能力、沟通能力，仅仅是调整相应的方式以适配工作而已。在ChatGPT或者InstrctGPT的训练过程中，微调也是其训练流程的第一步，不过其输入的带标签数据，是人工生成的。

模仿

在完成初步的学习后，A、B、C对于基本的工作都能够应对：对于老板给定的问题，能够给出反馈。

但B不甘心如此，对于每次老板的问题，给出多个反馈，然后根据老板的反馈，去模仿老板：学习老板的偏好（喜好）——更喜欢简洁的还是长篇大论的答案？还是数据形式还是图文并茂形式？等等喜好。

B通过对老板的反馈进行模仿学习，实现了第二次进化（模仿）——在下次老板给定问题的时候，A和C给出的方案，B能够模仿老板对A和C的方案进行评论（打分—）。

B通过向优秀的人（老板）学习，掌握了新的技能：评判问题方案的好坏，这个能力让B脱颖而出。在ChatGPT和InstrctGPT中，第二步是利用已有的模型，结合人工打分，训练一个RM（Reward Model），专注打分的模型

反馈

C在工作中勤勤恳恳，被老板看在眼里，于是，在B完成第二步进化后，老板说了：B来指导C，提升下C的能力吧。

于是C在第一轮进化的基础上，通过不断的与B交互（将方案给B，B对方案进行评价反馈给C），C的能力不断提升，最终直接实现了究极进化：成了独当一面的人了。

C在与B的交互（C->产出方案->B->给出反馈->C）中，不断提升自己的能力，实现自己的成长。ChatGPT和InstrctGPT的训练过程要更复杂点，有A（SFT模型）约束C（PPO模型），以及考虑了预训练，基本思路是相同的。

经过上面三个步骤，C最终弯道超车，脱颖而出，C位（ChatGPT）出道啦！希望所有的职场打工人，能够像ChatGPT一样，通过学习（训练）最终脱颖而出！

#牛客创作充电计划##职场成长##应届生初入职场，求建议##我的求职思考##职场#

全部评论

推荐最新楼层

北京工业大学 C++

哈哈哈哈，这个比喻很形象

点赞回复分享

发布于 2023-03-07 13:42 山东

西街的故事

南京大学 Java

所以女朋友吵架了怎么办？急，在线等回复

点赞回复分享

发布于 2023-03-07 13:57 江苏

牛客_运营

讲道理来说，讲道理真的可以吗

点赞回复分享

发布于 2023-03-07 14:17 北京

长安大学 Java

职场就是一个学习进化的过程

点赞回复分享

发布于 2023-03-08 09:15 陕西

我自信我怎么了

湖南大学设计

小白成长过程

点赞回复分享

发布于 2023-03-08 09:20 湖南

03-29 20:13

门头沟学院 Java

暑期实习面试顺利结束

记录一下吧，从三月初开始，集中面试也就是两周，后面不打算面了。腾讯IEG运营开发：2.25一面挂腾讯CDG：3.5一面，3.8二面，3.18三面，3.20HR面，3.25offer货拉拉：3.4一面，3.6二面，3.11hr面，3.12oc已拒字节：3.4一面，3.7二面，3.12三面，3.14HR面，3.18oc懂车帝：3.6一面，3.11二面，3.12hr面，3.17 oc已拒淘天业务技术：3.5电话面，3.12二面，3.21三面，3.25hr面，3.28oc 发意向书蚂蚁：3.13一面，3.18二面，3.20三面，3.29才约hr面京东到家：3.6一面，3.12二面，说的通过了，但是一直...

点赞评论收藏

分享

03-26 10:40

米哈游_前端开发工程师

米哈游内推米哈游内推码EIXGN!

🔥内推可以收获什么1.有问题随时私信，不用担心找不到人～ 每天晚上7点后定期回复消息。2.想知道内推进度？公司福利环境？校招培养？只要是你想知道的，我会尽我全力解答。🔥校招QA: https://jobs.mihoyo.com/#/campus/qa🔥 投递直达：https://jobs.mihoyo.com/m/?sharePageId=76622&recommendationCode=EIXGN&isRecommendation=true#/campus/position 社招投递直达：https://jobs.mihoyo.com/m/?sharePageId=81...

米哈游公司福利 2849人发布

点赞评论收藏

分享

02-25 11:19

西南交通大学电路设计工程师

考研失败，这简历能找到工作吗

牛客464620405号：随便投，随便找，中国经过40多年的改革开放，人才缺口和职位空缺是巨大的，中国现在属于遍地黄金的年代，属于90后和00大机遇的时代

点赞评论收藏

分享

02-16 13:52

门头沟学院 Java

不是，这对吗

给🐭🐭个面试机会吧：嘿，mvbatis

点赞评论收藏

分享

03-31 18:36

中国科学技术大学 Java

美团外卖交易暑期面经，两面狠狠拷打三个半小时后OC

timeline 3.21一面 3.25二面 3.31早上发现官网显示回到人才库遂发邮件询问原因，两小时后oc 一面（1h50min） 八股盛宴，至今为止八股最多的一场 闲聊（10min） 随便聊聊，互相自我介绍，为什么不留在字节、是否考博、家在哪、平时怎么学习。 然后开始拷打八股。 八股（1h） java有多少基本类型 String是不是基本类型，保存在哪？数组呢？ 包装类型是什么，和基本类型有什么区别，什么时候用包装类型什么时候用基本类型 介绍一下多态，你怎么理解多态 子类重写父类的方法，返回值能不能不一样？ 比如父类方法返回String，子类重写返回Integer，行不行？ 我们都知道...

美团求职进展汇总

点赞评论收藏

分享

评论

8

收藏

招聘动态

字节跳动-Tik Tok

26届实习招聘

米哈游

2025春季校园招聘

阿里大文娱

25届补录&26届实习

26届实习生双选会报名开启

满帮集团

2025春季校园招聘

联想

25届校招+26届实习

京东JDY实习生计划

火热招聘中

理想汽车

2025春季校园招聘

26届实习求职交流群

快手

25校招&26实习进行中

全站热榜

更多

创作者周榜

更多

正在热议

更多

2294857次浏览 26921人参与

# 机械/制造每日一题 #

53054次浏览 944人参与

# 招行数字金融训练营 #

190699次浏览 556人参与

# 牛友故事会 #

457172次浏览 10830人参与

# 毕业季，你想好怎么跟生活对线了吗？ #

182330次浏览 3396人参与

# 京东工作体验 #

11236次浏览 82人参与

# 腾讯云智研发2025实习生招聘 #

118132次浏览 1401人参与

# 实习必须要去大厂吗？ #

80865次浏览 1217人参与

# 机械人，说说你的烦心事 #

56262次浏览 778人参与

# 职场破防瞬间 #

57865次浏览 717人参与

# 实习学不到东西怎么办？ #

185730次浏览 1988人参与

# 机械人值得去的国央企 #

56311次浏览 401人参与

# 机械人，你被简历秒挂的企业有哪些？ #

32638次浏览 251人参与

# 我想象的实习vs现实的实习 #

266595次浏览 2148人参与

# 硬件人的春招flag #

37955次浏览 403人参与

# 入职第四天，心情怎么样 #

23368次浏览 348人参与

# 虾皮求职进展汇总 #

207051次浏览 1439人参与

# 你今年的平均薪资是多少？ #

103430次浏览 521人参与

# 元戎启行求职进展汇总 #

27668次浏览 207人参与

# 2022毕业生求职现身说法 #

78238次浏览 670人参与

# 牛友们的论文几号送审 #

22720次浏览 581人参与

# 这些公司卡简历很严格 #

23255次浏览 93人参与

牛客网
牛客企业服务