🚀【AI界的新星】DeepSeek:一鸣惊人的背后故事
🔍 在AI领域,DeepSeek的名字如同一颗耀眼的新星,自发布以来便引起广泛关注。但你是否好奇,这个团队成功的秘诀是什么?让我们一起揭开DeepSeek背后的故事。
年轻化的研发团队
一、应届在读生的活力注入
DeepSeek团队的一大特色就是年轻。在这个团队中,应届生和在读生占据了相当大的比例。他们思维敏捷、充满活力,对新技术有着敏锐的洞察力和强烈的探索欲望,为DeepSeek的发展注入了源源不断的动力和创新活力。
二、清北应届生的关键贡献
在DeepSeek团队中,来自清华大学和北京大学的应届生尤其突出。他们不仅在学术上有着扎实的功底,而且在实际工作中也展现出了卓越的能力。这些清北应届生的加入,为DeepSeek带来了许多关键的技术创新和项目成果。
技术创新与突破
一、GRPO算法的突破
DeepSeek的突破之一,是通过名为GRPO的算法,创新训练方法,大大降低了成本。这一成果离不开团队成员曾旺丁的研究和开发工作,他的贡献为DeepSeek-Math项目和整个强化学习领域的发展带来了新突破。
二、MLA架构的创新
北京大学的高华佐是MLA架构的关键创新者之一。他的创新思维和严谨态度,为DeepSeek的技术进步提供了有力的支持。此外,他的名字也出现在“大模型创业六小强”之一的阶跃星辰的专利信息中,显示了他在AI领域的影响力和活跃度。
人才济济的团队
一、罗福莉:算法创新的领军者
出生于四川的95后罗福莉,从北京师范大学计算机专业本科毕业后,又在北大计算语言学专业深造。这位才华横溢的学者在2019年国际顶级会议ACL上发表8篇论文,其中2篇为第一作者。她的职业生涯始于阿里巴巴达摩院,主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。2022年,罗福莉加入DeepSeek,参与了MoE大模型DeepSeek-V2的研发。2024年,她被传闻将以千万年薪加入小米,担任AI实验室大模型团队负责人。12月31日,罗福莉的高中班主任告诉红星新闻记者,罗福莉还没决定去小米,还在考虑。
二、高华佐:MLA架构的幕后推手
低调的北大物理系毕业生高华佐,在DeepSeek团队中凭借扎实的物理基础和对AI技术的深刻理解,为MLA架构的提出和发展做出了重要贡献。他的创新思维和严谨态度,为DeepSeek的技术进步提供了有力支持。在“大模型创业六小强”之一阶跃星辰的专利信息中也能看到他的名字,虽然暂不确定是否是同一人,但从侧面显示出他在AI领域的影响力。
三、曾旺丁:强化学习的突破者
北邮人工智能与网络搜索教研中心主任张洪刚的得意门生曾旺丁,主导了GRPO算法的研究和开发工作。他深入分析了强化学习中的关键问题和难点,提出了GRPO算法,为DeepSeek-Math项目和整个强化学习领域的发展做出了突出贡献。
四、邵智宏:AI系统构建的探索者
清华交互式人工智能课题组的博士生邵智宏,研究领域包括自然语言处理、深度学习等。他在DeepSeek团队中参与了多个项目,为公司在自然语言处理和AI系统构建方面的发展做出了重要贡献。他的研究成果在国际顶级会议上多次亮相,并在微软研究院积累了丰富的研究和实践经验。
五、朱琪豪:深度代码学习的先锋
北大的朱琪豪校友,研究方向为深度代码学习技术。他在国际顶级会议上发表了16篇CCF-A类论文,并凭借基于语法制导的程序修复技术获得ESEC/FSE 2021杰出论文提名奖。他主导开发的DeepSeek-Coder-V1达到国际领先水平,广泛应用于反编译、代码分析、代码修复等领域。
六、代达劢与王炳宣:DeepSeek的元老级成员
北大的代达劢和王炳宣,从DeepSeek-V1开始就加入了团队。他们参与了DeepSeek LLM v1到v3的一系列重要工作,为DeepSeek的发展贡献了自己的力量。
七、梁文锋:AI领域的梦想家
出生于广东的梁文锋,从小就成绩优异。他在浙江大学电子信息工程专业本科毕业后,继续攻读信息与通信工程专业研究生。2015年,他与同学共同创立了量化对冲基金公司幻方量化,几年时间管理规模迅速超百亿。2023年,他正式进军通用人工智能领域,创立了DeepSeek,并发布了DeepSeek-V2开源MoE模型,引发了大模型“价格战”。
DeepSeek团队的成功,不仅为公司带来了巨大的价值和声誉,也为整个AI行业提供了宝贵的经验和启示。年轻化的团队结构、技术创新的突破,以及人才的济济一堂,都为AI行业的发展注入了新的活力和希望。