字节跳动豆包大模型 Foundation 团队热招中!
社招、TopSeed 校招、实习岗位均有开放,期待你的加入!
【我们是谁】
豆包大模型 Foundation 团队负责大模型的工程架构、模型结构设计、代码生成等方面工作。
工程架构工作包括大规模分布式训练、高性能推理、结合新硬件的工程架构;
模型结构设计聚焦以更低成本训练更高效模型,工作内容包括:MoE 等稀疏模型研究、更高效 Attention 结构、与工程配合的联合优化;
代码生成主要负责从预训练到RL对大模型代码效果进行优化
【课题方向】
📚设计高效率的大模型结构,用最少的训练、推理成本,获得更好的效果
📚研究超大规模训练集群,如何让训练的稳定性和 MFU 提升,跨集群训练
📚研究如何解决推理的访存 bound ,多机推理,各种不同的推理并行方案
📚结合下一代计算体系,研究更先进的模型结构、训练模式、推理模式
📚研究大模型中 foundation 的算法问题,找寻算法创新
【加入我们,你将获得】
充足的算力与数据资源交持,为你的研究提供坚实基础
鼓励创新与自由探素的氛围,让你保持开放思维,专注研究
与优秀的科学家和工程师共事,在平等交流中激发创造
【工作地点】
北京、上海、杭州、深圳
登录字节跳动校招/社招官网,搜索心仪岗位名称,即刻解锁投递! 填写内推码「5CRTJ9Z」,你的简历将被优先筛选!
加入我们,和优秀的人,做有挑战的事
一起探索 AI 未来!
#字节跳动##豆包大模型##招聘#