获赞
1
粉丝
8
关注
4
看过 TA
35
北京航空航天大学
2016
C++
IP属地:上海
百度内推
私信
关注
基础平台研发工程师(2025校招)(北京/上海)【工作职责】基础平台,是为百度基础设施和各大业务提供运维能力的平台,是百度集团业务和百度云服务稳定、高效运行的基石,是持续推动运维体系自动化和智能化的核心平台。包括以下方向:1. 建设百度流量接入系统,参与百度 BFE(CNCF开源项目)、流量调度、高性能网络库系统的设计与开发,为百度的各项业务提供一个安全、可靠和高性能的接入网络2. 构建百度智能监控产品,参与智能监控系统(数据采集、计算、存储、分布式追踪、日志分析等)和智能运维系统(异常检测、根因定位、故障预测等)的设计和研发3. 建设百度统一的软硬件环境运维管理系统,持续推进基础设施管理的自动化和智能化,为业务提供稳定高效的核心基础服务4.  建设大模型时代的智能运维系统,参与运维智能体、运维领域模型、RAG等设计研发,构建基于LLM的服务生命周期管理系统,为百度在线服务保驾护航5. 建设大模型底座的智能诊断系统,设计和研发针对大模型和GPU的分析工具,提升大模型基础设施的可用性【岗位要求】1. 具备强烈的上进心和求知欲以及良好的沟通能力和团队合作精神,善于分析/解决问题,勇于挑战各类技术难题。2. 对系统架构、分布式系统有浓厚兴趣,热衷于追求技术极致与创新。3. 了解Linux/Unix操作系统原理、网络原理,熟练运用系统层支持应用开发。4. 深刻理解数据结构和算法设计,掌握至少一门编程语言,包括但不限于Go、Java、C/C++、Python、Rust等5. 熟悉云计算、云原生、可观测、大数据相关项目和组件经验的优先;有过大模型应用开发,熟悉人工智能算法的优先该岗位内推请直接私信。其他岗位内推码:IZBPK9
投递百度等公司10个岗位 互联网职场交流
0 点赞 评论 收藏
分享
提前批,免笔试运维平台研发工程师(北京/上海 )岗位职责:* 负责智能运维相关产品的架构设计、核心功能研发及技术优化(预案管理、变更管理、容量管理、成本经营分析)* 参与大语言模型在运维领域落地的相关研发工作,支持智能运维客服、智能故障诊断等产品落地* 参与大语言模型微调、推理服务建设相关工作,探索构建公域及私域数据相结合的运维模型* 持续学习和调研先进大模型应用技术和行业动态,关注竞品发展岗位要求:* 本科及以上学历,有一定程度的计算机相关专业知识背景* 优秀的编码能力,熟悉Golang/Python至少一项,有扎实的算法及数据结构基础,有良好的编程习惯。* 熟悉Vue/React等一种前端JS框架,对其源码有一定研究* 熟悉kubernetes基本工作原理,对Langchain或其他大语言模型应用开发框架有一定理解者优先,有机器学习实践经验者优先* 优秀的团队协作能力;具备较强的ownership,以结果为导向,善于思考并积极改进SRE工程师(业务运维)(北京)岗位职责:* Site Reliability Engineer,负责百度公司大规模分布式系统及各类在线服务可靠、稳定、高效运行* 参与在线系统和各类产品架构设计,主导服务可靠性相关自动化系统的实现,满足严格的质量与效率要求* 设计研发服务运维解决方案,包括持续交付、容量管理、弹性计算、故障分析、流量分配、性能调优等* 关注业界前沿技术动态,负责大规模流量接入系统的优化,演进和新接入技术探索和应用* 使用AI技术解决超大规模互联网应用运维问题岗位要求:* 深入理解Linux操作系统;具备较好的计算机网络和体系结构基础* 熟练掌握C/C++/Python/Go/Shell等至少一种主流编程语言* 良好的逻辑思维和分析能力,热衷于解决问题、追求极致* 强烈的责任心、进取心、团队合作精神和Ownership* 专业不限,但更倾向于计算机、通信、数学等理工学科的应届毕业生* 有大规模分布式程序设计开发经验优先SRE工程师(AI大模型运维)(北京)岗位职责:* 负责大模型平台的基础设施(GPU/高性能网络等)的稳定性保障,并提升模型训练效率和效果;* 负责模型训练过程中的硬件、算法、框架等故障定位,并推动对应大模型运维能力平台产品化建设;* 负责大模型训练任务、基础设施的运维监控数据建设,建设产品可用性大盘;* 关注业界动态,使用AI技术解决大模型稳定性问题,提升稳定性及训练过程高可用;岗位要求:* 了解大模型训练模式,了解ChatGPT/LLaMA等LLM语言模型,了解paddlepaddle/pyorch/tensorflow等一种训练框架;* 了解GPU架构、cuda编程基础、大模型常用的并行策略和集合通信场景;* 熟练掌握Python/Golang/Shell等至少一种主流编程语言* 具有良好的逻辑思维和分析能力,热衷解决问题、追求极致;具有强烈的责任心、进取心、Ownership;* 有K8S云原生平台的相关系统运维开发和稳定性建设经验者优先,有云产品/平台使用经验者优先;SRE工程师(智能云运维)(北京)岗位职责:* Site Reliability Engineer,负责百度公司大规模分布式系统及各类云服务可靠、稳定、高效运行* 参与百度智能云系统和各类产品架构设计,主导服务可用性相关平台/自动化系统的实现* 设计研发智能云规模化运维的技术解决方案,包括服务器生命周期管理、高效交付、故障预测、成本管理等* 关注业界前沿技术动态,熟悉os/kernel、openstack、kvm、分布式存储、虚拟化网络等相关技术,贡献与引领业界技术趋势岗位要求:* 深入理解Linux操作系统;具备较好的计算机网络和体系结构基础* 熟练掌握Python/Go/Shell等至少一种主流编程语言* 对云计算、虚拟机等技术有浓厚的兴趣优先,了解OpenStack、虚拟化网络、KVM、分布式存储等相关技术* 具有良好的逻辑思维和分析能力,热衷解决问题、追求极致;具有强烈的责任心、进取心、Ownership;* 专业不限,但更倾向于计算机、通信、数学等理工学科的应届毕业生内推二维码如下:
投递百度等公司10个岗位 运维求职圈
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务