获赞
56
粉丝
17
关注
9
看过 TA
671
哈尔滨理工大学
2023
Java
IP属地:陕西
暂未填写个人简介
私信
关注
Base西安。深圳均有。  欢迎投递私聊简历给我~~岗位一:岗位要求:1. 熟悉 C/C++/Python 中的任意一种,对 Golang/Rust 有所研究的更好;2. 熟悉 Linux 的基本操作、原理,掌握分析、调优工具;3. 熟悉物理服务器的 BMC、BIOS、ipmi等工作原理,能够针对裸金属场景进行场景分析和设计;4. 熟悉物理服务器装机原理,例如 pxe、tftp、cloudinit等初始化过程;4. 熟悉云计算关键系统硬件架构和工作原理,包括:计算(CPU、GPU、NPU、ARM等)、智能网卡、存储、RDMA等;5. 有 OpenStack(nova、ironic)、Docker、libvirt/QEMU/KVM、虚拟化技术等相关开源软件经验者优先;6. 通过腾讯云技术认证或同等资格认证的优先录取。工作内容:1. 开发和维护腾讯云黑石裸金属服务器后台管理 /调度系统(类似于 OpenStack );2. 开发和维护数十万裸金属智能网卡管理、故障迁移等系统;3. 设计和开发弹性云盘网卡的黑石裸金属服务器系统,提供更灵活的算力服务;4. 设计与开发BMC、BIOS等功能我们的目标:创新设计与开发下一代 Iaas 核心技术,通过软硬件协同实现下一代的安全的裸金属物理服务器,存储、网络设备。将虚拟化、存储、网络虚拟化技术offload到硬件,实现性能大幅提升,与硬件的弹性能力。岗位二:岗位职责:1. 负责Pytorch、Tensorflow等深度学习框架在GPU服务器上的适配和性能优化工作;2. 负责主流AI模型在大规模分布式训练(GPU+RDMA)集群上适配和性能优化工作;3. 负责底层通信协议库在集群中的性能优化工作;4. 能够对AI行业趋势进行探索、技术发展分析,为产品制订业务规划;5. 结合自研AI芯片,探索分布式训练方案,以及深度学习框架性能优化;岗位要求:1. 人工智能、计算机、数学等相关专业;2. 5年以上 AI 研发或项目经验,有云计算领域相关经验优先;3. 精通C++、Python等开发语言,熟练掌握Linux软件开发技术优先;4. 熟悉深度学习框架(Pytorch/Tensorflow等),熟悉各组件和类库、常见AI模型优先;5. 熟悉行业内AI平台实现方案,熟悉行业内AI平台产品特点,有AI研发经验者优先;6. 熟悉业界流行的GPU虚拟化技术,对Nvidia/AMD/Intel等GPU技术有较深理解的优先;7. 对GPU,RDMA,MPI,GPU Direct 等技术有了解和使用经验优先;8. 有一定的管理能力,具备丰富的产品规划和设计经验,对AI及行业有前瞻性战略思考;9. 清晰的逻辑分析和表达能力,乐观积极,具有较强的责任心和执行力。
投递腾讯云智研发等公司10个岗位
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务