岗位职责
1、针对个性化推荐业务场景,设计⾼性能计算体系架构,满足业务的低延迟高吞吐计算需求
2、负责深度学习模型的线上推理性能优化,支撑全场景各种复杂模型的在线推理业务需求
3、负责设计高性能数据结构,支撑海量数据下各种复杂索引结构的低延迟查询
岗位要求
1、五年以上C/C++开发经验,熟悉Linux/Unix开发环境
2、丰富的并行编程开发经验,熟悉CUDA/OpenCL/OpenMP等
3、丰富的数值计算编程经验,熟悉数学库OpenBLAS/MKL/Eigen等
4、熟悉Tensorflow等分布式机器学习算法框架,熟悉TensorRT/TVM/XLA/MLIR等
5、扎实的计算机体系架构基础,掌握Linux下性能剖析和优化工具,掌握编译器,微架构性能优化手段,有硬件虚拟化优化经验者优先
岗位亮点
能接触到个性化推荐和广告最前沿的技术以及海量的数据。