算法实习生-北京/南京
进行多模态vision language learning, 知识蒸馏distillation, 扩散生成diffusion model, 模型压缩和加速quantization,通用模型vison transformer在计算机视觉任务上的科研或业务探索。
职位方向简介:
1、图像处理:负责计算机视觉前沿学术论文复现及codebase搭建,在baseline基础上对已有方法做改进,研究内容整理及论文撰写等工作;
2、图像降噪:熟悉计算机视觉领域的知识,熟悉深度学习相关知识,有降噪或者超分项目经验;熟练使用python,有较强工程能力;熟悉主流的深度学习框架;
3、通用识别:熟悉计算机视觉领域知识,了解GNN,diffusion model,跨模态检索;有clip,owlvit,delta tuning等跨模态相关工作者优先;
4、通用目标检测: 2D检测研究方向:通用目标检测,知识蒸馏等方向研究or落地;3D检测研究方向:多模态融合,camera-only3D感知等方向研究or落地;
5、模型压缩与加速:熟悉计算机视觉相关领域的知识, 熟悉深度学习, 要求熟悉transformer结构或自监督学习;有扎实的数理基础和英文论文撰写能力,发表过论文者优先。
6、文生图,文生视频科研,vision language learning多模态科研。
1、扎实的数学基础;
2、基本的编程能力:熟悉C++/C或Python;
3、充满技术热情,有较强的自驱力和学习能力;
4、加分项:熟悉机器学习或计算机视觉领域的最新研究成果和相关的开源系统;
5、加分项:熟悉Pytorch/TensorFlow/天元MegEngine等开源深度学习框架;
6、加分项:系统的科研经历,有领域内顶级会议论文发表,有过数学/物理等竞赛经历;
7、实习时长至少3个月,6个月及以上优先。