岗位职责
内容理解方向:
1、负责多模态内容理解、图像理解以及NLP相关的工作,应用图像和NLP技术,提升发布侧基础工具效果和体验;
2、负责包括但不限于大规模预训练模型、数据挖掘,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取业务线上收益;
3、紧密关注相关领域业界的最新进展,并负责在发布&增长等业务的落地应用。
生成方向:
1、负责多模态生成/GAN等图像生成相关算法研发与优化, 跟进计算机视觉领域的前沿技术研究;
2、参与技术规划制定, 把握图像生成技术最新发展趋势;
3、推动技术在特效/素材生成/辅助设计等领域的应用。
基础视觉方向
1、参与计算机视觉(检测、分割、人脸、人体)的前沿技术的研究和落地;
2、为小红书发布侧提供基础视觉算法能力,为更多的模版服务,提升UGC使用体验。
AIGC方向:
1、参与计算机视觉、自然语言处理、多模态等领域的前沿技术研究;
2、利用前沿AIGC算法,打造业内领先的多媒体内容理解和生成能力。
岗位要求
1、本科及以上学历,计算机等相关专业优先;
2、熟练掌握TensorFlow/PyTorch/Caffe/ MXNet等深度学习框架中的至少一种;
3、具备优秀的编程能力和经验,熟悉Python、C/C++、Java等编程语言,对数据结构和算法设计有较为深刻的理解;
4、优秀的分析和解决问题能力,对新技术充满好奇,敢于挑战高难度,善于提出解决方案并快速验证;
5、了解DiscoDiffusion、DALLE、StableDiffusion、chatGPT等前沿技术;
6、关注多模态与文本生成领域的业界最新动态,如Midjourney、Runway、chatGPT等;
7、具备优秀的研究和创新能力,在CVPR/ICCV/ECCV/NIPS/ICML/SIGGRAPH/ACL/EMNLP等会议上发表过论文者和参加过ACM竞赛者优先。