【快手】内容理解算法实习生 -【MMU】

职位:内容理解算法实习生 -【MMU】-快手

【岗位职责】
1、负责快手短视频多模态内容理解工作,应用计算机视觉、NLP等技术,提升短视频推荐、搜索的效果和体验; 2、负责短视频的语义理解、标签识别等工作,基于视频内容和用户行为构建embedding特征,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取业务线上收益,并保持独立创新; 3、负责文本理解、视觉检索、视频生成等工作。

【岗位要求】
1、硕士及以上在校学生,优秀本科生也可; 2、具有良好自然语言处理、计算机视觉、机器学习等方面的技术背景; 3、有视频分类、目标检测、文本视觉相关性、视频生成等项目经验优先; 4、对数据敏感,有较强数据分析和解决问题能力,有较强工程能力者优先; 5、算法类竞赛奖或顶会paper优先; 地点:成都高新区天府三街腾讯大厦B座 工资:350+80(餐补)/天

【实习待遇和要求】
工作城市:成都 | 职位类别:研发
薪资:300-400元/天  |  实习要求:4天/周,3个月以上  |  转正机会:有

投递地址:https://www.nowcoder.com/job/44153?jobIds=38476
我发布的其他职位,点击查看

#实习##快手#
全部评论

相关推荐

1. 介绍一下风格迁移论文做法2. 如何对风格和内容做解纠缠(instantstyle)3. 但是现在都是clip倒数第二层,clip只在倒数第一层做了文图对齐,你会怎么进行解纠缠/对齐(取很多相似的图像做few-shot的IPA平均,这样子当个数够多时候他们的平均就只代表风格,淡化内容;做风格 风格话图像 内容图像三元组显示训练) 现在想想对齐也可以拿QK得到attention map Q是text K是图像现在基于dit的架构很少有这样子的探索,如果是你的话你会怎么做?(现在想想应该采用B-LORA的思路去探索)4. 想要语义风格迁移,比如对应帽子 对应裙子该怎么做?(无他 attention就是语义相似性)5. 风格是怎么定义的?(gram矩阵 均值方差)6. 换另外一个面试官问虚拟试衣的做法,我负责的改进,有没有show case7. 针对复杂背景虚拟试衣怎么做? 你这个项目是最重要上线吗? 现在的inpainting虚拟试衣文本控制能力会很弱,有没有更好的想法让可以做到文本编辑还可以试衣(大意了,应该讲一下cvpr2024谷歌的instructimagen这种工作)8. 文生图可控生成的能力会不会下降,(会有一点,可图做的还是不错的)9. 介绍一下美团做的项目,k-means怎么选质心?为什么不用dbscan或者hdbscan? (我把这个忘了 得想想后面肯定还问)k-means聚类也不见得效果就好10. 生成式检索和判别式的区别11. 怎么之前都在做多模态和agic跑去做nlp了?12. coding: 1262 可被三整除的最大和(我写的只过了样例,唉 这题看答案就很难)13. 能不能提前实习,介绍了一下业务,做ipa插件应用(感觉得补补ipa最近的工作)
查看27道真题和解析
点赞 评论 收藏
分享
多模态 & 大模型 & Agent 正式员工(*3) & 实习生招聘 (*5,实习时间>=3个月)1、团队介绍我们是快手垂搜大模型团队,致力于构建视觉大模型、多模态搜索、User Agent新系统,应用于多种电商场景(如拍照搜同款、图文相似款、电商创意AIGC,买家Agent问答)。团队紧随技术潮流,不断技术/商业创新,期待与优秀的同学一道,进一步扩大影响力。团队一直坚持学术与业务并向发展的方式,目前在CVPR、WWW、AAAI、SIGIR等会议发表论文多篇 (其中一篇Shared Task Best Paper, 一篇Outstanding Paper),并在国内知名赛事与榜单荣获过多项Top2成绩;内部提供充分的交流讨论,现有正式员工与实习同学均来自国内/全球顶尖学校;在这里你会有专业的Mentor实时指导技术创新与业务落地。过去半年团队一共发表论文4篇,AIGC方向专利5项。组内机器资源充足(数百张V100/A100),产研结合,自由度高。组内氛围良好,年轻同学多且有活力,小组内部定期有LOL/桌游/团建旅行。实习表现出色可优先转正及获取SSP Offer。万分期待你的加入!2、实习内容1、多模态视频图文内容理解 (预训练、微调、RLHF、self-prompt技术创新与应用)2、电商多模态信息RAG (商品-商家-用户-平台粒度多维度信息对齐与检索, 跨模态匹配)3、AIGC视觉生成(文生图/视频、精细编辑、多轮交互、训练推理加速、评估标准)4、User Agent设计 (商品知识库信息构建、跨模态实时检索、工具调用与信息分析)5、参与模型蒸馏,量化剪枝,在线实时性部署等工作,支持生成&翻译算法的性能优化与落地;6、针对业务特点,跟踪相关领域的技术发展趋势,进行各类技术方案的探索和学术研究。、当然,研究不限于上述方向,如果您觉得其他方向非常有趣/有价值,也欢迎交流讨论。3、职位要求1、计算机、数学、人工智能或相关专业硕士及博士在读,有扎实的机器学习和NLP算法基础。2、熟悉LLM工程技术和方法,并掌握大模型的微调和评估方法;有参与大模型研发者优先。3、熟悉深度学习框架,如TensorFlow、PyTorch等,有扎实的编程基础和代码实现能力。4、具备优秀的业务感知以及分析和解决问题的能力,良好的沟通协作能力。5、有高水平论文(如ACL、CVPR、NIPS、AAAI、ICML等)或者开源项目者优先。工作地点:杭州 or 北京简历投递:线下私聊
投递快手等公司10个岗位
点赞 评论 收藏
分享
1 1 评论
分享
牛客网
牛客企业服务