商汤研究院招多模态大模型实习生

商汤研究院多模态大模型组招大模型实习生,base上海、北京,400/day。福利:每天50租房补贴,20的餐补。晚上8点之后回去有额外的25元晚餐餐补,10点之后回去可以免费用滴滴。

目前组内的工作重心之一在提升多模态大模型ocr能力(例如图片纯OCR,转markdown,转long caption,图表、表格、富文本图片的分析推理等) 实习生的主要工作为: 1. 构建高质量的ocr数据,做训练集和测试集 2. 验证数据的质量(包括大模型的SFT训练,在测试集上验证性能并迭代数据,刷榜等等) 3. 参与整个数据管线、训练与验证管线的完善工作 欢迎试用我们最近在上海WAIC上发布的多模态大模型: https://chat.sensetime.com

投递要求: 1. coding能力过硬,写代码熟练 2. 了解前沿多模态大模型的进展,对大模型领域有一定了解 3. 有较丰富的大模型项目经历,或有大模型领域的高水平论文发表 4. 熟悉transformers,datasets,deepspeed等大模型常用python库 组内转正难度极低,欢迎对大模型/多模态大模型感兴趣的同学投递简历! 邮箱主题/简历命名格式:实习+多模态大模型+姓名 投递邮箱:jiangtan@sensetime.com 有什么问题也可以回帖问我。

全部评论
你好,25 AI先锋那个有楼主组里开的岗位吗?
点赞 回复 分享
发布于 07-19 21:43 广东
您好,请问实习转正机会大吗
点赞 回复 分享
发布于 08-06 10:23 上海
Garena
校招火热招聘中
官网直投

相关推荐

整体56分钟,算是提前批1.自我介绍2.拷打实习项目,先介绍了一下实习的业务背景,我的是一个智能npc的,我讲了模型训练、数据处理、调优探索几个方面,他问我让模型更加遵循人设是怎么做的、数据分布是怎么调的、评估是怎么做的,然后问我deepspeed原理、vllm原理、kvcache原理3.拷打第一个项目,我的是一个rag的项目,我先整体讲了一下,然后他问我向量模型选的哪个、为什么不选别的、向量数据库选的哪个、还知道哪些、模型幻觉的解决有什么方法、模型长上下文解决的方法,我各答了我的理解4.拷打论文项目,我把我论文讲了一遍,讲的时间有点长,他没问啥问题5.代码题,他临时想出来的,说给定一个json串,写一段代码进行大中小括号、单引号和双引号的匹配检查,我用栈做的,做出来之后其实会在引号那里有bug,但是跑了样例他没看出来;然后问我假如说想做成一个直接把它改成正确的,该怎么做,我说了一下我的理解6.反问,问部门做什么的,说是预研部门,是具身智能的,大小模型协同,应该是类似于agent整体感觉还行,不过这个要求好像很高,估计博士最后能进😂 #牛客创作赏金赛#  #实习,投递多份简历没人回复怎么办#  #找实习多的是你不知道的事#  #24届软开秋招面试经验大赏#  #实习中的菜狗时刻#
点赞 评论 收藏
分享
3 7 评论
分享
牛客网
牛客企业服务