研究实习生(AI安全方向)
薪资面议
硕士
成府路150号智源大厦1层
2024-09-05
什么是官网闪投?
简历直投官网
无需重复填写简历
投后必反馈
进度实时更新
安全可靠官网可查
海量岗位5w+
移动端投递方便
职位描述
针对不同算法和应用场景,建立和完善大模型安全所需的风险识别与治理体系:
1.大模型安全能力提升: 研究和开发大模型安全对齐的算法。例如:基于人类反馈的无害内容输出控制、抵御指令攻击的防御策略,以及确保大模型对齐人类价值观。这些算法旨在确保大模型的有益性和无害性方面进行技术平衡;
2.大模型风险评估: 通过红蓝对抗和自动化工具,建立大模型安全能力的自动化评估体系;
3.长期风险研究: 着手研究因大模型能力快速增强而产生的新型风险。例如:大模型逐渐增强的Planning和Reasoning能力用于复杂系统中的应用、工具调用和决策能力所带来的新型风险。
任职要求
1.硕士及以上学历,专业方向为计算机科学、人工智能或机器学习;
2.具备大模型安全研究经验者优先;有在复杂应用场景中进行风险控制的经验者优先;
3.精通Transformers、DeepSpeed等大模型相关框架,能够对模型进行部署和微调以适应特定任务。具有相关实际经验者优先考虑。
北京智源人工智能研究院
查看其他 41 个职位