研究实习生(AI安全方向)

薪资面议

硕士

成府路150号智源大厦1层

2024-09-05

什么是官网闪投?

简历直投官网

无需重复填写简历

投后必反馈

进度实时更新

安全可靠官网可查

海量岗位5w+

移动端投递方便

职位描述

针对不同算法和应用场景，建立和完善大模型安全所需的风险识别与治理体系：

1.大模型安全能力提升：研究和开发大模型安全对齐的算法。例如：基于人类反馈的无害内容输出控制、抵御指令攻击的防御策略，以及确保大模型对齐人类价值观。这些算法旨在确保大模型的有益性和无害性方面进行技术平衡；

2.大模型风险评估：通过红蓝对抗和自动化工具，建立大模型安全能力的自动化评估体系；

3.长期风险研究：着手研究因大模型能力快速增强而产生的新型风险。例如：大模型逐渐增强的Planning和Reasoning能力用于复杂系统中的应用、工具调用和决策能力所带来的新型风险。

任职要求

1.硕士及以上学历，专业方向为计算机科学、人工智能或机器学习；

2.具备大模型安全研究经验者优先；有在复杂应用场景中进行风险控制的经验者优先；

3.精通Transformers、DeepSpeed等大模型相关框架，能够对模型进行部署和微调以适应特定任务。具有相关实际经验者优先考虑。

北京智源人工智能研究院

人工智能

不需要融资

北京