研究实习生(AI安全方向)

薪资面议
硕士
成府路150号智源大厦1层
2024-09-05
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便


职位描述

针对不同算法和应用场景,建立和完善大模型安全所需的风险识别与治理体系:

1.大模型安全能力提升: 研究和开发大模型安全对齐的算法。例如:基于人类反馈的无害内容输出控制、抵御指令攻击的防御策略,以及确保大模型对齐人类价值观。这些算法旨在确保大模型的有益性和无害性方面进行技术平衡;

2.大模型风险评估: 通过红蓝对抗和自动化工具,建立大模型安全能力的自动化评估体系;

3.长期风险研究: 着手研究因大模型能力快速增强而产生的新型风险。例如:大模型逐渐增强的Planning和Reasoning能力用于复杂系统中的应用、工具调用和决策能力所带来的新型风险。



任职要求

1.硕士及以上学历,专业方向为计算机科学、人工智能或机器学习;

2.具备大模型安全研究经验者优先;有在复杂应用场景中进行风险控制的经验者优先;

3.精通Transformers、DeepSpeed等大模型相关框架,能够对模型进行部署和微调以适应特定任务。具有相关实际经验者优先考虑。

北京智源人工智能研究院
人工智能
不需要融资
北京
查看其他 41 个职位