NLP算法工程师

30-55K * 16薪

深度学习

硕士

1-3年

3 个工作日内

陈先生

阿里巴巴集团·算法工程师

反馈率：12% | 反馈时长：1天

岗位关键词

岗位职责

1、负责通用基座大语言模型的研发，包括从大规模预训练，SFT到RLHF的LLM文本生成全链路技术建设。 2、负责大语言模型的评估体系建设，包括通用生成，聊天对话，工具调用，RAG等能力的科学评估。 3、参与基于Instruction Tuning，CoT training，RLHF-based Learning等LLM技术的自研电商翻译大模型研发； 4、参与模型蒸馏，量化剪枝，在线实时性部署等工作，支持生成&翻译算法的性能优化与落地； 5、针对业务特点，跟踪相关领域的技术发展趋势，进行各类技术方案的探索和学术研究。

岗位要求

1、计算机、数学或相关专业硕士及以上学历，有扎实的机器学习和NLP算法基础。 2、熟悉提示工程的技术和方法，并掌握大模型的微调和评估方法；有参与大模型研发者优先。 3、具备优秀的业务感知以及分析和解决问题的能力，良好的沟通协作能力。 4、有高水平论文（如ACL、EMNLP、NIPS、AAAI、ICML等)或者开源项目者优先。

岗位亮点

岗位优势： 1、机器资源充足，支持sota技术和想法的快速实验； 2、科研能力深厚，能够紧追当前最新技术，并在NLP领域达到业界先进水平。 3、技术前沿性高，有机会开阔新的技术研究：所在团队研究成果被CCF-A顶级会议WWW、CVPR、AAAI、CIKM、SIGIR等收录。多篇论文为oral，相关论文荣获best paper奖项； 4、提供了跨境贸易落地平台，研究技术可以快速落地服务全球。 ----- 附录小组内一些论文和赛事成绩 ----- 1. 赛事成绩： * NLP 顶级 Benchmark SuperGLUE 全球第二(国内第一) * NLP Qustion-Answer 顶级 Benchmark PIQA 全球第一 * NLP Qustion-Answer 顶级 Benchmark CommonsenseQA 全球第二 * ECAL21 Offensive Language Identification 挑战赛 Malayalam,Tamil,Kannada 2/3/4 名 * AAAI2021 届 Acronym Identification 挑战赛全球第一 * AAAI2021 届 Acronym Disambiguation 挑战赛全球第二 2. 录用论文： ● "Self-Renewal Prompt Optimizing with Implicit Reasoning." WWW (CCF-A, short), 2023 ● "Contrastive Token Learning with Similarity Decay for Repetition Suppression in Text Generation." SIGIR (CCF-A, under review), 2023. ● "General2Specialized LLMs Translation for E-commerce." ICASSP (CCF-B, under review), 2023. ● "FGVL: Fine-Grained Vision-Language Dataset and Evaluation for Fashion Domain." SIGIR (CCF-A, under review), 2023. ● "Preference Aware Dual Contrastive Learning for Item Cold-start Recommendation." AAAI (CCF-A , Poster) 2023. ● "Mutual Information assisted graph convolution network for cold-start recommendation." ICASSP (CCF-B, oral), 2023. ● "Unified Vision-Language Representation Modeling for E-Commerce Same-Style Products Retrieval." WWW, (CCF-A, Oral). 2023 ● "FashionKLIP: Enhancing E-Commerce Image-Text Retrieval with Fashion Multi-Modal Conceptual Knowledge Graph." ACL, (CCF-A, Oral). 2023. ● "Transformer-based language model fine-tuning methods for covid-19 fake news detection." AAAI (CCF-A, workshop best paper), 2021. ● "Leveraging Domain Agnostic and Specific Knowledge for Acronym Disambiguation." AAAI (CCF-A), 2021 ● "Kaleido-BERT: Vision-Language Pre-training on Fashion Domain." CVPR (CCF-A, Poster). 2021. ● "FashionBERT: Text and image matching with adaptive loss for cross-modal retrieval." SIGIR (CCF-A, Oral). 2020

滨江阿里巴巴园区

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

阿里巴巴

互联网

天使轮

杭州市

查看其他 96 个职位

26 笔试题目 4486 面试经验 2538 面试短评