NLP算法工程师

30-55K * 16薪
深度学习
杭州
硕士
1-3年
3 个工作日内
岗位关键词
岗位职责
1、负责通用基座大语言模型的研发,包括从大规模预训练,SFT到RLHF的LLM文本生成全链路技术建设。 2、负责大语言模型的评估体系建设,包括通用生成,聊天对话,工具调用,RAG等能力的科学评估。 3、参与基于Instruction Tuning,CoT training,RLHF-based Learning等LLM技术的自研电商翻译大模型研发; 4、参与模型蒸馏,量化剪枝,在线实时性部署等工作,支持生成&翻译算法的性能优化与落地; 5、针对业务特点,跟踪相关领域的技术发展趋势,进行各类技术方案的探索和学术研究。
岗位要求
1、计算机、数学或相关专业硕士及以上学历,有扎实的机器学习和NLP算法基础。 2、熟悉提示工程的技术和方法,并掌握大模型的微调和评估方法;有参与大模型研发者优先。 3、具备优秀的业务感知以及分析和解决问题的能力,良好的沟通协作能力。 4、有高水平论文(如ACL、EMNLP、NIPS、AAAI、ICML等)或者开源项目者优先。
岗位亮点
岗位优势: 1、机器资源充足,支持sota技术和想法的快速实验; 2、科研能力深厚,能够紧追当前最新技术,并在NLP领域达到业界先进水平。 3、技术前沿性高,有机会开阔新的技术研究:所在团队研究成果被CCF-A顶级会议WWW、CVPR、AAAI、CIKM、SIGIR等收录。多篇论文为oral,相关论文荣获best paper奖项; 4、提供了跨境贸易落地平台,研究技术可以快速落地服务全球。 ----- 附录小组内一些论文和赛事成绩 ----- 1. 赛事成绩: * NLP 顶级 Benchmark SuperGLUE 全球第二(国内第一) * NLP Qustion-Answer 顶级 Benchmark PIQA 全球第一 * NLP Qustion-Answer 顶级 Benchmark CommonsenseQA 全球第二 * ECAL21 Offensive Language Identification 挑战赛 Malayalam,Tamil,Kannada 2/3/4 名 * AAAI2021 届 Acronym Identification 挑战赛全球第一 * AAAI2021 届 Acronym Disambiguation 挑战赛全球第二 2. 录用论文: ● "Self-Renewal Prompt Optimizing with Implicit Reasoning." WWW (CCF-A, short), 2023 ● "Contrastive Token Learning with Similarity Decay for Repetition Suppression in Text Generation." SIGIR (CCF-A, under review), 2023. ● "General2Specialized LLMs Translation for E-commerce." ICASSP (CCF-B, under review), 2023. ● "FGVL: Fine-Grained Vision-Language Dataset and Evaluation for Fashion Domain." SIGIR (CCF-A, under review), 2023. ● "Preference Aware Dual Contrastive Learning for Item Cold-start Recommendation." AAAI (CCF-A , Poster) 2023. ● "Mutual Information assisted graph convolution network for cold-start recommendation." ICASSP (CCF-B, oral), 2023. ● "Unified Vision-Language Representation Modeling for E-Commerce Same-Style Products Retrieval." WWW, (CCF-A, Oral). 2023 ● "FashionKLIP: Enhancing E-Commerce Image-Text Retrieval with Fashion Multi-Modal Conceptual Knowledge Graph." ACL, (CCF-A, Oral). 2023. ● "Transformer-based language model fine-tuning methods for covid-19 fake news detection." AAAI (CCF-A, workshop best paper), 2021. ● "Leveraging Domain Agnostic and Specific Knowledge for Acronym Disambiguation." AAAI (CCF-A), 2021 ● "Kaleido-BERT: Vision-Language Pre-training on Fashion Domain." CVPR (CCF-A, Poster). 2021. ● "FashionBERT: Text and image matching with adaptive loss for cross-modal retrieval." SIGIR (CCF-A, Oral). 2020
滨江阿里巴巴园区
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报