网易某bu大模型开发实习(已入职)
background
纯后端厌倦了,一句话形容,又事多又无聊
又着迷LLM,想转
main-content
主旨就是狠狠拷打,有点压力的意思
先是对项目的真实性表示质疑,我这边给了一些具体的信息
又怀疑项目达到的性能,三方面进行拷打:PE,LoRA,RAG
LoRA主要说了概念,具体怎么用,用在哪些层,为什么有效,成本控制
RAG主要说了知识库建立,也是老生常谈的语义分割和上下文长记忆问题
PE就是列举了几个case,就是CoT,角色扮演,多次迭代
最后做了一道算法 dfs秒了
summary
一定要对基础知识掌握扎实,活学活用,比如问LoRA和Adapter,Knowledge distillation的异同
RAG开发中发现语义分割有问题,后续怎么调整
#简历中的项目经历要怎么写#