小红书REDstar面经??
大家好,我是小红书算法工程师,在做搜索这块业务,最近不是小红书REDstar开了么,有个学弟来跟我打听会问什么,因为后面很快就要进入到面试了,给他整理完想着别白整理,发出来吧。
不过先声明一下,我不是面试官,只是给你们押押题,给一些视角,因为网上貌似都找不到相关的面经,小红书今年也是重磅发力的这个REDstar,投入了好多资源,百万年薪,专属晋升通道,就算REDstar进不去后面还能参加秋招的,所以这些不管怎么样还都是有用的。
一、怎么准备:
1、看好方向,确定岗位
先确定岗位,因为这次小红书REDstar有20个岗位,有的岗位里甚至还有细分,这篇已经给大家整理好了,直接对照就行,确定感兴趣的方向再去投递。
2、简历的匹配性
确定岗位其实就是在确定你简历的过程,只要符合相关要求,你根本不用精雕细琢你的简历,就参与过xx项目、发表过xxx论文、xx竞赛奖项之类的就够了,不然写成花也不容易过
3、面试会问什么
不同岗位和不同人项目有区分,其实都会不同,这里给大家分享一下原则。
- 只要要求有编程基础的,就会问八股,手撕大概率也会有
- 要求具体其他技能点的,就会问相关基础,如Tensorflow、Hadoop
- 要求相关经验/论文等的,就会进行项目深挖(如果没有,那大概率简历也过不了)
- 可能都会配合一些场景题,根据实际应用来考察
4、面试形式
因为小红书特别重视这个REDstar项目,所以面试含金量会比较高。
一面的面试官都是具体业务方向的负责人,初接触能得到的有效信息就很足,技术面最后都需要面到技术VP,重视感拉满了,所以一定要好好准备,我们也要重视起来。
二、知道有哪些岗位
今年岗位大多数是算法,其他的是开发和数据库相关岗位,首先得看看你适合什么岗位,投的什么岗位,岗位要求是什么,然后是问的问题重点,我帮大家梳理好啦:
1. NLP与多模态算法方向
- 研究方向:基于生成式大模型的搜索
- 适合人群:有过搜索和推荐相关项目背景
- 主要要求:编程基本功扎实,擅长Java/C++/Python至少一个语言,熟悉机器学习、信息检索、数据挖掘、自然语言处理领域的经典算法、主流深度学习框架;
- 加分项:在国际顶级会议(Recsys、KDD、NIPS、ICML、ACL、SIGIR)以第一作者发表过高水平论文者优先,或在知名竞赛(例如KDD Cup、Kaggle、ACM、AOI等)中取得领先名次者优先
2、AI音频算法方向
- 研究方向:基于大模型的语音识别与合成
- 适合人群:对深度学习、Tensorflow,Pytorch等工具非常熟悉的
- 主要要求:熟悉linux开发环境,熟练掌握C++python,Shell等编程语言,了解深度学习技术,有模型优化经验
- 加分项:在相关国际会议或期刊(ICASSP、INTERSPEECH、ISMIR、 ASRU、 TASLP、 Speech Communication)发表过论文者
3、引擎开发方向
- 研究方向:做核心引擎或基础平台
- 适合人群:对深度学习、Tensorflow,Pytorch等工具非常熟悉的
- 主要要求:编程、数据结构和算法基本功,擅长Java/C++至少一门语言,
- 加分项:github/行业上有有影响力的开源项目/ACM竞赛者,熟悉微服务、消息队列、MYSQL、缓存等技术,深入了解Transformer、LLM 模型者,熟悉 tensorflow/pytorch等训练推理框架,掌握GPU等的高性能计算优化技巧
4、机器学习方向-社区技术
- 研究方向:小红书主流业务场景的技术探索
- 适合人群:有过机器学习、深度学习、数据挖掘、图像识别、大模型、NLP等相关背景
- 主要要求:编程基本功,擅长至少Java/C++/Python中至少一门语言,熟悉机器学习和数据挖掘领域前沿技术
- 加分项:在国际顶级会议(Recsys、KDD、NIPS、ICML、ACL、SIGIR)以第一作者发表过高水平论文者优先,或在知名竞赛(例如KDD Cup、Kaggle、ACM、AOI等)中取得领先名次者
5、机器学习方向-AI技术
- 研究方向:构建大规模推荐和搜索系统,对新业务算法问题做抽象和建模
- 适合人群:有搜索、推荐、广告、NLP、图像识别等相关背景
- 主要要求:具备算法和编程能力,熟悉机器学习,NLP、数据挖掘、知识工程的经典算法
- 加分项:大规模搜索/推荐/广告系统算法研发实习经历者、国际顶级会议(Recsys、KDD、NIPS、ICML、ACL、SIGIR)以第一作者发表过高水平论文者优先,有机器学习、数据挖掘等相关项目实际经验者,或者知名数据挖掘比赛(例如KDD Cup等)中取得领先名次者
6、 机器学习方向-商业技术
- 研究方向:广告系统的算法
- 适合人群:有搜索、推荐、广告、NLP、图像识别等相关背景
- 主要要求:有算法和编程能力,熟悉机器学习,NLP、数据挖掘、知识工程的经典算法
- 加分项:有过大规模搜索/推荐/广告系统算法研发实习或项目经历,在国际顶级会议(Recsys、KDD、NIPS、ICML、ACL、SIGIR)以第一作者发表过高水平论文者,或者知名数据挖掘比赛(例如KDD Cup等)中取得领先名次者优先。
7、图像增强算法方向
- 研究方向:探索音视频、视频图像处理和生成等领域的前沿技术研究和落地
- 适合人群:对前沿研究和学术发表感兴趣,对推动前沿算法在工业界落地感兴趣
- 主要要求:具备算法和编程能力
- 加分项:有相关领域的会议或期刊(如CVPR, ICCV, TIP, TPAMI)发表经验者
8、图像渲染算法方向
- 研究方向:视频编辑中2D/3D特效编辑与渲染相关业务落地,也会涉及到移动端视频编辑与渲染相关的工具链开发
- 适合人群:有视频编辑和渲染项目经验
- 主要要求:熟练掌握C/C++编程语言、移动端GPU调试与性能优化、现代主流图像API(OpenGL/ES/Metal/Vulkan等)、现代GPU渲染管线,shader、对图形图像后处理算法有深入了解
- 加分项:有自研游戏引擎及工具链开发及调优经验和有影视特效及其工具链开发及调优经验
9、视频编解码方向
- 研究方向:视频解码方案设计和核心代码开发
- 适合人群:对快速算法、码率控制、汇编加速、画质提升等领域感兴趣的
- 主要要求:熟悉ffmpeg、H264、H265、H266或av1等至少一种编码标准,熟悉c/c++编程语言,有扎实的数据结构与算法基础
- 加分项:暂无
10、策略算法方向
- 研究方向:小红书app数据挖掘,优化用户体验,探索大模型在数据科学相关工作的应用
- 适合人群:对前沿大模型/数据挖掘/统计学领域的前沿技术感兴趣
- 主要要求:熟悉使用至少一种常用机器学习模型/算法框架,如PyTorch/Tensorflow/Scikit-learn/XGBoost 等并掌握常用数据分析工具
- 加分项:暂无
11、数据引擎方向
- 研究方向:支撑公司所有数据的存户和计算,支持EB级别数据的实时集成、开发加工、消费使用的全链路数据解决方案
- 适合人群:对技术特别热爱且有追求卓越代码表现的渴望
- 主要要求:熟悉JAVA面向对象和多线程、网络等基础编程,熟悉微服务、消息队列、MYSQL等技术
- 加分项:对计算网络、操作系统有深刻理解,有编程竞赛获奖经验或有独立代表作品
12、大模型轻量化算法方向
- 研究方向:大预言模型的低精度训练、推理、低精度优化器(量化梯度、优化器状态、参数等)等
- 适合人群:有过相关实际落地经验
- 主要要求:熟练使用主流大规模训练或推理引擎开发,例如DeepSpeed/Megatron/Transformer Engine等
- 加分项:具备实际Cuda算子开发经验者和工程能力较强者
13、算法数据平台方向
- 研究方向:大数据计算引擎和数据平台的研发
- 适合人群:有过数据分析、数据平台研发相关经验
- 主要要求:熟练掌握Hadoop, Hive, Spark, Flink, Kafka等
- 加分项:具备大数据相关框架/工具经验者
14、音视频架构方向
- 研究方向:构建大规模直播系统
- 适合人群:有相关经验
- 主要要求:掌握基础数据结构和算法,熟练掌握C/C++编程,精通多线程编程、网络编程,熟悉高并发、高性能分布式系统开发,熟练的Linux平台开发经验,掌握云计算分布式媒体服务器的架构开发
- 加分项:具备Go/Python/JAVA等编程经验、有网络传输、视频编解码、视频图像处理等相关项目和比赛经验者,具备iOS/Android平台的媒体开发经验
15、风控算法方向
- 研究方向:用数据挖掘和算法优化策略,降低业务风险
- 适合人群:做过大数据处理相关项目的同学
- 主要要求:掌握C++、JAVA、Python中一种或多种编程语言,拥有扎实的数据结构和算法基础,并熟悉至少一种主流机器学习/深度学习平台、熟悉数据挖掘算法,熟悉大数据处理技术、至少熟悉hadoop/hive/spark/flink其中一项
- 加分项:有业务风控、账号安全、反爬虫相关经验
16、NLP通用基础大模型算法方向
- 研究方向:做数据采集和处理方案,提升模型的高效性和稳定性
- 适合人群:喜欢数据,有过深度学习经验的
- 主要要求:扎实的Pytorch与Python技术基础,擅长代码读写,精通至少 1 个 Deep Learning 任务,对 SOTA 的大模型技术有深入了解,能够问出好的问题,并对至少一个重要问题有非共识理解
- 加分项:有深度学习相关实习经历或支撑过 Web Scale 的业务规模
17、多模态通用基础大模型算法方向
- 研究方向:多模态数据处理,搭建多模态的模型架构
- 适合人群:对多模态大模型感兴趣/有相关经验的
- 主要要求:熟练掌握代码的阅读与编写技能,且在Pytorch和Python技术栈方面拥有扎实的基础
- 加分项:对多模态研发领域的深入理解和一线实践经验
18、云原生开发方向
- 研究方向:云原生基础设施的建设
- 适合人群:对云原生技术感兴趣的,喜欢研究新技术和工具的
- 主要要求:至少精通一门编程语言,例如 Go、Java、Python、C/C++,深刻理解计算机数据结构和算法设计,具备对云原生相关技术如Kubernetes、Docker/Containerd的了解和实践经验
- 加分项:熟悉大数据、机器学习相关框架,有开源社区运作、云原生相关的实践经验
19、存储与数据库方向
- 研究方向:有表格存储方向、Redis存储方向、数据库方向
- 适合人群:做过存储类项目
- 主要要求:至少擅长以下编程语言中的一种:C++、Go、Python、Java,对数据库、单机存储或者分布式存储、Redis内核结构有一定的了解,具有扎实的数据结构和算法基础,能够解决复杂的算法问题
- 加分项:有项目实习经验,能够独立完成小型存储类项目,或者能够独立Debug项目中的常见问题
20、视觉与多模态算法方向
- 研究方向:有内容理解方向、生成方向、基础视觉方向、AIGC方向
- 适合人群:对前沿技术感兴趣的
- 主要要求:熟悉Python、C/C++、Java等编程语言,对数据结构和算法设计有较为深刻的理解,解DiscoDiffusion、DALLE、StableDiffusion、chatGPT等前沿技术,关注多模态与文本生成领域的业界最新动态,如Midjourney、Runway、chatGPT等
- 加分项:具备优秀的研究和创新能力,在CVPR/ICCV/ECCV/NIPS/ICML/SIGGRAPH/ACL/EMNLP等会议上发表过论文者和参加过ACM竞赛者
差不多这么多啦,整理不易,大家记得点赞收藏和投递吧,如果能帮助到你们,那也算功德圆满了!希望你们能拿到小红书REDstar 的offer
#小红书REDstar#