某上海ai初创 分布式存储实习 2+1

一面
go make和new区别
go gc
文件系统读写
page cache
raft 相关
go原子操作怎么实现的,具体系统调用是什么
并发安全map
算法 二分

二面
mysql 崩溃恢复 redo和undo顺序?以及为什么不能将顺序倒过来
mysql的buffer pool怎么拿到页面的,具体流程
lsm 流程,merge compaction策略,讲一下常用的哪几种或者你用的
为什么bloom过滤器要有多次hash
multi raft架构和流程,片怎么分裂的,又是怎么merge的,说一下具体怎么实现
kv数据库替换关系型数据库怎么映射
.....

一面还好,二面开始上强度,有些确实不会,还需继续努力,面试官很友善
全部评论
更新,hr面一小时,临时加面leader。
点赞 回复 分享
发布于 10-15 08:09 重庆
更新,排序
点赞 回复 分享
发布于 10-15 10:30 重庆
更新,又约hr沟通
点赞 回复 分享
发布于 10-15 15:35 重庆
是根据项目问的嘛佬,还是硬考基础🫨
点赞 回复 分享
发布于 10-26 01:38 山东

相关推荐

10-11 22:39
复旦大学 Java
通义实验室-AI数据引擎团队招聘团队介绍:通义实验室系统AI实验室,致力于阿里大模型相关的系统化工程工作;魔搭,灵积,通义千问,每一款阿里出品的大模型产品都有我们团队的印记;而AI数据引擎团队,主要解决大模型训练过程中的数据生产问题。训练数据在大模型训练中是至关重要的,它是模型学习和泛化的基础;高质量、多样性和代表性的训练数据可以帮助模型获得更好的性能和更广泛的应用能力。我们团队的工作包含了海量预训练数据的采集、预处理,SFT/RLHF等模型alignment所需的精细数据的生产(标注、评测),训练数据集的体系化管理、索引、使用、增效,线上训练数据回流解决方案,等一系列大模型训练和部署过程中会遇到的数据生命周期相关问题;在这里你会深度发掘模型和数据之间的联系,迅速得接入大模型训练数据生产背后的魔鬼细节,将对大模型的相关认知持续推到新高度。职位描述:参与AI数据平台的研发工作。1. 海量分布式采集系统:高并发系统的吞吐优化、线性扩容,降本增效,对于网站安全机制的深入理解。2. 数据标注系统:高可用的API系统的开发和维护,二次开发体系的建设(AWS SageMaker GroundTruth),特定标注模版的开发和算法辅助优化(如视频自动跟踪,图片自动分割)。3. 数据处理系统:高质量训练数据集的流程构建,百亿级向量去重算法的研发,向量提取模型的研发和部署,高质量数据集的构建(对标RedPands,Lainon5B,DataComp)。4. 数据管理系统:多模态数据的存储体系构建,多模态检索系统的研发和优化,Python SDK的研发,高质量数据集的构建。感兴趣的同学可发送简历到jiahaijun.jhj@alibaba-inc.com
投递阿里巴巴等公司10个岗位
点赞 评论 收藏
分享
2 2 评论
分享
牛客网
牛客企业服务