【阿里云】阿里云分布式块存储 研发
职位:阿里云分布式块存储 研发-阿里云
【岗位职责】
【业务】 阿里云分布式块存储(EBS)全面支持云盘业务,营收高达数十亿,产品形态包括ESSD云盘, SSD云盘, 高效云盘,本地盘,共享盘,快照,动态迁移服务。正在研发中的还有同步复制,异步复制,持续数据保护,E2E的隔离和QOS, 多中心云盘等企业级特性和产品(参见阿里云官网:https://www.aliyun.com/product/disk?spm=5176.10695662.8115314850.1.609665f5JBII32)。目前EBS整体无论是营收,用户数、数据量、机器规模 在国内都遥遥领先。最新发布的EBS2.5在稳定性,性能,成本上更是持续拉大与友商的差距。我们正在重新定义并实现着块存储,使其历久弥新。 1、产品ESSD云盘,在公有云市场上首次突破了单盘100万IOPS,一骑绝尘,远超全球友商。而且售价与全SSD云盘保持一致,加量不加价,广受客户好评。 2、承载阿里经济体上云,多年来顺利支持中间件、集团数据库、蚂蚁金服 等业务通过双十一大考,如丝般顺滑,广受好评。 3、支撑专有云存储,对接了大量政企客户、头部客户的搬站上云,助力2B的数字化转型。 4、所有这些业务均发展迅猛,无论是营收、用户量、数据量、机器数,每年都大幅增长,正在风口上,而且随着云计算的深入发展,大量的企业上云,这个趋势还在不断增强。 5、整个业务的国际化发展非常好,目前在美国、德国、日本、澳大利亚、新加坡、迪拜、印度、中国香港、中国台湾 等地均有部署和大量的国际客户。 【团队】 1、所有成员都热爱coding, 欣赏优美的代码。在这里你能深刻体验到逻辑之美,编程之美,并乐在其中。团队有浓厚的ACM文化,多人获得过全国,亚洲赛区金牌,热爱代码的你必能找到知音。 2、坚持用数据说话,沟通协作便捷高效。业务飞速发展,有足够的丰腴土地待开发,每一位都能找到有挑战的领域,长期专注深耕取得长足的发展。新人成长快,很多新人落地后即攻城略地,大显身手。 3、不为每个人设限,崇尚志愿者文化。遇到挑战性的问题,欢迎任何人挺身而出来担当,大家协调资源帮他拿结果,新人很容易脱颖而出。 4、鼓励任何人提出想法。如果你足够自信,而且准备充分,团队会随时协调资源支持你的想法。 5、团队稳定。过往经历让我们认识到存储是一个高危且重积累的行业,长期稳定的团队,才能积累出卓越的产品和服务。要在极大规模下做到数据不丢,不错是极富挑战的事情,毕竟这是一个熵增的世界,我们就是对抗熵增的能量。 【岗位描述】 1. 高可靠、高可用 系统的设计开发与演进。黑天鹅事件的规避预防以及损失控制,降低爆炸半径。数据是用户的生命,绝对不能错,不能丢,而且要高可用(发生不可用故障后,百倍赔偿),众所周知硬件都会发生故障,我们碰到过网卡错、CPU错、内存错、网络错,磁盘/raid卡出错是家常便饭,更不用说内核错,太常见了,在这里你会碰到太多的险恶性问题(事前难以预料,只有发生了才会意识到的问题),我们的工作就是要在这些不可靠的软硬件环境下,利用分布式技术实现对磁盘、单机、网络、内核,甚至自身BUG的冗余,避免内部模块,部件失效对用户造成影响。为用户提供高可靠,高可用的存储服务。 2. 紧跟存储行业前沿,对接新的硬件(NVDIMM,OPTANE,3DXPOINT, QLC,RDMA网络),确保技术先进性。积极提升资源利用率,降低成本,为用户提供更便宜的存储,从技术和成本维度保持对友商的压制。 3. 用户对IO性能的追求永无止境。我们致力于降低IO latency, 提升吞吐量,其中涉及到网络性能优化、调度均衡、QOS、隔离 等领域,你做的每1us的优化,都会惠及海量的用户。 4. 智能化的调度。参照用户过往的IO模式,压力时相特征,在保障用户SLA的前提下,对云盘进行智能动态调度,提升集群的售卖能力,降低整体成本。 5. 复杂问题的调查。随规模持续扩大我们生产线上会遇到一些小概率,难复现,影响因素多的问题,我们需要对这些问题进行抽丝剥茧式的调查分析,找到root cause, 并自发将其分享出来,造福更多人。 6. 重视工程质量。严格的代码review, UT/ST/FT/E2E测试,每位开发者都要对自己的代码负责,我们实行devops,你就是最后的守夜人。 7. 良好的沟通协调能力。块存储是基础设施,承载了大量的业务,需要与多个上游客户团队合作;同时块存储植根于阿里的技术生态,受益于底层服务器,网络 等硬件团队的自主创新,帮忙我们持续提升性能,降低成本,一起合作软硬件一体化,开创更多技术可能性。良好的沟通协调能力能让你直面矛盾,妥善解决,发现更多机会,并乐在其中。 【工作环境】 - 对于用户,数据安全就是生命。存储是个高危行业,我们从不讳言承受着巨大压力,期待你有足够的抗压能力。 - 不强制加班,我们更期待高效率的工作而不是加班,工作时间弹性。
【岗位要求】
1. 热爱代码,追求高品质代码,对工程质量有深刻认识。积极主动,遇到不好的代码,鼓励每个人动手修正,不管是否你写的。 2. 良好的底线意识和抗压能力。每个人都是客户数据安全的守护人,我们不赌概率,无论遇到何种压力,都要做到坚守底线不妥协,你的背后就是海量的将生意,生计,生命 托付给我们的客户。 3. 强烈的好奇心和坚韧不拔的意志,良好的数理基础和工程能力。有太多稀奇古怪的问题,我们期待你在调查时不止步于相关性,而是去繁就简,抽象出数学模型,并工程实现和验证,坚持找到可复现的强因果关系,期待你像福尔摩斯一样sharp。 4. 将物理极限作为系统的极限,不轻言不可能,我们偏好追求极致的人。 5. 思维活跃,敢于想象。基于现状而不囿于现状,不断提出新的想法,对于好的想法我们会尽力协调资源帮你实现这个想法。 6. 熟悉分布式系统,有高可用系统经验,熟悉linux kernel ,IO 虚拟化, SSD硬件,或者有存储背景, 是加分项;熟悉MySQL的是加分项,期待你能发挥优势,带领我们更好的服务数据库业务。 7. 性格开朗,具有较强的组织能力,能活跃团队氛围,丰富团队生活,组织高质量团建的,是加分项。 8. 自信,以上条件不能完全具备也没有关系,我们欢迎自信的人。
【社招待遇和要求】
工作城市:北京,杭州 | 职位类别:其他
薪酬:薪资面议 | 学历要求:本科及以上 | 工作年限:2年以上
投递地址:https://www.nowcoder.com/job/45229?jobIds=39862
我发布的其他职位,点击查看