首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
JavaEdge
华为_2012实验室_Java工程师
关注
已关注
取消关注
#我的求职思考#
你觉得哪个最好?
@JavaEdge:
【RPC最强专栏】服务发现:CP or AP?
1 服务发现的意义为高可用,生产环境中服务提供方都以集群对外提供服务,集群里这些IP随时可能变化,也需要用一本“通信录”及时获取对应服务节点,这获取过程即“服务发现”。对服务调用方和服务提供方,其契约就是接口,相当于“通信录”中的姓名,服务节点就是提供该契约的一个具体实例。服务IP集合作为“通信录”中的地址,从而可通过接口获取服务IP的集合来完成服务的发现。即PRC框架的服务发现:RPC服务发现原理图1.1 服务注册在服务提供方启动时,将对外暴露的接口注册到注册中心,注册中心将这个服务节点的IP和接口保存1.2 服务订阅在服务调用方启动时,去注册中心查找并订阅服务提供方的IP,然后缓存到本地,并用于后续的远程调用2 为何不使用DNS?服务发现的本质,就是完成接口跟服务提供者IP的映射。能否把服务提供者IP统一换成一个域名,利用DNS实现?2.1 DNS流程DNS查询流程:所有服务提供者节点都配置在同一域名下,调用方是可通过DNS拿到随机的一个服务提供者的IP,并建立长连接,但业界为何不用这方案?异常考虑若该IP端口下线了,服务调用者能否及时摘除服务节点若在之前已上线一部分服务节点,突然对这服务扩容,新上线的服务节点能否及时接收到流量都不能。为提升性能和减少DNS服务压力,DNS采取多级缓存,缓存时间较长,尤其JVM默认缓存是永久有效,所以服务调用者不能及时感知服务节点变化。是否能加个负载均衡设备?将域名绑定到这台负载均衡设备,通过DNS拿到负载均衡的IP。服务调用时,服务调用方就能直接跟VIP建立连接,然后由VIP机器完成TCP转发:VIP方案:这是能解决DNS遇到的一些问题,但RPC里不是很合适:搭建负载均衡设备或TCP/IP四层代理,需额外成本请求流量都经过负载均衡设备,多经过一次网络传输,浪费性能负载均衡添加节点和摘除节点,一般要手动添加,当大批量扩容和下线时,会有大量人工操作和生效延迟服务治理时,需更灵活的负载均衡策略,目前负载均衡设备的算法不满足灵活需求由此可见,DNS或者VIP方案虽然可以充当服务发现的角色,但在RPC场景里面直接用还是很难的。3 基于zk的服务发现(CP)服务发现的本质:完成接口跟服务提供者IP的映射。就是一种命名服务,还希望注册中心完成实时变更推送,zk、etcd都能实现。搭建一个zk集群作为注册中心集群,服务注册时,只需服务节点向zk写入注册信息,利用zk的Watcher机制完成服务订阅与服务下发功能。整体流程基于ZooKeeper服务发现结构图:服务平台管理端先在zk创建一个服务根路径,可根据接口名命名(如:/service/com.javaedge.xxService),在这路径再创建服务提供方目录与服务调用方目录(如:provider、consumer),分别存储服务提供方、服务调用方的节点信息当服务提供方发起注册时,会在服务提供方目录中创建一个临时节点,节点中存储该服务提供方的注册信息当服务调用方发起订阅时,则在服务调用方目录中创建一个临时节点,节点中存储该服务调用方的信息,同时服务调用方watch该服务的服务提供方目录(/service/com.demo.xxService/provider)中所有的服务节点数据。当服务提供方目录下有节点数据发生变更时,zk通知给发起订阅的服务调用方zk缺陷早期RPC框架服务发现就是基于zk实现,但后续团队微服务化程度越来越高,zk集群整体压力越来越高,尤其在集中上线时越发明显。“集中爆发”是在一次大规模上线时,当时有超大批量服务节点在同时发起注册操作,ZooKeeper集群的CPU飙升,导致集群不能工作,也无法立马将zk集群重新启动,一直到zk集群恢复后业务才能继续上线。根本原因就是zk本身性能问题,当连接到zk的节点数量特多,对zk读写特频繁,且zk存储目录达到一定数量,zk将不再稳定,CPU持续升高,最终宕机。宕机后,由于各业务的节点还在持续发送读写请求,刚一启动,zk就因无法承受瞬间的读写压力,马上宕机。要重新考虑服务发现方案。4 消息总线(AP)zk强一致性,集群的每个节点的数据每次发生更新操作,都通知其它节点同时执行更新。它要求保证每个节点的数据实时完全一致,直接导致集群性能下降。而RPC框架的服务发现,在服务节点刚上线时,服务调用方可容忍在一段时间后(如几s后)发现这个新上线的节点。毕竟服务节点刚上线后的几s内,甚至更长的一段时间内没有接收到请求流量,对整个服务集群没有什么影响,可牺牲掉CP(强制一致性),选择AP(最终一致),换取整个注册中心集群的性能和稳定性。是否有一种简单、高效,并且最终一致的更新机制,代替zk数据强一致的数据更新机制?最终一致性,可考虑消息总线机制。注册数据可全量缓存在每个注册中心的内存,通过消息总线来同步数据。当有一个注册中心节点接收到服务节点注册时,会产生一个消息推送给消息总线,再通过消息总线通知给其它注册中心节点更新数据并进行服务下发,从而达到注册中心间数据最终一致性。4.1 总体流程服务上线,注册中心节点收到注册请求,服务列表数据变化,生成一个消息,推送给消息总线,每个消息都有整体递增的版本消息总线主动推送消息到各注册中心,同时注册中心定时拉取消息。对获取到消息的,在消息回放模块里面回放,只接受大于本地版本号的消息,小于本地版本号的消息直接丢弃,实现最终一致性消费者订阅可从注册中心内存拿到指定接口的全部服务实例,并缓存到消费者的内存采用推拉模式,消费者可及时拿到服务实例增量变化情况,并和内存中的缓存数据进行合并。为性能,这里采用两级缓存,注册中心和消费者的内存缓存,通过异步推拉模式确保最终一致性。服务调用方拿到的服务节点不是最新的,所以目标节点存在已下线或不提供指定接口服务的情况,这时咋办?这问题放到RPC框架里处理,在服务调用方发送请求到目标节点后,目标节点会进行合法性验证,若指定接口服务不存在或正在下线,则拒绝该请求。服务调用方收到拒绝异常后,会安全重试到其它节点。通过消息总线,完成注册中心集群间数据变更的通知,保证数据最终一致性,并能及时触发注册中心的服务下发。服务发现的特性是允许我们在设计超大规模集群服务发现系统的时候,舍弃强一致性,更多考虑系统健壮性。最终一致性才是分布式系统设计更常用策略。5 总结通常可使用zk、etcd或分布式缓存(如Hazelcast)解决事件通知问题,但当集群达到一定规模之后,依赖的ZooKeeper集群、etcd集群可能就不稳定,无法满足需求。在超大规模的服务集群下,注册中心所面临的挑战就是超大批量服务节点同时上下线,注册中心集群接受到大量服务变更请求,集群间各节点间需要同步大量服务节点数据,导致:注册中心负载过高各节点数据不一致服务下发不及时或下发错误的服务节点列表RPC框架依赖的注册中心的服务数据的一致性其实并不需要满足CP,只要满足AP即可。我们就是采用“消息总线”的通知机制,来保证注册中心数据的最终一致性,来解决这些问题的。如服务节点数据的推送采用增量更新的方式,这种方式提高了注册中心“服务下发”的效率,而这种方式,还可用于如统一配置中心,用此方式可以提升统一配置中心下发配置的效率。关注我,紧跟本系列专栏文章,咱们下篇再续!作者简介:魔都技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主,编程严选网创始人。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。负责:中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考:编程严选网
点赞 1
评论 0
我的求职思考
全部评论
推荐
最新
楼层
还没有回复哦~
相关推荐
昨天 20:53
门头沟学院 C++
如何看待提前实习or考公or摆烂享受最后的大学生活
大家如何看待公司提前实习(不强制)或者去试一下参加考公或者直接摆烂享受最后大学的生活大家都有哪些想法呢?又或者说怕公司毁约,提前实习刷一段实习进行春招之类的,还是趁现在有空余时间准备考公还是直接躺平摆烂好好享受生活
职场吐槽大会
牛客创作赏金赛
点赞
评论
收藏
分享
11-26 14:40
辽宁工业大学 汽车电子工程师
比亚迪工作真实体验
加班文化在比亚迪是挺普遍的,不同部门不同岗位情况不一样。G级有加班工资,F级看情况,有的可以特批加班工资或者换调休。晋升方面,如果起点太低,机会不大,除非你有个好领导,个人能力强,还得有点机遇。比亚迪推崇智能化、信息化、自动化,老员工竞争力会越来越小,新来的本科生研究生专业知识强,学习能力也好,可能两三年就能达到老员工六七年的高度。内部换部门和事业部挺难的,没人能告诉你到底好不好,只有自己融入进去才知道。总的来说,比亚迪平台大,有好有坏,有机遇有前景,但能不能抓住得看运气。很多人想进来,也有很多人想出去,每个人的体验都不一样
比亚迪成长空间 168人发布
点赞
评论
收藏
分享
11-07 13:23
Nanyang Technological University 自然语言处理
想找个大厂日常实习,半年以上
这个bg能找到吗
爱看电影的杨桃allin春招:
我感觉你在炫耀
点赞
评论
收藏
分享
11-25 12:32
长春理工大学 金融分析师
重生之我变成了小学生
家人们!大离谱事件发生了!早上我被我妈叫醒,我就想,我都是一个20多岁的成年人了,怎么早上还叫我起床!所以我就没理然后我的屁股遭到了一记重击!等等……这感觉怎么似曾相识……难道是……难道是……我猛然睁开眼睛!日历上显示现在是,,2012年!!我穿越了!!我呆呆地坐在床上,看着我现在幼小的身体,我妈拎着笤帚站在床头,看我愣着出神,超用力地推了一下我的头,顺势我倒在了床上……“你看看这都几点了还不起?不想上学啦!不想上学早说,跟着你爸干活去!别给我浪费钱!”说罢她“嘭”地把门关上离开了难道说……我真的回到了小学?我迅速爬起来,把自己浑身上下摸了一遍,给了自己两耳刮子,啧……真疼啊我,真的回到小学了...
shanxin233:
直接买比特币
非技术求职现状
点赞
评论
收藏
分享
点赞成功,聊一聊 >
点赞
收藏
评论
分享
回复帖子
提到的真题
返回内容
招聘动态
查看更多
字节跳动
2025校园招聘
阿里云管培生
2025届校园招聘
快手Star
2025届招聘
快手
销售类投递专区
全站热榜
1
...
从露宿街头到百万级种子轮融资——我的大学时代经历了什么
4.1W
2
...
C++选手秋招总结
1.5W
3
...
字节20多面终究一场空
1.5W
4
...
寒假实习租房攻略!北京版
1.1W
5
...
阿里云管培生开奖了
8897
6
...
泡出来啦
8727
7
...
不装了!牛客就是OFFER判官
8239
8
...
华为电话oc了
8003
9
...
放弃代码,结束秋招啦!
7899
10
...
秋招圆满结束
7244
正在热议
#
25届秋招总结
#
356622次浏览
3479人参与
#
我的实习求职记录
#
6089921次浏览
83714人参与
#
北方华创开奖
#
50399次浏览
451人参与
#
地方国企笔面经互助
#
5329次浏览
13人参与
#
职场吐槽大会
#
90967次浏览
752人参与
#
选完offer后,你后悔学本专业吗
#
23127次浏览
165人参与
#
百度开奖
#
215926次浏览
1371人参与
#
ai智能作图
#
4331次浏览
79人参与
#
运营商笔面经互助
#
92957次浏览
1336人参与
#
实习中的菜狗时刻
#
279046次浏览
2741人参与
#
腾讯求职进展汇总
#
201083次浏览
1668人参与
#
如果有时光机,你最想去到哪个年纪?
#
25209次浏览
524人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
37964次浏览
345人参与
#
风评不好的公司,你会去吗?
#
20782次浏览
94人参与
#
上班苦还是上学苦呢?
#
91799次浏览
798人参与
#
大疆求职进展汇总
#
414000次浏览
2935人参与
#
国企还是互联网,你怎么选?
#
90256次浏览
704人参与
#
硬件兄弟们 甩出你的华为奖状
#
74012次浏览
609人参与
#
远程面试的尴尬瞬间
#
20635次浏览
296人参与
#
软件开发2024笔面经
#
2326547次浏览
48227人参与
#
如果中了500万,你会离职吗?
#
13817次浏览
145人参与
#
如何一边实习一边秋招
#
1000562次浏览
12701人参与
牛客网
牛客企业服务