大厂咋解决技术债的?
在构建可扩展的软件时,它是最关键的团队。
现实没有技术债管理团队,也没人愿意加入这样队伍。这种团队每天就是给其他开发人员收拾烂摊子,谁愿意给别人擦屁股呢,毕竟又不是年薪百万?
但确实有一些名字听起来更专业的团队,如基础设施团队、架构团队、核心团队,这听起来是不是就吊炸天了?这种团队负责处理所用应用程序的核心主体,如下图中的核心协调/依赖项小组:
回想鸿蒙混沌时期,你刚开始开发,完全用不到核心团队,牛逼到自己所在一个团队就搞定所有事。然而,团队也在壮大。我们现在需要更细致分配工作,让一些团队负责特性交付,一些团队负责公共代码:
为提升可维护性和可扩展性,负责公共代码的团队要探索开发跨各个特性团队的代码,以便重构、改进和更好地对齐。这项工作本质上和管理技术债是一回事。因此,把小组叫技术债管理小组挺合适。
别扯远了,本文可不是教你小组命名规则,你大可叫它核心、基础设施或架构小组——而是展示这样一个小组面临的各种挑战,并探索对应的解决方案。
本文我将交替使用核心小组、基础设施小组和架构小组这三姓家奴描述这样一个小组的挑战。
1 团队的边界
组建这个核心团队时,团队的边界或范围是什么?
对某些组织,这里没有边界。架构团队负责一切事务。他们定义特性团队的所有活动:他们编码的方式、他们实现的类,等等。这样这些活动就会高度一致对齐。
但这大大降低了特性团队的灵活性。他们只能做出与架构团队所提供的内容完全一致的东西。若想做一些超出架构团队定义的事情,就要咨询架构团队。于是架构团队成为瓶颈。
由于这并不是理想局面,也许核心小组应该只负责所有现有的通用代码。但是通用代码的定义是非常模糊的。也许这些代码只是一些常见的数据层和实用函数。如果我们将通用代码定义为所有特性小组都使用的代码,那么它只能是全部代码的很小一部分。
这种结构很棒,因为它让每个特性团队都可自由处理自己的特性,而不受核心团队阻碍。缺点是(上图不同颜色所示)每个特性团队的工作方式有很大差异。潜在的通用模式、特性和数据可能以不同方式在各特性团队复现,而没人探索如何将它们抽象为通用内容,因此开发工作的可扩展能力受限。
找到核心团队应该负责的内容的正确边界是一个棘手的难题。它还在很大程度上取决于核心小组的团队能力,以及他们可以承担多少职责。
可行方案
组建核心团队的初始阶段肯定很难。建议从小入手,定义核心团队可负责,并为特性小组带来价值的一个重点领域,如一些实用函数。
随时间推移,核心团队能力也会提升,可接手更多职责。可抽象出跨各特性团队通用的组件,并从那里开始延伸。
2 灵活性与一致性
有时,组织需要让架构小组定义其他所有团队要遵守的标准或规则。该想法可追溯到工业化时代,标准化工厂生产车间更易扩大规模,浪费更少。
甚至OOP在早期也通过定义基类来推行一致性。基类由核心团队定义,而特性团队只需实现基类。
这种方法有很多收益,特性团队无需自己实现通用代码就可以享受它带来的种种好处。以上图,依赖项 1、2 和 3 都被注入基类,这样特性类都可获得它们而无需额外成本。
为确保一致性,所有特性团队都不应创建自己的基类。每个新类须由架构团队经手。这样做原因是避免跨特性团队的意外重复类。若一个特性团队想要新东西,只能与架构团队核对,看是否已有可用东西。如果没有,架构团队将为他们制作所需的基类。
综上,这是一种专制的开发方法,很难扩展,架构团队成为瓶颈。架构团队提供东西可能无法满足每个团队需求。架构团队可能疲于奔命,为各团队构建他们所需种种变体或他们提供的通用类无法被特性团队充分利用。不管哪种都不理想。
相反,可走向另一极端:核心团队不定义任何事情。只提供通用实用程序,特性团队可考虑是否使用它们。正如最近行业首选的编程方法一样,“人们更喜欢组合而不是继承”,如下所示。
特性团队没有义务遵守基础团队提供的任何规范。对于基础团队提供的内容,他们可以只使用自己需要的东西,甚至什么都不用。特性团队拥有充分的灵活性,可以自由实现他们喜欢的东西。
这种极端方法也有自己的缺点。如果没有对常见实践的一定程度的定义,也没有一致和对齐,各个团队可能走上五花八门的道路。潜在的浪费和重新发明轮子的现象可能会出现在不少团队中。
可行解决方案
我们要在:
- 需要遵守的规范
- 做哪些“有用的支持实用程序”
- 及介于两者间的东西
之间平衡。对须遵循的规范,一个很好例子是分析需求,我们需要所有特性都有一致的触发方式。至于“有用的实用程序”,这些工具可以是团队能轻松采用的通用 UI 组件,让他们无需创建新组件。(一些设计师可能会说这类组件需要完全一致,才能确保整个团队的一致设计风格。)
介于二者之间的事物,颜色集就是一个例子。某些颜色需保持一致,而对其他颜色,特性团队可灵活从一系列预定义颜色中抉择。
不是每个人都会同意这案例,但聪明的你应该能明白。核心团队需要与所有团队合作,定义什么是必不可少的、什么是灵活的。这不是个简单过程。
3 核心团队的组成
好的,所以我们要组建一个核心/架构/基础设施团队。应该让谁加入呢?一般会选择一名专家开发和一名初级开发的组合(假设没太多人才可选)。
那特性团队呢?也许他们的组成与核心团队是相同的。然后每个团队都有相同的团队成员搭配,公平分配。
虽然这听着合理,但这种组成方式可能存在挑战。须认识到:
- 核心团队成员实现的是由所有人使用的通用组件或要设计与所有组交互的公共抽象。这不是初级开发能应付的。同时,不能只依靠一位专家开发定义一切
- 核心小组的主要“客户”是特性小组,后者包含一组开发,其中还有一些专家。同样,初级开发没足够能力来同更有经验的“客户”联络并做出可靠和有意义东西。只靠核心组中的一位专家开发来应付所有特性组也不够
鉴于此,也许我们要在核心小组配置所有专家开发。这要好得多,因为在与特性小组合作时就能应对可扩展性的挑战。但把所有专家都放在一个团队,为这个团队定义方向可能就遇到麻烦。或许可在专家中找出一位领导,让他来确定方向。
另一个挑战是让核心团队支持多少个特性团队。若后者数量太多,如何扩展核心团队来提供最出色的交互和支持?
可行解决方案
在我看来,若想建立一个稳固的核心团队,团队肯定需要配置更多经验丰富高级开发。该团队要定义和开发大部分核心内容或可能是所有人都使用的架构,因此它的工作需在技术上足够稳固可靠。
最重要的,若可以,我们应该在每个特性团队中都配置一名来自核心团队的大使(下图特性组中的绿色人员),这会是很有价值的。在组织结构上,他们可以是特性团队的成员,但他们在实践中会积极参与决策以及核心团队产品的开发。
他们在特性团队中还能充当监督者,确保特性开发过程中进行必要调整,并持续定义核心团队可扩展的领域。同样,这位大使还需足够技术经验才能担此大任。
这样一来,核心小组领导者就要能管理一组专家开发,不仅包括核心小组内专家,也包括各特性组中的大使角色。
4 产品和利益相关者管理
通常有产品经理监督工作,判断各种产品特性需要哪些改进。他们与利益相关者沟通,并不断与客户群互动,找出接下来最佳的工作方向。
某特性的开发从产品经理那里获得单一输入源,获知下一步的开发方向和优先级。开发人员无需与利益相关者打交道。他们工作重心都在开发。核心小组不再直接处理外部使用的特性。他们不面对外部客户。这里没有真正的“产品”,也无需团队的“产品”经理。
但核心团队确实有自己的利益相关者,他们就是各大特性团队。核心团队需要与一组开发保持联系,后者进行各特性的开发并交付成果。
与各特性小组中的开发联络、讨论具体需求及对各需求优先级妥协等过程,需特定的产品和利益相关者管理技能。一般来说,开发不具备此类技能。若无合适的产品和利益相关者管理方法,小组就无法确定自身工作方向和重点,因为每个特性组的需求可能截然不同。
可行方案
理想国中,这样的小组会有一名技术产品经理,他既精通技术,又精通产品和利益相关者的管理工作。担任该职的人也可以是小组技术负责人,他为小组提供指导。他须有足够时间工作,并与其他特性团队联络,还须牺牲自己时间来专注技术工作。这是个艰难角色,因为他在完成其他任务同时还不能让自己技术退步!
退而求其次,另一种选择是让一位首席开发或架构师负责监督核心团队,并对各特性团队产生影响。处于该位的成员可设定产品重点和方向,以确保整个产品高层次上的优先级得到合理安排。核心团队的各位成员(具有一定专业知识水平)可与各特性团队一起确定更细节工作内容。
不管咋样,利益相关者管理是确保核心团队成功所需的技能,这种技能并非单纯技术知识。
5 工作结果的可见性
我记得当我参与一个软件特性的开发工作时,看到那个特性发布时我太高兴了。我开发的软件是由大众使用。因此,当我看到朋友圈也在用那款软件,我就告诉他们那是我开发的——多么有成就感的事儿。
或者当有人问我做啥的,我很容易向他们展示自己的产品,告诉他们并让他们了解我的工作。当一个软件特性新版发布,我可以让他们去体验。每次版本发布后,我们一般都会开香槟庆祝。
但人们在基础设施团队工作时,这里没任何能让外部用户轻易看到的有形特征。他们完成的工作可能只是又一个恶心枯燥的API或现有服务的一个新属性——这种成果远不足以发任何对外公告,看公告的用户如果真看到这细枝末节东西,说不定还会很生气。但没有公告,他们所做的工作就不会被公众注意。
有时,核心开发会改进核心库,让代码更易维护或做轻微性能改进(如减少内存占用)。这样的工作不会改接口。使用核心库的人们甚至都感觉不到。没有人注意到或欣赏这些成果。
有时,核心库会迎来新版发布,但发布公告看上去也就是那样。若新版改进没有给特性团队带来太多价值,后者可能还不会欣赏甚至谩骂前者。相反,特性团队可能会讨厌这样的公告和更改,因为他们必须多做一些事情才能使用新版库或做一些更改才能适应新接口。
相比之下,若核心团队成员编写的代码导致核心库质量下降或影响特性团队,那使用这些代码的人们可能很快就会注意到。不开心的“客户”可能会“升级”问题。
这样的环境对团队所做的工作评价很低,对他们犯的错误惩罚却很高,于是核心团队中的开发人员很快就会士气低落,没有人愿意呆在这样的团队里面。这个团队现在实际上就是技术债管理团队了:高风险、低收益。没人愿意加入这种群体。
可行解决方案
也许核心团队也应该像特性团队一样对待他们的工作。每次迭代都应该有要达到的里程碑。计划中的内容(例如他们可以为特性团队或整个产品带来的价值)应该提前让大家知道,这样大家就有了对新版本的期待。
核心团队的领导需要与特性团队协商制定高层计划。领导还要跟踪自己的团队过去取得的所有成就。所有重大里程碑都需要庆祝一番。团队的优秀作品需要广泛传播和分享。
关键在于让核心团队成员感受到其成果被他人看到和欣赏。毕竟,工作不只为钱,也为成就感。
6 成功的衡量标准
学术界,已有很多衡量产品成功的研究。有很多分析工作会探索软件特性的使用情况及它如何转化为组织底线。
开发人员衡量一个特性是否成功,部分标准包括能否及时向用户交付特性,以及特性的质量(例如崩溃率、资源利用率、性能)。
但核心小组如何衡量成功?他们甚至都没有有形的、面向客户输出的产品。当然,我们可以说我们提供了这个库、那个 API 服务,等等,但这样做有什么意义呢?拿组织底线来说,核心团队如何为组织的潜在成功做出贡献?
可行解决方案
评价核心团队成果的一种方式是,把它看作是为公司提供所有所需计算机和基础设施的 IT 部门那样。它就像一个对支出做出重大贡献的部门。
一般情况下,管理层希望尽可能优化这样的部门的成本,除非这个部门能够证明其贡献,证明他们是如何提高所有人的生产力的。
因此,如果我们有一种方法来衡量特性小组获得的生产力或开发扩展能力,那肯定是非常有价值的。也许一种简单的方法是统计特性团队使用了多少 API,当然这个例子太简单了。这里没有一目了然的公式,说起来容易做起来难。
也许第一个衡量标准是特性团队对核心团队提供的支持的感受。如果所有特性团队都感受到了核心团队的价值,那至少是一个很好的开始。
沿着这些思路,有几个行业案例展示了这样一个核心或基础设施团队的巨大成就。一个例子是 AWS,它的服务器最初只是在亚马逊内部提供服务,现在已经成为亚马逊最大的业务部门。
像 Airbnb 和 Square 这样的公司也是类似的例子,他们开发了很多核心库供其他开发人员使用,这对组织在开发社区中的声誉做出了重大贡献。虽然这些工作没有直接的收入收益,但组织因为这些成果而更容易招纳人才了。
7 不断变化的软件技术
软件开发是变化最快的行业之一,甚至可能是变化最快的。业内每年都会推出一些新的东西。有些变化是渐进的,有些是革命性的。
一般来说,核心基础架构团队或架构团队负责定义特性团队应该采用什么技术框架来确保一致性。
这也意味着随着软件技术的不断变化,核心团队感到自己有义务站在曲线的顶端,并能够正确识别出下一个要采用的最佳技术选项,然后朝着这个方向努力。
这也是我之前建议核心团队应该由一群非常了解并密切关注技术趋势的专家组成的原因之一。
虽然理想情况下核心团队可以推动这一进程,但它不是一个可扩展的解决方案,因为核心团队的开发人员只占全体开发人员的一小部分。
可行解决方案
应对和探索最新技术趋势的责任不应该只由核心团队来承担。每个小组的开发人员都应该对新事物充满热情。此外,如果我们不让其他小组的开发人员成为探索某些新技术的先行者,我们也是在打压他们。
虽然核心团队有责任向所有人部署最新技术,但每个团队(包括特性团队)都应该有试验新事物并提出建议的自由。
这种自由很棒,因为它可以跨团队进行可扩展的探索活动。并非所有新学到的技术都应该被采用。从特性团队中吸取的教训可以帮助组织过滤掉不适合的技术。那些表现很出色的技术可以推荐给核心团队,后者可以考虑让其他团队也采用它。
当然,出现相互矛盾的技术时,核心团队是仲裁者并决定哪个应该优先采用。
8 总结
技术债管理团队是组织希望扩展产品开发工作时必不可少的重要团队。我们可以将其命名为核心团队、基础设施团队、架构团队,甚至像 SWAT Team 这样有趣的名称。
为了确保可扩展性,核心团队需要在强制的一致性和放松的灵活性之间做出平衡,对特性团队提供适当的支持。这种错综复杂的平衡只能与特性团队之间紧密协作才能实现,这需要团队具备稳定出色的技术能力,同时还要妥善管理利益相关者事宜。
虽然核心团队可能没有任何直接、有形、面向客户的外部输出,但它的贡献对整个产品开发工作的成功都非常关键,所以应该是可见的。如果我们能够量化它的工作,那将进一步确保团队的贡献可以持久,并提升团队的士气。
确保产品技术健康水平的责任不应仅仅由核心团队承担。所有团队在产品的技术进步过程中都扮演着重要的角色。核心团队负责仲裁和促进流程,确认所有团队的重点方向。
组建这样一个核心技术债管理团队并不容易,维持和扩展它是更难的事情。但是,如果我们真的想扩大我们的开发规模,这样的团队是必不可少的。
关注我,紧跟本系列专栏文章,咱们下篇再续!
作者简介:魔都国企技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主,编程严选网创始人。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。
参考:
#24秋招避雷总结#