数据飞轮：打造数据驱动的规模化之路

多年来，数字世界的领导者一直在采用数字技术来组织他们的工作，统治业界多年的数据中台建设正是其一。这些技术使团队能够更快地对新信息做出响应，从而减少浪费。然而，这些技术往往被忽视的一点是，它们在实时学习和持续改进结果方面的潜力。一旦开始建立更相关的客户细分，就必须能够快速定制数字渠道以满足每个用户的需求，因为沉重而缓慢的系统只会带来阻碍。要有效地做到这一点，我们需要理解数据飞轮的概念。

什么是数据飞轮？

数据飞轮是一种现象，产品或过程的动力由于数据的战略使用而以加速的速度增加。数据飞轮最常见的用例之一是推荐系统。像Netflix这样的服务因其“为你推荐”部分而闻名，在那里会向用户展示一系列特别挑选的电影或电视剧。一开始，使用的是非常简单的启发式或基于规则的算法（例如，显示10部最受欢迎的电影），通常对所有用户的推荐都是相同的。一旦公司收集了足够的用户观看喜好数据，他们就可以利用这些数据来训练机器学习模型（预测引擎）。任何推荐引擎的第一个版本往往过于简单，但现在推荐是为每个用户完全个性化的。这改善了用户体验，从而提高了保留率和口碑宣传，吸引了新用户使用该服务。更多的用户产生了更多的数据，公司可以利用这些数据来改进其预测引擎，这就形成了一个良性循环：

这个过程最关键的部分是动力往往以加速的速度增加，这是竞争对手很难赶上的主要原因之一。比如说，随着谷歌的搜索引擎变得越来越强大，它吸引了更多的用户，反过来又使其搜索引擎变得更好。与此同时，其他搜索引擎如Bing、雅虎或Yandex则难以跟上。数据飞轮有可能为率先利用它的创新公司带来惊人的回报，这也是实现数据或AI项目正向投资回报率的两种主要方式之一。

数据投资回报率

过去十年中，数据、机器学习和人工智能引发了大量炒作，但许多公司和行业未能实现最初的预期。然而许多公司在对数据和人工智能项目如何实际产生价值缺乏清晰理解的情况下盲目投入其中。公司通过数据和人工智能获得投资回报率的两种主要方式是：

首先是关键能力，即专注于建立利用数据的长期技能、资源和文化的公司将更成功地将数据转化为实际的业务价值。

其次是数据支配力，这对应于之前的例子，其中一家公司在其行业中成功激活了数据的良性循环，数据的持续流动每天都能推动产品的快速改进，使其他公司更难竞争。

这两个概念通常一起发挥作用。能够实现数据支配力的公司通常是通过培养其关键能力来实现的。数据支配力通常指的是之前提到的算法数据飞轮。数据用于训练一个机器学习模型，随着更多数据的训练，它变得更加强大。这意味着你今天不必是最好的或最强大的，只要比你的竞争对手更快地学习并将新知识纳入改进你的产品、服务和内部流程中。

实验：推动数据飞轮的动力

“成功的真正衡量标准是能够在24小时内完成的实验数量。”这句话来自托马斯·爱迪生，但得到了谷歌、Airbnb、Netflix和亚马逊等公司的高层领导的支持。杰夫·贝佐斯曾著名地说：“亚马逊的成功取决于我们每年、每月、每周、每天进行的实验数量。”亚马逊前董事和Intuit联合创始人斯科特·库克分享说，雅虎的前高管将谷歌的成功归因于其在规模上进行实验的天生能力：“[谷歌]只是比我们快。他们尝试了管理，所有管理所做的事情，但我们没有那个实验引擎。”斯科特·库克开始关注实验，因为他注意到他和他的团队所做的许多决定实际上并不好。他决定花一些时间研究丰田，以了解一个织机制造商如何在已经有多家成熟的汽车公司生产汽车的时代决定进入汽车业务，并且仍然比他们更好。他与几位哈佛教授合作，他们发现丰田“通过一系列庞大的实验来运作自己”。这使公司能够比其竞争对手更快地学习，从而从弱者变为汽车行业的领导者。

实验的力量在于它能够抵消我们的不良决策能力。微软、谷歌、Netflix、Slack等公司的实验专家发现，大多数团队的实验成功率为10-33%，其中大多数处于较低水平。换句话说，我们可以预期70-90%的工作由于不佳或甚至负面的结果而被抛弃。“大多数在客户网站和应用程序上运行受控实验的人都经历过这个令人谦卑的现实：我们在评估想法的价值方面表现不佳。”

总结

事实上，我们并不擅长评估新想法的价值，但我们可以利用实验快速从成功和失败中学习。有效地、规模化地做到这一点，可以让公司在其核心产生一个强大的数据飞轮，在那里学习发生得既快又自然。除此之外还应该聪明地选择要使用的工具，以便尽快从数据中提取价值。尽量寻找能够整合你已经生成的数据的工具，然后让公司中的每个人都可以轻松地运行实验并对这些数据采取行动。

客户是有真实需求、个性、痛点和激情的人。我们有责任弄清楚他们是谁以及我们的工作如何融入他们的生活，否则数字只是数字，真正重要的是我们对这些数字做了什么。

数据飞轮：打造数据驱动的规模化之路

什么是数据飞轮？

数据投资回报率

实验：推动数据飞轮的动力

总结

全站热榜