企业中顶级数据团队的角色最佳比例
随着数据团队范围的扩大,团队中工作的人数也在增加。这在很大程度上是件好事,数据团队现在推动着业务关键型数据产品的发展,而不仅仅是回答临时问题。但这也引发了一些问题,例如“我们是否在投资基础和洞察力之间取得了适当的平衡”以及“考虑到我们取得的成果,我们的运营效率是否与同行一样高”。
本文研究了40 个顶级数据团队中数据角色的分布,以帮助回答这些问题。
一 数据角色分类
数据角色有各种不同的名称。虽然数据工作并不局限于特定的职位,但通常可以分为以下几类。
数据洞察— 数据分析师、产品分析师、数据科学家
数据工程——数据工程师、数据平台工程师、分析工程师、数据治理
机器学习——机器学习工程师
数据团队的职责通常比较模糊,因此很难在各公司之间进行比较,求职者也更难了解他们的期望。例如,有些公司将数据科学家的头衔用于研究和机器学习方面的人员,而有些公司则将分析师的头衔完全替换为数据科学家。
公司中有很多分析师,例如财务和信贷部门的分析师,这些人通常不属于数据团队,因此在我们的分析中,我们仅将数据和数据产品分析师归类为数据团队。机器学习人员也很难分类。有些公司将机器学习报告线归入工程部门,而有些公司则将他们报告给数据组织。为简单起见,我们将机器学习角色归类为数据团队。
二 顶级公司的数据角色构成
一个常见的讨论话题是洞察角色和数据工程角色之间的比例。如果过度依赖洞察角色,可能会面临拖慢所有人进度的风险,因为数据平台的质量开始下降。如果过度依赖数据工程师,你可能会拥有一个世界级的数据平台,但没有能够推动业务影响的洞察或数据产品。
在我们调查的 40 个数据团队中,洞察职位人员的平均比例为 46%,略高于数据工程职位的 43%。
这些数字因公司而异,部分原因是角色定义的影响。一些公司避免使用分析师,而是将每个人都称为数据科学家。其他公司对数据和分析工程师的工作开始和结束有不同的界限。因此,分析工程师比例较低的公司不一定在数据建模方面投入较少。这项工作可能只是分析师日常工作中的一部分。
我们只需看几个例子,就能明白在公司之间比较时需要多加小心。这些例子还强调,最佳比率可能会因公司的优先事项而有很大差异。
Revolut拥有大量分析师,其中许多分布在不同的市场,从事金融犯罪和信贷等领域的工作。
Zendesk拥有一支庞大的机器学习团队,符合该公司最近将重点转向“人工智能时代全球最完整的 CX 解决方案”的目标
Nubank现在将所有数据分析师称为分析工程师,以表明其专注于更好地将既定的软件工程原理和数据建模技术应用于所有业务领域。
三 按公司规模划分的数据团队构成
公司优先级因规模而异。成长阶段的公司可能专注于优化决策速度和支持新产品发布。最近经历了 IPO 的更成熟的公司可能更注重准确报告、合规性和安全性。
我们可以将公司划分为不同的组,以进一步了解其如何随公司规模而变化。
数据团队少于 35 人的中期增长阶段公司(例如 Typeform、Brex 和 Personio)
大型公司,通常拥有 35-100 人的数据团队来进行 IPO(例如 Notion、Miro 和 N26)
大规模——规模更大的企业、上市公司和拥有 100 人以上数据团队的大型企业(例如 Zendesk、LEGO 和 Nubank)
有两件事很突出:
中型数据团队中担任数据工程职位的人员比例明显较高。这可能表明需要一个核心平台供分析师和工程师使用,但洞察也可能更多地由数据团队以外的人员(例如产品经理和工程师)完成。
规模化公司在机器学习岗位上的人员比例明显更高。在我们的研究中,对此的一个解释是,他们更有可能找到适合其机器学习实施的产品市场,并能够展示明确的投资回报率。这意味着最初作为小型实验团队的团队现在需要更大的团队来维持和持续投资。
最后,60% 的规模部分具有数据治理功能,而其他部分只有 20%。这符合他们的成熟度水平,通常需要采用结构化的方法来管理 DataOps。
小结
我们研究了 40 个顶级数据团队中数据角色的分布情况。每个类别的人员中位数比例为洞察类 46%、数据工程类 43% 和机器学习类 11%。这些数字应谨慎对待,因为不同公司对数据角色的定义差异很大。我们还得出结论,没有一种适合所有公司的一刀切比例,但最佳比例可能会因公司优先级、成熟度阶段和规模而有很大差异。
本文来自微信公众号“数据驱动智能”(ID:Data_0101),作者:晓晓,36氪经授权发布。















