平原期实现4年内DAU增长4.5倍,Duolingo是如何做到的?

神译局·2023年04月13日 09:15
已经有很多产品从 Duolingo 身上汲取了灵感。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:Duolingo(多邻国)是一款帮助用户学习语言的 app,经过 6、7 年的发展之后,这款应用的用户增长逐渐趋于平缓,日活用户数(DAU)的增长也降到了个位数。后来,通过对用户群的细分建模,推出排行榜,重新把焦点放在推送通知以及优化“连胜(streak)”功能等,他们在四年内让 DAU 增长了 4.5 倍。此文是他们具体做法的介绍,对于希望找到增长突破的你来说,可以提供非常好的借鉴。文章来自编译。

几个月前,我参加了一场小型活动,Jorge Mazal(Duolingo 的前 CPO)分享了 Duolingo 重新让增长势头得以加速背后的故事。故事很吸引人。我以前从来没听过这样的增长故事——成熟产品还能增长 4.5 倍,只用少量产品变更驱动,植根于一个创新的增长模式,而且解释详尽到可操作的地步。我问 Jorge 是否愿意向更广泛的受众分享(并拓展)这个故事,很高兴他同意了。有很多产品已经从 Duolingo 身上汲取了灵感,我怀疑这个故事只会令这种趋势加剧。

以下为 Jorge 的分享:

我是在 2017 年底加入 Duolingo的,担任的是产品负责人的角色。Duolingo 已经是全球下载次数最多的教育 app,拥有数亿用户,履行着“为全世界提供优质且公平的教育机会”的使命。但是,我们的用户增长正在放缓。到 2018 年年中,日活用户数 (DAU) 的增长率已经降到个位数,鉴于公司过去的增长都是爆发式的,这种情况令人不安。对于渴望看到快速货币化增长的投资者来说,这是个问题。

在这篇文章里,我会介绍我们早期经历的一些失败,然后讲一下帮助我们扭转增长颓势的第一个重大胜利,包括推出排行榜、重新把焦点放在推送通知以及优化“连胜(streak)”功能。这些,再加上产品和营销方面的其他几项努力,帮助我们在四年内将 DAU 增长了 4.5 倍。有机用户的强劲增长推动了 Duolingo 最后顺利实现 IPO。

本文将深入探讨这一旅程。希望通过分享这项工作,能够帮助大家更快地找到自己的增长突破口。

第一阶段:增加游戏化

我们重振增长的第一次尝试聚焦在提高留存率上面,也就是解决我们的“漏桶”问题。我们优先考虑旧用户的留存问题,因为我们获取的新用户都属于有机用户(编者注:不容易流失),而且在当时,我们没有明显的杠杆来推动新用户的增长。此外,我们当中部分人猜测可以通过游戏化来提高留存率。我觉得这种做法是对的,有两个主要原因。首先,Duolingo 已经成功实施了多项游戏化机制,比方说主屏上的进度系统、连胜以及成就系统。其次,在当时,顶级数字游戏的留存率比我们的产品要高得多,我认为这就是我们还没有达到游戏化影响力上限的证据。

Duolingo游戏化的主页与成就页

我跟我们的首席设计师一起做了一个简短的演示,终于说服了高管团队的其他成员,得到了足够的支持来建立一支新团队,也就是游戏化团队。这支团队由工程经理、工程师、设计师、APM(产品经理助理)以及我组成。

但有个小问题:我们不知道哪种增量式游戏化机制(incremental gamification mechanics)适合 Duolingo。

当时我们的团队迷上了一款叫做 Gardenscapes 的游戏,这款游戏与 Candy Crush 的移动三消益智游戏类似。于是这款手机游戏成为我们的第一个灵感。

Gardenscapes 三消关卡

我们刚开始研究 Gardenscapes 里面不同的游戏机制时,其实自己都不知道想找什么——我们只知道 Gardenscapes 似乎比 Duolingo 的粘性更高,而且我们看到了二者之间存在一些相似之处。三分钟的 Duolingo 课程感觉与 Gardenscapes 三消关卡类似,与 Gardenscapes一样,Duolingo 也利用了进度条来提供可视化的反馈,告诉用户离完成课程还有多远。不过,Gardenscapes 会把进度条与步数计数器配对使用,但 Duolingo 没有这么做。步数计数器要求用户只能用有限的步数来通过一个关卡,这给游戏玩法增添了稀缺感和紧迫感。我们决心引入计数器机制到我们的产品当中。我们限制了用户回答的机会次数,要求他们在重新开始课程之前需正确回答提出的问题。

增加这个计数器花了我们团队几个月的时间。随着更新版的发布,我满怀期待新功能能够一炮走红。令人沮丧的是,所有这些努力并没有收到积极回报。我们的留存率并没有变化。DAU 没有增加。我们几乎得不到任何用户反馈。我感到非常泄气。这次行动对团队的打击最大。结果出来后,我们很快陷入了分歧。部分想继续迭代这个想法,而另一些人则想改变方向。团队几乎马上被解散了,这个想法也被放弃了。太糟糕了。如果说这次失败有什么收获的话,便是我学到了很多其他方面的知识,关于企业文化的,以及如何改进我的个人领导风格的——不过那是另一篇文章了。

我们的第一次尝试希望用更多的游戏化机制来重拾增势,结果却导致了一场垃圾箱大火。

第 2 阶段:推荐

因为游戏化努力失败而焦头烂额后,我们对提高留存率已经完全放弃了,开始组建了一支专注于获取新用户的新的产品团队,名字叫做获取团队(Acquisition Team)。彼时,Uber 在用户获取方面做得很好,据说增长主要是因为有推荐计划。受此启发,我们也建立了一个与 Uber 类似的推荐计划。奖励是可免费订阅我们的高级订阅服务 Super Duolingo(当时叫做 Duolingo Plus)。在我们看来,这个交易似乎很划算!

我们实施了该计划,并指望我们的第二次尝试能够取得更大的成功。结果相反,新用户仅增加了 3%。结果是积极的,但不是我们想要的那种突破。尽管如此,这支团队仍在加倍努力推进,不断迭代推荐计划,同时还做出了其他一些赌注,但无济于事。

随着团队不断迭代,在我看来情况已经很清楚了,我们得找到一种不同的方法来解决增长问题。

是时候重整旗鼓了

在短短几个月内,这些背靠背的失败的结果使我开始反思,琢磨怎么才能对产品更好地下注。

回过头来看,为什么 Gardenscapes 步数计数器不适合我们的产品已经很清楚。用户玩 Gardenscapes 的时候,每走一步感觉都像做出一次战略决策,因为你必须克服不断变化的障碍才能找到通向胜利的道路。但完成 Duolingo 课程并不需要做出战略决策——你大多时候要么知道问题的答案,要么不知道。因为不需要任何策略,所以 Duolingo 的步数计数器只是一个无聊的、不必要的麻烦。Duolingo 用错了游戏化机制。我意识到我太过关注 Gardenscapes 与 Duolingo 之间的相似之处,却没有考虑到二者之间存在根本差异的重要性。

没过多久,我也明白了为什么我们的推荐计划未能带来像 Uber 那么成功的结果。推荐之所以对 Uber 行得通,是因为乘客一直在使用“按需支付”的付款系统来支付车费,免费搭便车是可持续的激励。对于 Duolingo 来说,我们试图通过提供一个月免费的 Super Duolingo 来激励用户。但是,我们最优秀、最活跃的用户本来就订阅了 Super Duolingo,而且我们不能在他们已经订阅了的情况下提供免费一个月使用。我们的策略需要依赖我们最好的用户,但另一方面奖励事实上又把他们排除在外。

这两种情况我们都是借鉴了其他产品成功的功能,但借鉴的方式错了。我们没有考虑到环境的变化会影响功能的成功。从这些尝试当中,我意识到自己对如何明智地借鉴其他产品的点子要有更好的理解。现在,在思考要不要采用一项功能时,我会问自己几个问题:

  • 为什么这项功能用在这个产品身上就能有效?
  • 为什么这项功能在我们产品的背景下有可能会成功或失败,也就是能不能很好地转化?
  • 这项功能要想在我们的产品环境下取得成功,需要做出哪些调整?

换句话说,在采用新功能时,我们需要运用更好的判断来适应。在这个领域更加系统化会对我们选择什么样的游戏化机制产生很大影响。我们可能会被劝诫不要把全部注意力都放在推荐上。我致力于确保我们的下一次尝试更加有条不紊。我们需要更好地根据数据、洞察与基本原则做出决策。

第三阶段:利用数据与模型

Duolingo 一直都很擅长收集数据,尤其是在支持 A/B 测试方面。但是在利用数据产生洞察方面企业没有下太大的功夫。鉴于我在 Zynga 与 MyFitnessPal 了解过如何运用数据,我觉得我们可以利用 Duolingo 的数据来找到北极星指标,然后实现所需要的突破。

我在 Zynga 与 MyFitnessPal 的工作经历给了我们灵感,我们了解了如何按参与度对用户进行细分和建模。Zynga 会将用户分成不同群体,并根据以下的每周留存指标来衡量用户留存情况:

  • 当前用户留存率 (CURR):如果用户在过去两周内每天都访问该产品,则用户本周还会回来的机率
  • 新用户留存率 (NURR):如果用户上周是该产品的新用户,那么他们本周还会回来的机率
  • 重新激活的用户留存率 (RURR):如果用户上周重新激活自己账号的话,则该用户本周还会回来的机率

后来,我在 MyFitnessPal 工作时,我发现他们采用并扩展了 Zynga 在留存方面的工作。他们不仅利用了 CURR、NURR 与 RURR 等指标来衡量增长,还针对未来场景建模。为此,他们添加了 SURR:

  • 复活的用户留存率 (SURR):如果用户上周复活(之前有很长一段时间不来),则他们本周还会回来的机率

我假设,我们 Duolingo 可以将这些指标作为起点,建立更复杂的模型,并利用这一模型来识别出北极星(North Star)指标。我们与采集团队的数据科学家和工程师经理合作,提出了以下模型。我们采用了与 Zynga 和 MyFitnessPal 一样的留存率,但从每周视图调整为每日视图,并添加了更多的指标。

这些块,或一个个的桶,代表的是有着不同参与度的不同用户群。曾经用过该产品的每一位用户在任何一天都只能属于某一个桶内。这意味着该模型里面的桶是 MECE(互相排斥,完全穷尽)的关系,共同代表了曾经使用过 Duolingo 的整个用户群。箭头表示的是用户在不同的桶之间的转移(这些桶包括 CURR、NURR、RURR 与 SURR,但改进成立每日留存率而不是每周留存率)。通过用户群与转化方向,这个模型建立起一个近乎封闭的系统,只有新用户才会打破这个系统。

如此一来,将模型的前四个桶相加就得到了 DAU。这些桶定义为:

  • 新用户:第一天与 app 互动的用户
  • 当前用户:今天与 app 进行了互动,并且在过去 6 天内至少互动过一次的用户
  • 重新激活的用户:离开 7-29 天内第一次重新与 app 互动的用户
  • 复活的用户:离开 30 天或更长时间后第一次与 app 互动的用户

其余三个桶代表今天并未活跃且不活跃程度各不相同的用户。

  • 处于风险之中的 WAU(At-risk WAU):今天并未活跃,但在前 6 天当中至少有一天曾活跃过的用户 At-risk WAU + DAU = WAU
  • 处于风险之中的 MAU(At-risk MAU):在过去 7 天内不活跃,但在过去 23 天内至少有一天处于活跃状态的用户 At-risk MAU + WAU = MAU
  • 休眠用户:过去 31 天或更长时间内不活跃的 MAU + 休眠用户 = 总用户群

事实上,DAU、WAU 和 MAU 这些指标很容易就可以利用这些桶计算出来,这使得逐步对它们进行建模变得很容易。这是这个模型的一个关键特征。此外,通过操纵箭头表示的指标率,我们可以模拟出随着时间的推移改变这些指标所产生的复合影响与累积影响;换句话说,指标率是产品团队可以用来提高 DAU 的杠杆。

把模型建立起来之后,我们开始每天记录数据快照,从而建立起过去几年各个用户桶和留存率在每一天的演变历史情况。有了这些数据之后,我们就可以建立起一个前瞻性的模型,然后进行敏感性分析,从而预测出哪些杠杆会对 DAU 增长产生最大的影响。我们对每个指标进行了模拟,在三年内每季度都将单个指标上调 2%,同时保持所有其他指标不变。

下面是我们第一次模拟的结果。模拟显示出每个影响指标 2% 的小变动会对预测的 MAU 和 DAU产生何种影响。

我们马上就能看出 CURR 对 DAU 产生了巨大影响——是影响第二大指标的 5 倍。事后看来,CURR 的发现是有道理的,因为当前用户群有一个很有趣的特征:保持活跃的当前用户会返回到同一个桶里面。

这会产生复合效应,这意味着 CURR 更难改善,但一旦改善,就会产生更大的影响。基于这一分析,我们知道,要想实现想要的战略突破,CURR 是我们必须改善的指标。我们决定建立一支新团队,也就是留存团队,并以 CURR 作为其北极星指标。

聚焦在 CURR 的最大好处之一是我们决定不再应付以前看起来最重要的东西,尤其是新用户的留存。对于一家花费了数年时间率先对新用户进行大量增长实验,并取得了巨大成功的公司来说,这是一次巨大的思维转变。

另一条重要经验是看到指标对 DAU 与 MAU 所产生影响的巨大差距;比方说,CURR 对 DAU 的影响是其对 MAU 影响的 6 倍。iWAURR(非活跃 WAU 重新激活率)是撬动 DAU 的第二大杠杆,但在对 MAU 的影响方面仅排名第四,效果比不上增加新用户以及复活用户。这意味着,有时候,如果我们希望看到 MAU 获得显著改善,我们仍然需要找出新用户获取的新的增长向量。但目前,我们的重点只放在改善 DAU 上,因此我们优先考虑 CURR 这个增长杠杆。结果证明这个选择是正确的。

排行榜

方向明确之后,我们回顾了模型数据历史以及几年前的 A/B 测试,看看我们是不是无意间做了什么改善 CURR 的事情。令人惊讶的是,我们一件都没做。事实上,CURR 多年来一直都没有改善。我们必须依据第一性原理找出改善 CURR 的首要步骤。

我仍然认为游戏化是尝试提高留存率的好起点。我们模仿 Gardenscapes 风格的步数计数器虽然失败了,但这并不能作为游戏化对 Duolingo 没有用的证明——通过这个,我们了解了步数计数器不过是一次笨拙的尝试罢了。但这一次,我们会更有条理、更明智地应对我们增加或借鉴的功能。我们将确保吸取了之前在游戏化方面所做努力的经验教训。

经过一番考虑之后,我们决定把宝押在排行榜上。我来告诉你 why 与 how。Duolingo 已经推出过一个排行榜,那是用来给用户与家人朋友竞争的,但不是特别有效。根据我在 Zynga 的经验,我觉得应该有更好的方法。我当时开发 Zynga 的《开心农场2》(FarmVille 2)这款游戏时,里面也有一个排行榜,跟 Duolingo 现有的排行榜类似,用户可以跟朋友一起竞争。以我作为一名玩家的个人经验,我曾假设竞争对手互动的接近程度比个人关系的亲密度还要重要。我认为在很多用户的朋友已经不再活跃的成熟产品当中,这种情况更加明显。从我们在 Zynga 的测试情况来看,这个想法被证明是正确的。基于此,我觉得排行榜系统,一个跟我在 Zynga 帮助设计的系统类似的排行榜系统,能够在我们的产品环境下取得成功。

《开心农场2》的排行榜还有一个“联赛”系统。除了有机会登顶周排行榜以外,用户还有机会参与一系列联赛(比方说,从青铜联赛进阶白银联赛乃至于黄金联赛)。联赛给用户代理了更大的进步感和奖励感,这是游戏设计不可或缺的元素。这些举措还逐步增加了参与度,因为参与的用户会一周接一周地升级到更具竞争力的联赛。我们认为 Duolingo 的现有产品可以很好地借鉴这些功能,因为它直接利用了人类都有的那种激励因素,也就是喜欢争强好胜。

前一周参与度相似的用户会匹配到一起。本周末的顶级玩家下周将可以升入到更高级别的联赛。

不过,并不是说《开心农场2》排行榜的一切都可以照搬到 Duolingo 上面。我们必须自己做出判断,让这种游戏机制适应 Duolingo 的环境。在《开心农场2》里,参与排行榜竞争除了完成核心游戏任务以外还需要做其他任务。但这种机制对 Duolingo 的语言学习并不适用。所以我们将这一块刻意排除在外。在 Duolingo 环境下,更多的任务只会给语言学习增加不必要的复杂性。我们刻意让排行榜尽可能休闲,尽量减少阻力;用户可自动选择加入,并且只要持续参与常规的语言学习,就可以晋级到顶级联赛的榜首。通过保持游戏机制的兴奋度,但同时让玩法比《开心农场2》更加简单,我们觉得我们在采用与适应之间已经做出了适当的平衡。

排行榜功能对指标影响巨大,几乎立竿见影。总体学习时间增加了 17%,参与度高的学习者(每周 5 天,每天至少花 1 小时学习的用户)数量增加了两倍。此时,我们还没有弄清楚如何计算 CURR 的统计显著性,但我们看到传统的留存指标(D1、D7 等)已经有了实质性的改善,并且具有统计显著性。展望未来,排行榜功能成为了我们改进指标的载体,团队至今仍在继续优化这一功能。同样重要的是,排行榜是我们留存团队的第一个突破!

推送通知

留存团队完全有动力去寻找更多的机制来保持当前用户的参与度以及每天坚持练习的动力。他们开始研究的另一个领域是推送通知。基于前几年大量的 A/B 测试,Duolingo 已经确定通知可以成为增长的重要载体,但多年来,这种影响已经趋于平稳。随着重新焕发活力的团队不断冒出新想法,我们觉得现在是重新审视这个要素的合适时机。

当我们开始深入研究这个问题时,有一个原则变得至关重要。这是来自 Groupon 首席执行官的一个警示故事。他告诉我们的首席执行官 Luis von Ahn,很长一段时间以来,Groupon 都会坚持每天发一封电子邮件通知。但他们的团队在想,多发几封电子邮件是不是可以改善指标。这位 CEO 最终让步,允许团队测试一下每天给每位用户多发一封电子邮件。结果测试大大提高了目标指标。品尝到甜头之后,Groupon 开始得寸进尺,发出更多的电子邮件,最多的时候甚至试过一天发五封。突然之间,他们的电子邮件渠道就失去了大部分效力。后来慢慢地,Groupon 不断变本加厉的电子邮件测试基本上把这一渠道都给毁了。激进地对电子邮件与推送通知进行 A/B 测试是有风险的,一个经常被低估的风险是这会导致用户一怒之下退出这一渠道;即便你终止了测试,但这些用户也永远不会回来了。如此反复很多次之后,这个渠道就完蛋了。我们要避免这样的结果。对于我们的推送通知,我们设定了一条基本规则:要呵护好这个渠道。

考虑到这一限制,在优化时间、模板、图像、文案、本地化等维度,我们决定赋予团队很大的自由度,但如果没有充分的理由以及获得 CEO 的批准,他们不能增加通知的数量。慢慢地,通过无数次迭代、A/B 测试以及择优算法(bandit algorithm),这支团队取得数十项中小型战果,集腋成裘,我们的 DAU 慢慢有了可观的增长。

2019 年Duolingo风靡一时的“pushiness”模因

连胜

在寻找更多增长方法的过程中,留存团队的助理产品经理开始探索留存与特定 Duolingo 功能的使用之间是否存在很强的相关性。他发现,如果用户连续使用了 10 天之后,他们离开的可能性就会大大降低。显然,这样的结论很多只是相关性和与选择偏差的结果,但我们觉得这样的洞见很有趣,足以让我们再次投资去改进此功能。

连胜的概念非常简单:向用户展示他们在 app 上完成任何一项活动的连续天数。但事实证明,围绕着连胜,其实有很多优化的机会,多得惊人。

我们的第一个重大胜利是连胜拯救者通知——如果用户的连胜记录即将终结,我们就会用这个通知来提醒用户。这个深夜发送的通知证明,对连胜的优化加倍下注确实能收到相当大的好处。在此之后,我们又进行了多项改进:日历视图、动画、连胜冻结的调整,以及连胜奖励等。这些举措帮助改进了原先对连胜的构想,并显著提高了留存率。

迄今为止,连胜功能是 Duolingo 最强大的互动机制之一。大家在说起自己使用 Duolingo的体验时,经常会提到自己的连胜纪录。我最近遇到一位用户告诉我,“我的连胜纪录达到了 1435 天!”并补充说,“而且没有过被冻结的情况!”他有吹牛的资本,因为他每天坚持学习语言已经近四年了。

连胜之所以管用有多种原因。原因之一是随着时间的推移,连胜会增加用户的积极性;连胜时间越长,保持连胜的动力就越大。在谈到用户留存时,这正是我们希望用户出现的行为。学习者每天来到 Duolingo,每一天跟前一天相比都更渴望重新回来,进而增加了留存率以及 DAU。作为一条基本经验,我们在连胜机制方面的成功进一步向我们表明,从现有功能身上我们也能取得重大胜利。我们能够看到在重大突破与快速优化上的价值。而一支 A+ 团队往往能够做到两者兼而有之。

增长不止于 CURR

我们并没有停留在 CURR 的改善上;我们有一种偏执的想法(但属于很健康的那种),就是觉得 CURR 会在某个时候达到天花板,所以迟早我们必须找出新用户获取的增长手段。留存团队一直专注于提高 CURR,但作为企业,我们要不断加大对增长的投资,通过建立越来越多的产品和营销团队,去寻找新的(用于留存和获取用户)的办法。幸运的是,这些办法当中有些奏效了,其中包括国际扩张、建立社交功能(获取团队最终选择了这个方向并取得巨大成功)、加速课程内容的创建、与网红合作、增加我们在学校的影响力、投资(一点点)在付费用户获取上,并利用 TikTok 作为传播渠道。这里的每一项都值得做一次案例研究。

总体结果

通过我们四年多的努力,我们最终将 CURR 提高了 21%,这意味着我们的最佳用户的日流失率降低了 40% 以上,再加上我们在其他方面的成功举措,我们的 DAU 增加了 4.5 倍。去年是 Duolingo 史上增长最快的一年。用户群的质量也有所提高;连续 7 天或更长时间活跃的用户占比增加了近 3 倍,达到了 DAU 的一半以上。这意味着不仅 Duolingo 现在拥有更多的活跃用户,而且这些用户更有可能不断回来、推荐他们的朋友并订阅 Super Duolingo。这种增长是 Duolingo 得以成功上市的关键。

最后思考

希望本文能为你提供所需的灵感,助你为产品找到新的增长载体。如果你能从我在 Duolingo 的经历中吸取到什么经验教训的话,我希望你能基于自己的最佳判断有选择性地应用到你自己的产品环境中。不要盲目相信 Duolingo 或任何其他公司所做的事情。祝你实验快乐!

译者:boxi。

+1
61

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

新能源汽车时代,长城汽车却掉队了。

2023-04-13

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业