Stack Overflow 衰落是人工智能崛起的必然还是另有起因?
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按: Stack Overflow曾经是程序员的不二去处,但去年这家编程问答网站的流量跌去了将近一半。很多人把原因归咎于ChatGPT为代表的人工智能抢走了这家网站的饭碗。果真如此吗?这是原因之一,但不是唯一的原因。文章来自编译。
最近有篇文章在网上传得比较火,文章的标题叫做《Stack Overflow 的衰落》,里面详细介绍了这个知名的编程问答网站,在过去一年半的时间里流量是如何下降了 35-50% 的。
最明显的答案是人工智能,因为 ChatGPT 作为编码助理确实非常有用。不过,我亲爱的开发者,这并不完全正确。
如果我们仔细观察一下,就会发现最剧烈的下降始于 2022 年 4 月左右,但 ChatGPT 是在 7 个月后的 11 月才发布的。虽然每年夏季(学校放假)和冬季(工作假期)确实会出现流量下降的情况,但 2022 年 4 月开始的下降趋势一直持续,而且只会变得更糟。
2022 年 4 月开始的自由落体。
我看到的是永久性的下降,这意味着……人工智能已经永远地取代了开发者。
开玩笑的,答案其实是,这种下降很大程度上是日积月累造成的,其中部分是 Stack Overflow 本身造成的。
Stack Overflow 逐渐衰落的原因有 4 个。
1. Google Analytics的变化
第一个原因实际上是最快的原因。 Stack Overflow 其实并没有损失了 50% 的流量,数据更像是 35%。 2022 年 5 月,Google Analytics 根据隐私法更改了 Cookie 的存储方式,据报道此举导致流量损失了 15%。
2. Stack Overflow对其用户充满敌意
就提问题的去处而言,Stack Overflow是互联网上最具毒性和敌意的论坛之一,这一点令人惊讶,但他们呈现的是一种被动攻击的方式。十多年来,我们已经看到了有数千起对 Stack Overflow 的投诉,因此 Stack Overflow 的敌意与衰落并不是什么新鲜事。
Reddit 上有数百篇关于 Stack Overflow 充满敌意的帖子。
近十年来,大家一直在谈论“Stack Overflow 的衰落”。
但今天,这一天似乎终于到来了。
这都是14年前的事了! 2009年!该网站的链接也已不复存在。
如果你试着在 Stack Overflow 上提问题的话,一般而言,它都会被标记为重复,然后提供一个绝对跟你的问题不重复的问题链接给你。或者问题确实是重复的,但确实从未得到解答的一个。
其他一些时候,有效的问题会被踩(downvote)。
如果你试着去回答,你也可能会被踩。
如果你想发表评论……等一下,你不能!因为你的karma还不够。
对于一个通过想象中的互联网积分进行严格把关的社区来说,论坛上存在着令人难以置信的不尊重行为,这一点不仅体现在投票上,还体现在人们的评论上,比方说人们被动地攻击你很蠢。
答案是对的,但乱点评的现象很常见。
虽然 Stack Overflow 在 2018 年的一项研究表明,Stack Overflow上面大约有 7% 的评论是不受欢迎的,但这其实已经足以吓退开发者做出贡献。
5% 到 10% 之间的发生率就会对社区产生重大影响。我们不妨粗略测算一下。如果典型的开发者每周都会访问 Stack Overflow 一次或两次来寻求解决问题,他们浏览的问题是有答案的,并且每个帖子(含问题与答案)都有两条评论(请记住,对于访客来说评论比答案的可见度更高) ,我们保守估计,访问 Stack Overflow 的开发者每个月都会看到 1 到 3 条语气居高临下、不受欢迎的评论。每个月一条不受欢迎的评论会赶走所有人吗?显然不会,因为 Stack Overflow 对很多人来说仍然是有用的。但它会让一些人相信在这里做出贡献是不值得的,下个月的评论将会说服更多的人退出。这还只是考虑了这些评论的读者;那些评论所针对的人的感受自然还要强烈得多。
这样就会导致这个网站对于大多数程序员来说基本上就是只读的。所以很多程序员跑到 Reddit去了,因为那里的编程社区要好得多。
或者现在,你甚至可以去上 ChatGPT,它会给你一个充满自信的答案,可惜那是错的,但看起来非常正确,然后你还得花 7 个小时调试代码,弄清楚它不起作用的原因。
3. Google Search现在给 Stack Overflow 的排名比较低。
Stack Overflow 在 Google 搜索结果的排序也有所下降,这一点无论是在数字意义上(不再总是排在第一位的结果)还是在“数字房地产”意义上(有时候甚至都不在屏幕上)都是如此。
我们不妨来做个小实验。让我们以 3 个最流行的编程问题为例,在隐身窗口向 Google 发起提问。
注意:不同的人测试所得结果可能会明显不同。个性化的 Google 搜索可能会多多少少也出现Stack Overflow排在第一位的情况,具体要取决于你的活动。
测试 1/3:“如何让 div 居中?”
Stack Overflow 在这里的搜索结果排名第三,但在我的标准 27 英寸显示器上,它出现的位置已经在页面的一半多了。
Stack Overflow 在这里的排名是第三。
测试 2/3:“yield 在 Python 里面是做什么用的?”
在 Stack Overflow 上面这是排名第五的问题。
Stack Overflow 在这里的搜索排名位第四,但我甚至不需要点击进去,因为谷歌的精选摘要(featured snippet)已经为我解答了。
如果我没有垂直向的显示器,我就得……滚动屏幕才能看见。
测试 3/3:“如何撤消本地 git commit?”
这是 Stack Overflow 上排名第二的问题。
问题在于:
谷歌提供了精选摘要,无需点击即可回答一些最常见的问题。
其他时候,Stack Overflow 甚至都不在页面的前 2 名或前 5 名链接之内。
精选摘要、相关问题以及 YouTube 视频也会被添加进来,这通常会将 Stack Overflow 推到屏幕的更低位置。
由于精选摘要和相关问题挤占了屏幕,Stack Overflow被挤到了屏幕的下半区。
数据显示,Google 搜索排名第一的结果夺走了全部点击量的 27.6%,而排名前 3 的结果则拿下了全部点击量的近 55%。
如果你不在前 3 位结果之内……流量就会呈指数下降。
流量的头部效应很明显
4.人工智能确实有影响
最后,还有一个显而易见的答案,也就是人工智能。 ChatGPT 实际上非常适合编码。目前我甚至都没有把它用在其他任何用途上。
从 2022 年 11 月 30 日以来流量的急剧下降来看,人工智能确实加速了它的下跌。
ChatGPT 是在 2022 年 11 月 30 日发布的。
这公平吗?其实不公平。 Stack Overflow 免费提供了所有这些数据,维护了这个网站数十年,然后 OpenAI 出现了,后者爬走了它的数据并在其上训练模型。无论你对 Stack Overflow 的用户和版主有何看法,运营这样的网站并不便宜。
这在将来可能会成为问题。随着在线询问和回答的问题越来越少,可供人工智能训练的数据也越来越少。如果来自人类的数据变少了,人工智能如何变得更好?因此,如果每个人都转向用 ChatGPT 来尝试调试那些晦涩难懂的 React 18 或 C++21 问题,那么当 C++72 或 React 37 出现时,我们可能会接手一个烂摊子。
对于未来的数据抓取者来说,这也不是一件容易的事。 为了应对人工智能数据抓取工具的威胁,Reddit 与 Twitter(X?)等公司开始对 API 收费。
但是,程序员更喜欢人工智能而不是 Stack Overflow 是有道理的。
人工智能的速度很快——你不需要等待问题得到解答。
人工智能很好——你不需要等待你的问题被标记为重复。
人工智能会礼貌地跟进你的要求 - 你不会因为提出问题或发布后续评论而被人骂很蠢。
但请记住一点——很多时候,人工智能都是错误的。不过,人工智能只是一种工具,而不是替代品。
未来
Stack Overflow 的衰落可能会继续,尤其是在谷歌搜索实验室处于测试阶段的情况下。现在你真不需要点击,甚至不需要阅读了。只需搜索并复制即可。
Stack Overflow 正在做AI的实验
为了对衰落的叙事做出回应,Stack Overflow 发布了 OverflowAI。
那么,Stack Overflow还能止住颓势,甚至东山再起吗?我们拭目以待。
译者:boxi。