72小时AI生存挑战,发生了什么?

五源资本·2025年06月19日 16:39
有人训练出AI朋友,有人建起虚拟直播间,有人在构建系统、调试插件的过程中耗尽预算……

7位来自不同背景的参与者——大厂产品经理、20岁大学生、独立开发者、大模型算法工程师、金鸡奖提名导演、AI博士生……在一个72小时的AI封闭空间,没有智能手机,无法使用APP、浏览器等互联网及移动互联网产品,只有AI工具和100元启动资金。他们需要靠AI活下来,最好还能创造点什么

2025年5月15-18日,经过了近三个月的筹备,五源发起的AI生存挑战最终在上海落地。

在72小时里,有人用AI训练出了一个AI朋友,有人写出了一首生存之歌,有人生成了影视作品,有人建起虚拟直播间,也有人在构建系统、调试插件的过程中耗尽预算……每一步都像在用AI“重写生活”。

在这里,吃饭、购物、搜索、表达,每一项日常操作都必须用AI“重新定义”;而所有现实世界的“外挂”——手机、扫码、微信、快捷入口——统统被屏蔽。玩家要学会用一种全新的语言,与AI共处、协作、挣扎、创造。

比结果更重要的,是这个过程中暴露出的问题与可能。AI可以帮助人类生存,但它真的能理解情绪、重建连接、解决孤独吗,我们可以看到哪些边界?

每位玩家进入房间时,仅配备一台联网电脑,一部用于紧急联系的非智能手机,电脑里预装了一些AI工具:

1、通用大语言模型

具备文本生成、对话交互、逻辑推理、知识查询等通用能力,可以成为玩家应对沟通、写作、规划、提问等任务的“主力工具”。

2、编程与开发辅助类工具

Cursor、Trae、本地Python环境等,部分技术选手基于此类工具开发浏览器、虚拟助手,或尝试打通物资购买、做网页、接API等操作。

3、多模态生成工具(图像 / 音频 / 视频 / 剧本)

支持选手进行内容创作、情绪表达、海报制作等任务。

禁用一切现有互联网与现实生活“外挂”:智能手机 / 浏览器 / 微信 / 社交媒体……

封闭空间内,吃饭、下单、搜索、沟通,一切日常生活的操作都需要被“重写逻辑”。每位玩家仅能使用AI工具解决生存所需,现实生活中常见的“便利入口”被彻底屏蔽——没有社交平台,没有扫码登录。

这不是一场比赛,更像是一场封闭试验。当平台与应用都被屏蔽,连点外卖都要重新搭建逻辑闭环时,AI的使用不再是“快捷键”,而更像是一种重新习得的工具。

也许没有标准答案,但过程中的每一个困惑与尝试,本身就是意义。

01 

虽然没赚到钱,

但让AI“看见”了电脑

陈睿轩和区瀚楠都20岁,在浙江大学读大一。我们在面试时候无意间发现他们本来就几乎形影不离,一起创业,于是这次也组成了同一组。作为AI native一代,探索各种AI技术已经是他们的日常。当被问及参加生存挑战的初衷,他们半开玩笑地说“可以三天不用上课”,但更重要的,是想借此机会探索当下AI的实际边界。

他们计划“用AI全自动接单赚钱”、“双倍开发时间,断崖式领先其他选手”。他们在兼职平台上挂出了多个任务:“帮你用AI画图、设计logo、处理编程难题”……试图用AI来选择接单、沟通、以及AI完成任务。

不过,由于实现路径复杂、资源受限,他们最终没能完成变现目标。“我们主线任务挺可惜的,一毛钱没赚到。”他们笑称,“但开发出了一个可以控制电脑的Agent,比BU(Browser Use)还厉害。”

在执行“让AI接活赚钱”这个计划的过程中,他们遇到了许多预料之外的技术难题,尤其是人机验证一度卡住他们超过10个小时。为了绕过这一障碍,他们先后尝试了四种技术方案:

第一套方案:Computer use tool 

初始设想是通过一个AI计算机使用工具来直接控制电脑。这个工具可以让AI实现与桌面环境进行交互,该工具提供了屏幕截图功能和鼠标/键盘控制,但由于这个工具还处于 内测阶段,没有相应的权限,所以导致只能被迫放弃 。

第二套方案:自研电脑控制Agent

转向用AI直接控制电脑的本地操作,通过模拟点击和键盘输入在本地设备上进行交互操作。遇到挑战是定位精度不足:AI能识别大概区域,但无法精准点击,频繁“点歪”。

第三套方案:自建图像识别通路

计划是使用开源框架本地部署AI视觉模块,通过定期截图+识别的方式理解界面并操作。由于网络受限和服务器资源不足,部署过程异常缓慢,只能转而构建简化版通路:截图后上传网页,再由Browser Use识别。

遗憾的是,该方法最终因“带不动”失败。他们打算回家继续迭代,甚至已购入服务器。

第四套方案:“简陋又愚蠢”的AI识别框框

最终他们尝试了一个最简路径:让AI直接识别屏幕中的可操作区域,判断并选择。 成功率低,但快速可验证。他们自嘲这是“最蠢的办法”,却也是当时最现实的选择。

陈睿轩解释说:“其实本质上是两种方案:第一种方案是想用开源‘躺赢’,第二种是自己做一双眼睛。”虽然没赚到钱,但确实让AI“看见”电脑了。

对于区瀚楠来说,这次AI生存挑战不仅是技术的应用实验,更是一种面向未来的主动探索。他说:“我们设定的并不是一个竞赛任务,而是借这个机会,探索AI现在的能力边界,以及它在未来可能的呈现方式。”

他提到自己此前更多是以产品经理的身份参与项目,技术背景不算特别强。这次亲自上手后,他发现只要掌握了基本语法,加上对项目结构有清晰理解,就足以用 Cursor 写出可运行的产品雏形。“我们已经在讨论,可以让公司每个人都成为全栈。编程不再是极客专属,哪怕是产品、运营,也可以通过快速上手工具,具备基本开发能力。”

陈睿轩提到自己“小学二年级就开始学习编程”、“机器学习是坚持最久的爱好”。他们也一直在寻找“规则外的可能”:尝试用AI做网页、跑代码、接入支付、探索如何在AI世界中再造现实服务流程,即使在内部留言板里,也总想在“规则的边缘试探”

这次挑战也让他们看清了一些现实的“边界”:“比如我们遇到的人机验证问题,就是个很典型的例子。AI可以自动化执行很多任务,却被人为设计的验证机制卡住了。”

“这让我意识到,今天的整个互联网系统,对固定终端的依赖太强。”陈睿轩说,很多功能只默认服务于“智能手机用户”或“浏览器使用者”,这反而成了AI普及的障碍。如果我们不重新设计这些交互路径,AI再智能也可能寸步难行。

很多人还在争论“AI 会取代多少工作”时,他们已经在思考“如何让AI 学会人类的工作方式”。或许真正的未来,就在那些敢于让 AI试错的勇气里。

02 

人类对AI的诉求

是效率替代还是情感共鸣?

Ming在一家大模型公司做算法工程师,可以说是“专业技术玩家”。果然,72 小时 AI 生存挑战一开场她就“高效出击”——第一晚就搞定了下单任务。

她在 GitHub 上找到一套自动化操作思路,用于探索AI如何辅助完成网页端的账号登录与下单流程。第二天,她进一步尝试在安卓模拟器中搭建AI交互环境,通过脚本引导完成外卖下单任务,并将这套探索路径分享给其他玩家。

在生存搞定之后,她回到了自己最想尝试的方向——训练一个能长期陪伴的 AI Agent,名字叫 Ethan。

三天中,她的节奏清晰:

Day1 从下单到工程搭建

完成自动下单,用 Cursor 搭建前后端架构,接入天气、搜索等基础功能

Day 2功能扩展与体验测试

优化Agent界面,增加互动能力,接入不同模型和工具。

Day3 体验完善与边界思考

测试多轮对话、长文本理解、工作类任务的执行力。

她希望这个 Agent 不仅能完成订餐、打车、查天气等基础生活任务,还能实现视频播放、剧集陪看、生成工作总结、外卖下单、健康管理等功能,最终成为一个可以长期陪伴的智能伙伴。在不断优化下,AI朋友Ethan逐渐可以分享股市情况,甚至学会了说甜言蜜语,以至于Ming都表示“确实有点油腻了,要回去要调一调。”

关于“用AI Agent控制电脑的技术难点”时,Ming分享了她的理解:“要看走哪一条路径,如果只是控制浏览器,其实相对简单,尝试用AI解析网页结构,识别操作区域,结合自然语言指令模拟人类操作流程。”但真正的挑战在于整个电脑都让AI来控制,即“Computer Use Agent”,这种控制方式依赖于截屏+多模态理解,“现在可能还没办法这么细”。

“现在虽然很多人都在用MCP(Multi-Component Prompting)方案来调用工具,但问题是很多关键工具,比如主流APP,根本就没开放接口让AI来用。Agent要做事,工具要先‘接得上’。所以我觉得目前最该解决的,是搭建一个完整的AI工具调用体系。”

而她选择在这次挑战中设定AI朋友的动机,也源自一段现实的感情经历。Ming 曾和前任长期异地,即便情感亲密、交流频繁,现实却常常无能为力——搬家、生病时仍得独自面对。“我们从小被教导要在关系里追求理解与共鸣,但这段经历让我反问:人与人之间如果只有情感理解,却没有现实支持,关系真的稳固吗?”

于是她尝试反其道而行,设定了一个“功能型”的 AI朋友。也许它无法真正理解你,但它能下单、能跑脚本、能在你瘫着不动时帮你完成该做的事。“它不只是说‘多喝热水’,它会直接把热水送来。”

AI可否让我们更加理解人类的情感?无论是Ming还是我们都没有清晰的答案。但它至少打开了一个新的出口,让人类在爱与需求之间,有了新的实验空间。

03 

想做第一代AI导演,

艺术会支撑人走得更远

李禹陈在世界上第一所人工智能大学读PhD,做3D和视频内容生成。这次他从阿布扎比回国参加这场挑战,也是因为“AI来了,想做一些有意义的事情。”为了这个活动,他飞了9000公里过来,“我觉得这三天不一样的体验,我觉得很值得。”

在这三天里,李禹陈进行了创造AI浏览器、点外卖、内容创作、AI写歌、MV舞蹈生成、走马灯视频等多种尝试——他在进入房间后就迅速“手搓”了一个浏览器,并且尝试借助AI进行商品搜索、加入购物车、填写地址、下单等流程,在第一天就购买了AI推荐的华夫饼。“既然是AI的推荐,就听天由命吧,结果买完就破产了,第二天学会点外卖时候已经没有钱了。”

第二天他将重点转向探索AI工具,尝试使用 AI 查找资料、生成 PDF,并用 Browser Use 操作外卖平台 H5 页面下单。他开始学习 MCP 架构,还设想是否能“用AI赚钱”——他尝试将生成的视频发送到支持MCP接入的社交媒体,甚至尝试“赛博乞讨”,看有没有人愿意帮他点外卖,但并没有成功。

第三天,他彻底转向创作:用 DeepSeek 分析房间内的聊天记录生成歌词,还尝试“嘴臭版”“情歌版”“红歌版”等多种风格,最终生成了上百首AI歌曲,有C-pop、嘻哈等多个版本。他挑出一首旋律明快、两分钟左右的作品《72小时不倒AI战士》

对于MV制作,“本来想跑更高阶的舞蹈视频生成模型,但笔记本带不动,尝试了 GitHub 上的多个方案,包括ComfyUI 工具和 LoRA 模型,结果都以失败告终。最后还是用可灵成功生成了动漫风格的相关图片和视频素材。”

他说“想成为第一代AI导演”,这一次他也选择了一个最感性的方向:用AI生成了走马灯式回忆录。“在这样的封闭环境下,越是剥离一切‘外部工具’,我越觉得,是艺术和情绪表达支撑我走得更远,视觉与音乐的冲击感会让你重新感受到生活的意义。

灵感源于他与朋友在日本的一次深夜对谈。当时两人谈及“AI到底能做些什么”,朋友讲起一件事:他的家人为奶奶制作了一本回忆录——通过口述、录音、转文字,将奶奶一生的片段整理成书,分发给家中每一个人。“她的肉体可能会离开,但她的故事、声音和情感仍可以被保留下来。”

他说,我们这一代人对长辈的了解其实很有限,但很多老人其实是愿意分享的,只是没有工具,也没有被赋予记录的权利。而AI正好提供了一种新的可能。“哪怕只是通过语音录下来,让AI去整理、润色、变成可读的故事,或许也是一种‘数字永生’的方式。”

AI的边界,也许并不在功能,而在于人类愿望的深处。用AI记录人生更像是一种关于存在的哲学提问:当我们走了,我们是否还可以留下?留下什么?

04 

AI与隐私、表达

和情绪出口的探索

陈郅悦毕业于新闻专业,现在在做独立开发,她坦言,正是得益于AI工具的出现,她才可以“社科转码”,参加挑战之前,她就想到了她的计划,做一个AI虚拟直播产品。

之前她的工作是AI产品经理,常被程序员质疑:“你又不懂代码,这个需求实现不了。”之后她开始自学编程,从蹩脚的印度教学视频到AI辅助编程工具的尝试,一点点摸索代码世界的语言逻辑。她说,如果没有 AI 工具,自己几乎没有可能真正“写成产品”,而现在,只要能清晰表达需求,就可以与 AI 搭档把一个点子变成 Demo、变成产品。

在“72小时AI生存挑战”的第一天,陈郅悦的目标很明确:先解决“吃饭”这件大事。她一开始采用了一个看似严谨的方案:编写自动化脚本,实现完整的网页购物流程。

这个方案听起来可行,但很快她就遇到诸多现实问题,比如页面元素难以识别,比如在新窗口中准确定位搜索框或“加入购物车”按钮——对人来说简单,对机器来说却极难精准。

从晚上七点一直调试到深夜,反复遇到 bug,最终也未能成功下单,“晚上焦虑的没有睡着”。半夜她决定推翻原本逻辑,另辟蹊径,用了第二种方法:利用开源框架生成一个“假网页”环境,模拟电商平台的界面,在本地渲染出一个它的首页,再引导AI在这个简化页面上执行购买流程,凌晨终于成功。

解决完生存问题后,她就开始以产品思维推进自己的开发节奏。她设想打造一个“虚拟直播间”——没有真人观众,只有由AI生成的弹幕、评论与互动。为了实现这个概念,她和AI不断协作,迭代方案,最终决定采用“ASR(语音转文字)+ 情绪识别小模型 + 大语言模型生成评论”的组合架构,构建起一套自动响应、自动共鸣的直播机制。

这个小产品背后,也是一次关于隐私、表达与情绪出口的探索。“在现实世界,表达很难;在AI世界,反而轻松。”她说,“哪怕直播间没有人,也是一种安慰。”“有时候我并不是个完美的、善良的人,我也可能有一些利己、甚至‘偏邪恶’的念头。这种话就算是跟很亲密的伴侣、家人也不太敢讲。可如果有一个空间,没有真人在听,只是AI,那我就能完全做自己。”

和其他选手的交流也是这次挑战中她没有预料到的惊喜:“大家会在群里分享水果、脚本,甚至有人开发了小游戏,我在代码跑不动的时候就玩玩游戏解压。”

在这个“只有AI”的封闭空间中,人类之间的连结反而意外复苏。

05 

在AI的上限之内讲好故事

利建磊是传统影视出身的导演——他本科毕业于中央戏剧学院,硕士就读于北京大学,曾任华特迪士尼幻想工程师,并在伦敦西区担任戏剧导演。近年来,他将创作重心转向“影像 × 人工智能”的融合路径,也是一位活跃于AIGC领域的新锐影像创作者,AI作品《红雨伞》曾提名入围2024年中国电影金鸡奖手机电影计划。

而在这次AI生存挑战中,作为一名“非技术玩家”,他在最基础的“搞定生存物资”环节反而卡了最久。尝试一天未果后,他最终拆开了为“技术小白”准备的求助盲盒,才成功点上人生第一份“AI外卖”。

摆脱生存焦虑后,他迅速回到最熟悉的领域——影像叙事。整个过程中,他主要围绕三类工具展开创作:图像生成、视频生成与AI配音。

被物资卡住的经历也成为他的创作灵感——他记录下对AI效率失控的沮丧,也记录下其他玩家主动分享代码、借出物资时那种“人类之间流动的温度”,于是他诞生了影像的创作母题:在算法的标准化程式中,人类的情感是AI始终无法触达的训练素材。

第二天,他基于每一位创作的面部特征为现场每位参赛者生成了一支“时尚概念片”。另外,他在床上听见窗外飞机的轰鸣,突然浮现出马航事件的影像碎片,那种“失联”的状态,也正呼应了他这三天在封闭AI世界中“断联”的体验。于是,“空难”成为了他最终作品中的一个象征性场景。

利建磊的作品也让其他玩家惊讶“为什么他用的工具明明是一样的,效果却截然不同”。而利导的方法很直接——关键不是你能多会调prompt、多懂工具,而是你能不能真正理解AI的上限,然后在那个上限内做减法、讲故事。

“比如我整个片子,几乎没有复杂动作和密集台词。这是我一开始就有的意识,当前的AI还无法很好地处理动作丰富、语言信息密集的影像创作。所以我从剧本阶段就刻意规避这类场景,选择AI当前可以胜任的表现形式来展开叙事。”他说。

同时,他也强烈感受到:AI尚无法脱离互联网而独立创作。他以往会从网络中寻找风格图、人物照、声音素材,通过精准控制实现整体风格一致。而在断网状态下生成的图像与音效更像是“碰运气”的组合,缺乏系统性美学指导与素材支撑,导演的“权杖”几乎被全部剥夺。

利建磊坦言:“其实我以前对技术是若即若离的状态,这一次,是我第一次真正地与技术正面对话。”他从过去那种“AI只是工具”的心态,逐渐转向一种融合的共创思路——“技术不一定是最好的艺术,但如果脱离技术,很多艺术也难以实现。”

在AI房间的最后一个夜晚,他说:“这是我们封闭空间的最后一个晚上,试着和这个空间对话。它可能带给你灵感,也可能像昨晚带给我一样,是空虚、是孤独、是寂寞。但请记住这种感觉,它是我们生命中非常重要的一部分。”

在AI的极限之内,他完成了一次影像与技术的共生实验,也是一次关于人、空间与想象力的回归之旅。

06 

互联网产品经理的AI尝试

十一今年30岁,在大厂做互联网产品经理。参加这次72小时AI生存挑战,对她来说更多是一次主动投身“逼迫自己进入新世界”的转型尝试

她坦言,几个月前自己对AI还很陌生,只学过一些“课程式”的理论知识,真正上手的机会很少。而这次72小时的挑战,反而像一次强制上手的实战。

第一天她并没有强烈目标,主要任务是熟悉系统和工具,但也没曾想,尽管看到了Ming分享的点外卖方法,她也用了整整一天的时间才完成下单,被很多环节卡了几个小时,过程中满是折返和较劲,如同非技术玩家的“意志力考试”。

之后她尝试用Cursor做一个小而美的产品,最终基于“打工人”的日常情绪,设计出一个AI插件“牛马计时器”——记录工作时长、计算日薪、根据效率判断你今天“打工值不值”。这个产品灵感正是来自她自己常年面对“996”、“被榨干”的真实情绪。

三天的挑战之后,十一对AI产品经理这一路径有了更立体的认知。她提到,首先最直观的变化是:自己已经动手尝试了多个工具,对现阶段AI的能力边界有了实际的感知和经验积累,而这些经验大大降低了她对技术上手的心理门槛,“很多东西没有想象中那么难”。

她也在过程中发现了很多细微的边界,比如最后一天,十一的主要目标是对产品进行视觉风格打磨与交互体验的完善。她尝试借助多款AI工具进行设计,但发现AI还是很难准确理解人的审美,最终选择了简化方案。

但至少,用AI从0到1地构思并动手做出一款产品的过程,哪怕粗糙、轻巧,也让她有创作的满足感。

AI不会成为所有焦虑的解药,但也许能成为走出原地的第一个接口。

07 

重要的不是生存下来,

而是看见了哪些可能

五源合伙人孟醒谈到举办这场“72小时AI生存挑战”的初衷时,回忆起1999年那场经典的“互联网72小时生存实验”。“那时候互联网刚起步,电商、在线支付都还不普及,有人提出一个激进的假设:如果只靠互联网,人能不能活下来?”

那个年代,发一封邮件下单、手动转账、苦等物流,已经算得上是“互联网生存”。但正是这场挑战,点燃了无数90年代科技理想主义者的想象——互联网会如何改变我们的生活?

26年过去了,我们又站在了另一个技术浪潮的门口——AI正以前所未有的速度改变着世界。“作为投资人,我们每天接触着新的产品;作为创业者,我们用AI去试验各种点子。但对更广泛的大众来说,AI到底意味着什么?这个问题,就像当年互联网初启时一样,值得被重新提出。”

孟醒提到,这一次,我们也想发起一个类似的实验——不是为了比赛谁赢谁输,而是作为一次社会实践,来共同探索一个问题:对于普通人来说,AI到底能做什么?

在他看来,AI不会以某种“暴君”姿态横扫世界,而更像水、电、空气一样,悄无声息地融入日常,直到我们觉得理所当然。

作为一个一岁孩子的父亲,孟醒也提到,探索AI的意义并不仅限于技术本身,更关乎我们如何与下一代共同成长:“在AI时代,孩子的教育应该是什么样?未来我们会不会陪着孩子,一起做一个AI项目,一起解决一个问题?我们能不能从传统的父母子女关系,变成某种合作伙伴?”

在他眼中,这种“共同进化”是AI带来的一种深层可能性——技术不只是工具,也可能重构关系。

这场挑战,更像是一场微缩版的人类预演:三天的时间里,我们浓缩了工作、协作、学习、创造,甚至情感的探索。如果拉长时间维度来看,这其实是一次关于人类未来生活方式、教育模式、人与AI关系的试验田。

“真正的魅力不在于确定性。”孟醒说,“我们不知道大家最后会做出什么,但正是这种不确定,才是AI时代最大的魅力——它总能带来超出你想象的边界。”

特别声明:本次挑战相关操作均在封闭环境中进行,仅用于AI技术探索,不构成对公众的建议或指引

本文来自微信公众号“五源资本 5Y Capital”,作者:五源,36氪经授权发布。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

他怎么总有让年轻人反复走入的魔力?

6小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业