人类不能放弃写作

腾讯研究院·2025年10月15日 19:42
人类的写作是照亮我们心灵和连接人类的一把利剑

如果梦想成真会怎样?想象一下,在这样一个世界里,人工智能目前面临的写作挑战已经得到解决。在这里,大型语言模型(或其后继者)不会大量生产丑陋的文本。在这里,使用它们是节能的。在这里,预测文本、拼写检查和语法程序是万无一失的。在这里,人工智能可以生成篇幅很长、没有重复、风格有趣、事实准确、始终切题的文本。哦,还可以生成与你可能写出的文本难以区分的文本。

这个世界会把我们人类带向何方?虽然其中一些成就需要比其他成就更长的时间,但未来已经在敲门了。

我们从人类写作开始这本书——它是如何出现的,它与我们心灵和大脑的联系,以及我们为什么写作和重写。在许多关于人工智能研究的页面和讨论之后,是时候反思我们所学到的东西,并思考我们所能控制的选择了。

当我们权衡选择时,请记住,得到我们想要的可能会造成不良后果。文化传统——无论是希腊神话中的迈达斯国王,欧洲故事中反复出现的“三个愿望”故事,还是W·W·雅各布斯更现代的《猴爪》——提醒我们,有吸引力的前景可能会带来意想不到的后果。有些闪闪发光的东西确实是金子,但并非所有闪闪发光的东西都是金子。我们的工作是在我们自己的写作生活中,自己区分哪些闪闪发光的东西应该放在哪个罐子里。

人之为人

2022 年 2 月,年仅 16 岁的他击败了五次世界冠军马格努斯·卡尔森 (Magnus Carlsen),震惊了国际象棋界。拉梅什巴布·普拉格纳南达 (Rameshbabu Praggnanandhaa) (也被称为普拉格 (Pragg)) 是印度的新天才,尽管卡尔森的技能不应被低估。

DeepMind很有可能击败他们。所以,我们有理由问,为什么人类棋手还要费事下棋。一个基本原因是,下棋能让你学会思考。赢棋也许能给人以教益,但知道如何运筹帷幄,弄清别人是如何处理问题的,从错误中吸取教训,这些技能在生活的很多方面都是很有价值的。国际象棋传奇人物加里·卡斯帕罗夫(Garry Kasparov)现在成了商人,他甚至写了一本书《生活如何效仿国际象棋》(How Life Imitates Chess),副标题“从棋盘到董事会,如何走出制胜的一步”(Making the Right Moves),很能说明问题。

人类被称为“智人”是有原因的。拉丁文“sapiens”的意思是“有智慧的”或“能明辨是非的”。因此,你需要能够思考。自图灵和达特茅斯会议以来,人工智能的追求一直是建造能够思考的计算机和在其上运行的程序。最近,目标越来越多地变成了增强而不是取代人类认知。我们需要找到机器和人类之间的正确平衡。为了开启这场对话,让我介绍一位被遗忘的电视传奇人物的作品。

在《芝麻街》出现之前,先有了咖啡。1957年,华盛顿当地品牌威尔金斯咖啡(Wilkins Coffee)聘请了一位名不见经传的木偶师制作电视广告。我在华盛顿地区长大,亲眼目睹了吉姆·亨森(Jim Henson)的木偶威尔金斯(Wilkins)和旺茨克斯(Wontkins)的滑稽表演。

后来,蓝色巨人 IBM 找到他。1967 年,IBM 聘请了依然通过拍摄广告来养活自己的汉森。最终成片的视频短片名为《文书工作的爆炸式增长》,是一则用途广泛的广告,吹捧了 IBM 的一系列产品,这些产品可以简化办公室工作,从自动纠错的打字机到复杂的录音机。影片以逐渐增强的音量结束,宣称:“机器应该工作。人类应该思考。”让科技来做这些单调乏味的工作。把人解放出来,去做那些需要人类大脑的工作。

随着机器越来越多地被人工智能所驱动,我们越来越难以决定哪些工作应该分配给技术,哪些工作最好留给人类。我们在人工智能和人类写作中都面临着这种困境:在我们的个人生活和职业生涯中,我们该放弃什么,保留什么。

选择是个人的。但为了帮助做出选择,我建议你建立自己的记分卡。不是正式的记分卡,而是标出一些参考点,指导你的写作实践。决定不一定是单方面的。毕竟,这是你的决定。也许,“好吧,人工智能,帮我起草邮件回复,但我是语法和风格的裁决者。”标出你写作中的无核区。但与此同时,要诚实地衡量时间压力、意志力,有时还有懒惰。

人工智能是对人类创作的威胁吗?

显然,人工智能可以创作故事、诗歌,甚至可能是小说,足以以假乱真。如果这些作品是由人类创作的,我们会称它们为某种形式的创造性作品(至少是小c,甚至可能是Pro c)。一个明显的问题是,人工智能日益增长的文学潜力是否会成为人类创造力的竞争对手。要使这一挑战成为现实,我们需要假设将“创造性”一词赋予人工智能的作品是合理的。

人工智能是否具有创造力,在很大程度上是一个个人判断的问题。我很好奇将我的观点与日常作家的观点进行比较。因此,我在欧洲调查中包括了一个关于创造力的项目。(由于篇幅所限,我不得不将该项目从美国版本中删除。)问题是,如果一个人工智能程序写了一首诗或一个短故事,参与者是否会称其具有创造力。

在回复中,13%的人回答“是”,29%的人回答“否”。其余的人几乎都用“也许吧”来搪塞。但是,也有几个人不满足于“是-否-也许吧”的回答,而是提供了他们自己的观点。其中一人将创造力与意向性联系起来:

“我认为,创造力需要有目的性和精益求精,而不是简单地复制别人的作品。”

而另一组则专注于情感:

“它的形式可能被认为是有创意的,但内容不是,因为风格可以复制,但情感无法复制。”

另一个讨论了人类在编程中的作用:

“这可以被称为创造性的,因为它是程序员在创造人工智能时自己创造力的产物,结合了人工智能所依赖的在线资源的创造力。我不会说人工智能程序本身是创造性的。”

还有一个关于原创程度的评论:

“如果人工智能程序从现有短篇小说的数据库中钓鱼并将它们混合成一个,那么不。如果人工智能撰写一个全新的故事,那么是的。”

当然,人类的作品也受到这种最后一种审查。

无论我们贴上什么标签,我都认为创意作家不必惧怕人工智能。这个领域永远有发挥空间。你或许过于富有,也肯定过于单薄,但短篇小说、长篇小说或诗歌的数量却是无穷无尽的。此外,创作行为的主要受益者往往是人类作家本身。

你能用人工智能保护你的个人写作风格吗?

数字生活的一个不良副作用是身份盗窃。诱人的目标是社会保障号码、信用卡、银行账户,如今还有我们的声音和面孔。在盗窃和数字写作方面,显然存在剽窃问题。但我的担忧是更微妙的问题:让人工智能软件诱使我们以特定方式写作,或不加质疑地默许其建议,在此过程中逐渐削弱我们独特的写作方式。

在美国学校,长期以来一直有人抱怨“为了考试而教学”,特别是对于标准化成就测试而言。被丢失的是教师自己建立的教学大纲的完整性,而学生本来可能从这些大纲中学到更多知识。以分数为中心的方法,是学生长期以来在写 ETS 作文题时被教导要遵循的策略:使用大量的多音节单词。遵循五段式作文格式。最初,ETS 人工阅卷人,然后是 e-rater 软件,都接受过寻找这些写作要素的培训。

海明威当然知道很多多音节单词,但他并不总是觉得有动力在他的写作中加入大量的词汇。关于五段式议论文——基本上是20世纪50年代末美国人发明的——也是如此,它仅仅是一种发明。有些作文的写法是,用一段来介绍,一段来写第一点,一段来写第二点,一段来写第三点,最后一段来总结。但是,如果你只有一点——或者有六点——要写呢?如果你想得高分,那么五段式议论文生搬硬套的格式要求文章要么扩充(找到更多的论点),要么删减(删除或合并)。

如果给打分工具写信是操纵你选择用词的一种方式,那么让人工智能像吉夫斯一样写作是另一种方式。只是这一次,当人工智能生成单词或短语时,操纵就出现了。人工智能会填补你开始写作的内容(就像Gmail智能撰写或预测文本一样),或者为你自己的单词和语法选择提供替代方案(就像Grammarly或Wordtune一样)。

人工智能辅助下创作出的文本的种种担忧。在新闻行业,我们发现,自动生成的新闻报道往往比人类撰写的报道更千篇一律。负责校对机器翻译的翻译人员表示,他们的创造力受到了压制,在面对计算机已经完成的工作时,他们很难“跳出条条框框进行思考”。

不是每个人都是记者或翻译,但我们所有人都是日常作家。在我们的日常生活中——在微软Word、Grammarly和预测文本程序的帮助下——我们自己独特的写作方式是脆弱的。写作基本上是一种独奏活动,而且通常是孤独的活动。这种孤独感可能会让我们不确定是否有什么有价值的话要说或者是否说得好。对于不太自信的作者来说,无论他们是否能流利地说出所写语言的母语,AI吉夫斯都可以让人感到安慰。

问题是,你不知道该不该相信它的建议。我想起了电视上那些药品广告,它们都会不厌其烦地提醒,“如果你对它的任何成分过敏,请不要服用神奇魔药。”你怎么知道自己会不会过敏呢?如果你不是一个自信的写作者,有了 Word 或 Grammarly 的建议,你又怎么知道该不该接受某一条建议呢?

为了说明我的担忧,我举个例子,当我起草这一章时,我写道,拉梅什巴布·普拉格纳南达是“印度的新奇才”,这时,Word弹出一条消息,警告我“这种语言可能暗示对土著居民的偏见”,并建议我将“Indigenous”替换为“Native American”。是的,在普拉格的家乡有“土著”居民,但他们是印度的土著居民,而普拉格不属于他们其中的一员。

我知道要忽略伍德的建议。单是普拉格的印度教名字,更不用说在这个发明了国际象棋的国家有着悠久的国际象棋传统,我就知道“印度人”是什么意思。但对于那些认为这不是不言而喻的作家来说,他们可能最终会用“美洲原住民”来代替,这将是荒谬的。

那该怎么办呢?最终的决定权在你,这是有充分理由的。正如我在调查中遇到的一位受访者所说,

“我比软件更了解我的母语。”

有时候,写作声音的挑战不在于准确性或语法,而在于风格。回想一下那些申请著名研究生奖学金的美国大学学生的文章草稿吧。那个写“在不久的将来”的学生选择了一个在风格上与微软建议的更突然、更平淡的“很快”不同的短语。那个写“可能会恶化”的学生故意选择了“恶化”,而不是“恶化”。我希望这些作者坚持自己的立场,忽视了机器。

与其让 Word 或 Grammarly 等软件审查并接受你的原稿,不如自己多花些功夫。这里的问题不是效率,而是权衡你的信心水平,知道何时接受第二种意见,以及何时坚持你自己的想法,而不是让算法替你做主。

AI 是否正在重新定义作者身份?

尽管语法和风格程序存在缺陷,但今天的AI工具在清理我们起草的散文方面做得非常出色。当涉及到自己生成大量文本时,阿道夫·尼普的梦想在很大程度上已经实现了。关于AI作为编辑或作家的剩余问题在于,我们决定如何处理这些成功故事。由于我的职业生涯是在大学教育中度过的,因此我会从这里开始。

问题归根结底就是这样。现在或者在不久的将来,我们可能无法确定学生自己完成了多少书面作业,这让我们很难评价他们的作品。在理想情况下,学生和老师会就作品进行持续对话,也许包括多份草稿。但半个世纪以来的学术界让我明白,这基本上是一个白日梦。

人工智能并不是一个独特的挑战。合同作弊和兄弟会文件铺平了道路。但是,随着在大型语言模型上运行的程序的商业化,学生访问个人论文工厂的可能性大大增加。此外,随着能够模仿某人写作风格的程序的完善,检测作弊的最后堡垒之一(“摩根不可能写这个”)正在崩溃。

我不是唯一一个担心这种教育挑战的人。2022 年 9 月和 10 月,美国教育工作者和撰稿记者中似乎出现了“大觉醒”,标题宣称“人工智能使学生作弊比以往任何时候都更容易”,并问道“人工智能会杀死大学写作吗?”一些作者非常担心。其他人建议教学生如何与技术合作。少数人说不要担心(至少现在不用担心),因为目前提供给学生的生成性程序并不那么令人印象深刻,特别是对于需要当地知识的文章,而这些知识并不在人工智能的数据集中。

所有这些都是在 ChatGPT 突然出现之前。

由于GPT-3及其后代作为翻译器并不逊色,因此ChatGPT在以英语为主导语言的国家之外的国家也引起了人们的关注也就不足为奇了。以下是挪威发生的事情。

12 月 5 日,也就是 ChatGPT 推出仅一周后,挪威语言艺术教育协会(基本上是挪威语言和文学教师的工会)致信挪威议会,该协会担心:“从长远来看,(人工智能文本生成)威胁到人口写作和阅读技能、民主以及思想和知识的新发展。”

一连串的讨论接踵而至。克里斯蒂安尼亚大学学院的莫滕·伊根斯预测,“这项技术显然会破坏所有教育的完整性。”教师工会总经理西夫·索拉瓦·瓦兰写道,“是学生的写作技能受到人工智能的威胁。”瓦兰认为,正是通过写作,我们教学生推理、结构、讨论、探索、创造和批判、反思、争论、分析和解释。

对于挪威人来说,生成式人工智能的主要问题似乎是它破坏了学生将写作作为思考工具的机会。对于美国人来说,重点更多地放在如何防止作弊上。

该怎么做?美国人的建议侧重于设计任务,让调用大型语言模型的行为暴露出来。本质上,设计的目标就是难住机器。先考虑警察,如果有余力再考虑教育。

挪威人的方法看起来不同,他们强调写作是一个学习的过程。卑尔根大学北欧文学教授埃里克·瓦森登建议避免“被动地收集信息”(这是 ChatGPT 擅长的),而是强调“寻找、组织和整理观察结果和零碎信息”的过程。同样,瓦兰德敦促区分文本解释的书面产品(这是 AI 擅长的)和“学生在文本中理解和创造意义的实践”。教育是旅程,而不仅仅是目的地。

一些教育家的建议带来了怀旧的微笑。Irgens 敦促“更加强调课堂上的口头参与,进行口头考试。”我被带回到 19 世纪末的哈佛大学,当时英语 A 和查尔斯·艾略特正在从口头转向书面考试的转折点。当时,由于有太多的学生需要在课堂上口头评估,这导致了向书面作文的过渡。书面考试的纯粹效率似乎是不言而喻的。回到口头评估将解决“谁写了这个”的问题,但我不认为大规模回归口头表达是明智的。

挪威教师工会提出了另一个经典建议:让学生“更大范围地手写”,同时承认这个想法不切实际。可能确实不切实际。尽管除了我们讨论过的手写的其他优点,教师们对谁写了什么会有更大的把握。

我自己没有什么好点子,于是前往“虎穴”咨询了 ChatGPT。我问:“如果聊天机器人可以写学生论文,那么作文老师应该做什么?”ChatGPT 的回答(我重复问了两次)非常有说服力,而且很长。以下是第一次回答中关于课堂技巧的两段摘录:

  • “更多地关注教授批判性思维技能和分析,而不仅仅是教授学生以某种风格或格式写作。”
  • “在课堂上融入更多的协作和团队工作,让学生可以一起头脑风暴,分享他们的写作,并为彼此提供反馈。”
  • 当然,他们也会自己写作。
  • 机器人的第二次回答问题开始时有些无关紧要,但随后集中讨论了教师的作用: “聊天机器人无法取代训练有素的作文老师的专业知识和指导。”

“作文老师应该继续专注于教学生如何进行研究,在写作中清晰有效地组织自己。”

除了建议教师应该保住工作外,没有提供多少实际帮助。

也许科技世界将成为解决方案的一部分。在序言中,我异想天开地建议在人工智能生成的文本中插入数字水印,这样我们就能知道它的真正出处。OpenAI正在开展这样一个项目。回想一下人工智能与密码学的早期联系,具有讽刺意味的是,OpenAI的方法是将一个信号(水印)嵌入到人工智能生成的文本中,只有拥有“密钥”才能检测到这个信号。可以想见,用户(如学校、出版商或政府机构)将需要与OpenAI合作访问代码,以便在人与人工智能的作者身份之间做出“赞”或“踩”的决定。但是,这些机构已经与Turnitin“合作”了。

由于 OpenAI 及其合作伙伴在发布 GPT-2 时的工作,一个更简单的嗅探测试已经存在。该工具由 Hugging Face 公开提供,称为 GPT-2 输出检测器演示。您输入一段您想要验证其来源的文本,该程序将返回一个概率分数,使用从“真实”(人类)到“虚假”(AI)的标度。虽然该系统是为早期大型语言模型设计的,但当我在 ChatGPT 生成的文本和我在本章中编写的段落之间进行实验时,它的表现令人惊讶地好。我很高兴不被认为是机器人。不过,请事先警告,预测准确性随文本变短而下降,特别是由 AI 编写的文本。

在 ChatGPT 推出仅仅几周后,爱德华·田就编写了 GPTZero,一个用于识别 AI 作者身份的程序。正如田所坦率承认的那样,尽管该工具仍在不断发展,但它远非完美。正如我们在第 10 章中所说,其他检测工具也随之而来。

截至 2023 年 2 月,田的新举措是与教育科技公司 K16 Solutions 合作,将 GPTZero 嵌入 Canvas 和黑板等部署在高等教育和基础教育中的主要学习管理系统(LMS)中。(学习管理系统是一种用于学术课程的在线平台软件。)该概念是 Turnitin 模型的变体,该模型通过将新学生的论文与这些学生以前写过的论文(以及 Turnitin 数据集中的数十亿其他作品)进行比较来检测抄袭。通过田的模型,学生通过 LMS 提交书面作业(这种做法已经相当普遍),然后这些论文会自动通过 GPTZero 运行。

转向商业世界。在这里,著作权问题转化为谁获利的问题。如果你创作的作品——你的知识产权——出现在网上,它就会成为人工智能模型的素材,供其剽窃,供其他人类用户从中获利。艺术家们担心,使用人工智能图像生成器的人可以基于原始艺术家的独特风格创作新的作品,然后将人工智能产品作为自己的产品进行营销。为了开始解决这个问题,Shutterstock(与OpenAI及其DALL-E 2合作)成立了一个基金,补偿向Shutterstock上传原创艺术作品的人类创作者,这些作品现在被用于人工智能生成的图像。

艺术家们并不孤单。人类翻译人员担心,他们已经完成并在网上发布的翻译作品被机器翻译程序用于其他人的项目,而原始翻译人员没有收到版税。在编程界,有人对 GitHub Copilot (基于 OpenAI 的 Codex 构建的产品,现在被授权给微软)提起诉讼。目前尚不清楚,当其他人重用 GitHub 上发布的代码时,原始代码的发布者根据版权法拥有哪些权利。

说到版权:就现代著作权包括能够对您的作品进行版权保护而言,我们需要更多的法庭案件,然后我们才能期望全国,也许甚至是国际,就谁或什么可以拥有由人工智能产生的作品的权利达成共识的法律。在我们等待法律出台的同时,我决定咨询 ChatGPT 的看法。

我的问题是,“由GPT编写的短篇小说是否应该受到版权保护?”片刻之后,机器人回答道,

“作为由 OpenAI 训练的大型语言模型,我没有版权或拥有任何形式的知识产权。我的主要功能是根据提供给我的输入帮助用户生成类似人类的文本。”

由于大型语言模型不是人类,ChatGPT符合美国法律。

但作为一名谨慎的科学家(或者至少是一名顽固的实验者),我想知道这个结果是否可以复现。大型语言模型是从庞大的数据集中提取的,所以不能保证当它们重新进入数据池时,会得出相同的答案。我第二次提出了我的问题,但得到了不同的回答:

“作为由 OpenAI 训练的大型语言模型,我没有浏览互联网或访问我训练数据之外的信息的能力。我无法给你一个明确的答案,关于 GPT 编写的短篇小说是否可以被版权保护。”

ChatGPT 失去勇气了吗?顺便说一句,第一句话是某种模板,出现在许多 ChatGPT 答案的开头。

我决定再掷一次骰子。现在机器人已经确定了,但与第一次尝试的结论相反:

“由GPT编写的短篇小说可以像其他任何原创作品一样获得版权。为了使作品受到版权保护,它必须是原创的,并以有形形式固定下来,例如写下来或记录下来。如果由GPT编写的短篇小说符合这些标准,那么它就有资格获得版权保护。”

试着这样对美国版权局说吧。像 ChatGPT 这样的机器人可以成为有趣的工具。只是不要相信你读到的每件事。

说到作者身份,还有一个问题一直让我耿耿于怀,那就是人类的诚实和信任。说谎几乎不是什么新鲜事,找出谎言的企图也不是。但是互联网和现在的 AI 语言生成已经让守门人认为作弊潜伏在每根柱子和每根栏杆后面。抄袭检测工具像兔子一样成倍增加,全球各地的学校越来越多地转向 Turnitin 等程序。学术期刊和政府机构通过 iThenticate 运行书面提交。即使像 Copysmith 这样的应用程序,它使用大型语言模型生成“新”文本,但也进行抄袭检查。

作为一名几十年来一直在写作和评价他人作品的学者和作家,我感到四面楚歌。现在,在允许进入之前,你必须通过抄袭检测。在写作方面,我几乎不宽恕抄袭或其他形式的欺骗。我理解导致这些做法的压力(或缺乏道德)。然而,我悲痛的是,在作者和读者之间的信任被严重侵蚀的作者世界中,我悲痛欲绝。

人工智能会威胁到以写作技能为基础的职业吗?

我既不是算命先生,也不是精明的赌徒。我为自己辩护说,试图预测使用人工智能工具的白领职业未来就业前景的经济学家,在这场游戏中并不总是更成功的。我们已经看到了半空和半满的预测,以及涉及“短期”和“长期”未来的对冲预测。

2022 年下半年,一系列文章和报告指出,人类就业前景并没有那么岌岌可危。克莱夫·汤普森在《连线》杂志上发表的文章鼓励我们欢迎人工智能来增强人类的能力。法拉哈德·曼朱在《纽约时报》上发表的文章标题令人宽慰,“在与机器人的战斗中,人类工作者正在获胜”。曼朱援引了美国劳工统计局(BLS)的研究分析师迈克尔·汉德尔(Michael Handel)的一份报告。汉德尔根据 BLS 的预测以及其他文献,提出了他对一系列职业在人工智能和自动化趋势下的前景的预测。

他列出的三个职业都是我们之前讨论过的:新闻、法律和翻译。汉德尔的结论与我的想法基本一致:

在新闻界:几十年来,就业人数一直在下降,因此,预计 2019 年至 2029 年新闻相关职位的下降并不是什么新鲜事。

在法律方面:根据美国劳工统计局的预测,到 2029 年,律师和律师助理的工作岗位数量将略有增加。作为进一步的佐证,汉德尔引用了达纳·雷姆斯和弗兰克·列维的研究成果,我们之前讨论过。你还记得,雷姆斯和列维强调,法律职业的工作岗位涉及多种多样的任务,其中一些比另一些更危险。在法律写作方面,两位作者根据当前的人工智能能力,对他们的预测进行了限制,而不是预测未来可能带来什么。

翻译:汉德尔提醒我们,翻译和口译员的工作岗位数量预计将继续增加,这在很大程度上要归功于全球化。他没有提到的是,其中有多少可能是“好”工作,让专业人士能够有意义地实践他们的手艺,而不是沦为校对后的侍女。

在日常写作中,如何依靠吉夫斯式人工智能,主要取决于我们自己。在商业和专业领域,情况有所不同,资本主义的长臂往往是决定性因素。没有人试图以增加利润的名义将如此多的制造业转移到海外,从而削弱美国经济。但这种情况还是发生了。虽然个人在专业领域使用人工智能方面没有多少发言权,但至少我们应该把注意力放在最重要的事情上。

展望未来,请记住两件事。第一件与质量有关:对于哪些任务来说,人工智能的工作达到了人类的水平,对于哪些任务来说,人工智能的工作还没有达到人类的水平?有时,非专业人士很难分辨其中的差别,正如熟练的翻译人员提醒我的那样。在我的欧洲调查中,一位参与者写道,

“翻译工作受到的威胁主要是由于非翻译人员不理解如何判断 AI 翻译的质量。”

仅仅因为我们有像谷歌翻译这样触手可及的工具,并不能保证所显示内容的准确性和质量。有时,我们为了方便或因为那是我们能负担的,会在质量上妥协。但是,我们应该记住,在翻译中,你通常只能得到你所付的。

个问题是,我们如何为未来的任何工作做好准备,这些工作都包括高度的增强——与人工智能一起工作,而不是被人工智能取代。正如斯坦福大学放射学和生物医学信息学教授柯蒂斯·兰格洛茨所说,

“人工智能是否会取代放射科医生”是“错误的问题”……“正确的答案是:使用人工智能的放射科医生将取代不使用人工智能的放射科医生。”

我们的任务是在人类和人工智能之间找到一个可行的平衡点。这就引出了我们的记分卡上的下一个问题。

你如何在合作和交出钥匙之间划清界限?

以前,很多数学课本都附有习题答案,放在书的背面。如今,很多自学外语的书仍然如此。你是那种会自己找出答案并核对的人吗?还是说你喜欢偷看?跳过自己的作业通常意味着学不到多少东西。

人工智能作为个人编辑或作者代笔的挑战不在于吉夫斯会取代人类作家,而在于它接手工作所花费的精力要少于人类自己亲自完成。获得帮助是一回事——就像踏板辅助自行车帮你上坡一样——但削弱自己的技能和声音是另一回事。我们很容易欺骗自己,对自己所做选择的明智程度产生错觉。“那个法式牛角面包只有100卡路里”(这是当时正在节食的丈夫常说的话),但它的卡路里肯定超过200。“我不知道该写什么。我让 ChatGPT 帮我开个头吧。”让人工智能帮你头脑风暴是一回事,让你的想象力打瞌睡是另一回事。

在序言中,我们提到了斯图尔特·罗素提出的防止人工智能接管的防御措施。在开发智能机器时,要在目标上建立足够的不确定性,以便人类成为最终仲裁者,决定人们想要做什么。我在调查中的一位回应者提出了这种情景的一个版本:

“人工智能是方便的,但它不应该变得如此之好,以至于我们100%依赖它。”

本质上,建立阿喀琉斯之踵。也许我们应该在Word和Grammarly中留下一些错误,让人类保持警惕。

今天的 AI 箴言是增强,而不是自动化。以人为中心的人工智能的目标是改善人类生活,而不是取代我们。但通常潜伏在背景中的假设是,增强是在提高效率的名义下进行的。

这让我想起了那些吹嘘自己原产地,却外包生产的商品。看看你苹果设备的背面,你会发现用小号字体写着“加州苹果设计,中国组装”。在制鞋业,“丹麦”牌的ECCO最初在丹麦的布雷德布罗生产,但现在在印尼、泰国、斯洛伐克,当然还有中国都有工厂。几年前,我去哥本哈根旅行时,在一家ECCO店停留。我试穿的凉鞋远不如二十年前我在这家店买的一双类似凉鞋舒适和精良。当我表达我的不满时,销售员惨淡地一笑,说:“我们丹麦人已经控制不了了。”经济效率在起作用。

增强和自动化之间的界限可能会变成一个滑坡谬误。过去人们常说,我们应该把人类最擅长的领域留给人类,比如与人打交道、处理不可预测的情况、发挥创造力。这种建议的问题在于,人工智能正在不断进步。它现在可以提供心理健康咨询,阅读复杂的乳房X光照片,还能写短篇小说。人工智能不能做什么的界限不断后退。

斯坦福大学以人为本人工智能研究院的联合主任李飞飞一直在探索,人们会乐于让机器人承担什么样的任务,而哪些任务人类更愿意自己完成。人们希望保草莓这样精细的任务——现在它们可以,准确率可以达到95%——那么人工智能当然也可以拆开那些礼物。但我们不希望它这么做。

就像马桶和圣诞礼物一样,作家们可能从人工智能中得到的帮助也是多种多样的。我们需要区分“能够做到”和“我们希望它做到”。凯蒂·伊隆卡·杰罗(Katy Ilonka Gero)是一名人机交互研究人员,她通过采访数十名作家来探索这种差异。她问道,

写作的哪些部分是如此乏味,以至于你很高兴看到它们消失?哪些部分给你带来了创造无中生有的东西的无法解释的快乐?关于写作,你最珍视的是什么?

作家们希望保留的一些方面是计划——比如设计情节和结局。杰罗采访过的一些作家认为,计划是写作成为独特的人类事业的一部分。另一方面,当作家们对下一词或下一句应该是什么感到困惑时,人工智能是受欢迎的——这是大型语言模型的强项。如果作家们想注入一些意想不到的东西,人工智能将为他们服务。

我很好奇 ChatGPT 对人类写作选择的看法。当我问我的新朋友人工智能对人类写作的更广泛影响时,它写下了以下内容:

“虽然有些人可能担心人工智能取代人类作家的潜力,但重要的是要记住,人工智能只是一个工具,可以用来辅助写作过程。最终,人工智能对写作的影响将取决于如何使用它以及人们如何将其融入写作实践的选择。”

不深刻,但说得很好。

披露规则会有帮助吗?

围绕 ChatGPT 的炒作令人难以置信,在某种程度上,这很奇怪。其编程背后的基本原理并不独特(谷歌、DeepMind 和 Meta 也有类似的模型)。OpenAI 聊天机器人的新颖之处在于其公开发布。数百万人可以亲自尝试。突然之间,技术人员已经知道的核心技术就公开了。媒体对大多数人来说,这是一个全新的、革命性的写作工具的承诺和威胁的报道欲罢不能。

许多愤怒都涉及在教育中使用 ChatGPT,其回应大相径庭:一些人大喊“禁止该技术!”而另一些人则主张拥抱该聊天机器人的教学潜力。由于写作作业是西方教育课程 DNA 的组成部分,因此要求立即采取行动是可以理解的。

然而,学生并不是唯一写作的人。作为作者,我们都受到生成式人工智能的摆布。在写作领域,人工智能已经工作了十多年。作为日常作家,我们其他人长期以来一直在使用人工智能驱动的编辑工具。像 Sudowrite、Jasper 和 Wordtune 这样的商业程序,已经将大型语言模型技术融入其中,并已经上市,任何人都可以用信用卡购买。

新的情况是,我们似乎已经达到了一个转折点。AI工具生成的文本正在被驯化。也许是时候制定一些通道规则了。

艾萨克·阿西莫夫提出的机器人三定律,它定义了机器人被允许的行为方式。弗兰克·帕斯夸莱的“新机器人定律”专注于人类和机器的交叉点,其格言是“机器人系统和人工智能应该补充职业,而不是取代它们”和“机器人系统和人工智能不应该伪造人性”。

教育工作者、专业人士和普通用户无法控制大型科技公司在其发布的大型语言模型中加入了哪些能力。但也许我们应该尝试解决伪造问题。

2019年,加州通过了“BOT法案”,要求在自动程序被用于激励商业或影响投票时进行披露。也许“披露”系统有助于解决书面“造假”问题,这里指的是将实际由人工智能生成的文字归功于人。在出版界,我们已经看到了人工智能署名的案例:Beta Writer被列为锂离子电池的作者;腾讯将Dreamwriter列为作者。许多新闻报道都表明了人工智能在何处撰写或合著了文章。也许学校学术诚信准则、媒体机构、律师事务所和其他机构可以采用指导方针,要求在人工智能撰写或为人类在世界上发布的文章做出贡献时进行确认。

对于完全(或至少在很大程度上)由人工智能生成的文本,该系统可能是可行的,至少在原则上是可行的。但随之而来的是滑坡谬误:在需要注明出处之前,必须由人工智能写多少内容?人工智能现在充斥着语法和风格程序(如微软编辑器和 Grammarly)。像 Sudowrite 这样的程序只会成倍增加。没有人建议你在使用拼写检查时将微软列为合著者。但小说家在将由 Sudowrite 生成的段落融入小说时,应该在什么时候提到这款软件呢?

还有一个问题是,将大型语言模型作为共同作者的尝试是否会适得其反。当 ChatGPT 于 2022 年底出现时,许多研究人员开始将其作为共同作者纳入其中,以承认其协作作用。但一些出版商大喊犯规,认为“像 ChatGPT 这样的 AI 并不能满足研究作者的标准,因为它们无法对科学论文的内容和完整性负责。”不出所料,其他出版商坚持认为需要承认 AI 的贡献。我们正处于未知的水域。

这些问题并不新鲜。所有类型的作者都会请朋友和这些意见来自人类,我们需要决定在致谢时是否至少应该将这些帮助者列为合著者,甚至将其列为“贡献者”或“合著者”。

当人类贡献的功劳到来时,如果我们未能给予它,总是有可能那些帮助过我们的人会发现。有了人工智能,情况就不同了。算法没有感情,也不能起诉。是的,一些真正的警察可能会试图寻找人工智能水印(假设制作该程序的公司将它们放在那里)。是的,风格分析程序——或目光敏锐的老师——通常可以发现新文本与人类通常的写作风格之间的差异。

但我怀疑大规模验证是否有效。除了物流问题,我们也没有简单易行的规则来决定多少不署名的 AI 协助是过多的。

为我自己的记分卡:临别赠言

我们所写的是我们自己的表达。无数的作家都比我能希望的更雄辩、更有洞察力。但我的文字,甚至是拼写错误的单词,甚至是蹩脚的句子,都来自我自己的思想和生活经历。在填写我的个人记分卡时,这些事情很重要。

一个 AI 程序可以在眨眼之间制造一个新闻故事。ETS 的软件可以在比我短得多的时间内给学生的论文打分,也许能发现我忽略的问题。但是当我写作时,署名是我的名字。当我给论文打分时,我是在接触另一个人类。

在我大学学习生涯的早期,一次经历让我牢牢记住了这种影响的重要性。当时我还是一名大二学生,名副其实的“愚者中的智者”,这里强调的是“愚者”部分。作为一名潜在的英语专业学生,我选修了一门名为“从柏拉图到德莱顿的文学批评”的课程,授课老师是诗人 J. V. 坎宁安。我的大多数同学都是大四学生或研究生,他们才是这门课的合适人选。

我不记得第一次写作作业的题目是什么了,但我清楚地记得我写得很痛苦。我超出了我的能力范围。坎宁安不会容忍傻瓜,他让我知道他同意我的观点。他在我的论文第一页上潦草地写下了他唯一的评论:

这是一个幼儿园孩子对思想史的拼凑。F。

当然,他是对的。在舔舐伤口之后,我发誓要学会分析和写作。时至今日,我仍然无比感激一位熟练的人类读者没有用花言巧语来搪塞这位新手。

任何人工智能语法或风格导师都不会如此直截了当和有效。

ChatGPT 或其后代可能会写出一篇更好的论文。也许不是特别有见地,尽管历史拼凑的成分会少一些。但是,这次作业的目的不是为了得到一个不错的分数。而是为了让我——一个未来的文学学生——与几个世纪前的作家进行互动,并努力理解他们所写的内容。在这个过程中,我希望能更进一步地学会分析性思考,找到自己的写作风格。

人类的写作是照亮我们心灵和连接人类的一把利剑,无论人工智能多么高效,保持这把剑的锋利是我们义不容辞的责任。

本文节选自:Who Wrote This?: How AI and the Lure of Efficiency Threaten Human Writing

作者:娜奥米·S·巴伦 语言学家,现任美国大学世界语言与文化系名誉教授。

本文来自微信公众号“腾讯研究院”,作者:娜奥米·S·巴伦,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

TA没有写简介,但内敛也是一种表达

下一篇

硬折扣的硬,就在于他能把这四块成本硬生生地打下来。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业