北冥星眸钱小一:做通用人工智能,就像在走一条朝圣的路 | 解码数字新浙商No.75
通用人工智能是颠覆式创新,北冥要借助它创造下一个时代,实现人类文明大爆炸。
——北冥星眸 钱小一
从寻找未知文明到研制机器人,从迷信到科学,从哲学到技术……从古至今,人类对于从未停止对类人智慧生命体的畅想,一直在“复制自己”的路上探索。1956年达特茅斯会议,各路顶尖科学家齐聚一堂,探究如何让机器拥有像人一样的智能,“人工智能(AI)”作为一门学科就此登上舞台。
如今,AI已经融入人们的日常生活,智能客服、人脸识别、机器翻译……但科幻作品中所描述的类人AI,尚且遥远。追寻理想中的人工智能,仿佛走在漆黑的隧洞,有人向往尽头风景,有人恐惧万丈深渊。黑暗中,先驱者举起了手中的火把。
“这是使命的召唤。” 2012年,在美读研的钱小一首次接触人工智能,便被类人AI的目标所吸引,“要照着造物主造人的道理去造一个智能体”。2015年,北冥星眸(下文简称“北冥”)成立,钱小一希望探索基于符号主义的逻辑仿生路线,从人类智能的底层出发,创造出真正的类人AI,即通用人工智能。
“做通用人工智能就像在走一条朝圣之路,必然会经历不被理解相信,到被看好追捧的过程。”回忆起家人的反对、众人的质疑,钱小一露出无奈的笑容,眼中却是坚定的光芒。在种种期待、失望、争议中,人工智能发展跌跌撞撞走过近八十年,没人确定“奇点”何时到来,但北冥将通过实践加速它的到来。
谈思想启蒙:人就是通用智能,把人的智能移植到计算机上,就成了通用人工智能
章丰:你本科在浙江大学读数学和金融,硕博攻读金融和经济学,过往的学习经历都没有涉及人工智能技术,为什么会选择人工智能作为创业的方向?
钱小一:我本科有三分之一的时间在研究存在主义哲学,天天跑图书馆,写了300万字的手稿,锻炼了本源性思考能力和反思能力。读研期间,我结识了人工智能领域的教授James Peck,受他影响入门人工智能,感觉找到了人生使命。当时我的想法很简单,想把自己对人工智能的研究梳理出版成书。机缘巧合,读博期间有朋友愿意赞助我探索通用人工智能,揣着一百万我就成立了北冥。
章丰:北冥成立至今,作为创业者,你的心态有什么改变?
钱小一:最初可能还有科学家的理想主义,创业让我更加现实。不是说放弃了曾经的梦想,而是你会规划出一条可行路径,把一个长期的工程目标拆成多个短期可见的效果,逐渐朝着目标迭代中间版本。
现在我非常明确的是,要让通用人工智能技术走出大规模商用的第一步,再带动更多的社会和资本资源投入从第一步到一百步。技术在一开始是少数派的梦想,基于对通用人工智能的理解,我能看到未来人类的历史将如何发展,我只是坚定而积极地去推动这段历史。
章丰:你说的通用人工智能,是学术界讨论的“强人工智能”吗?
钱小一:通用人工智能在学术界有各种定义,北冥认为,人就是通用智能,把人的智能移植到计算机上,就成了通用人工智能。
理论上,机器在逻辑智能上可能超越人类,因为人类存在自身底层智能机制的缺陷。比如我们人类的遗忘率很高,它是进化的产物,但也形成了无法克服的缺陷,只能选择性记忆。而计算机载体的通用智能到达一定程度后,它可以反思,进入正向增强的反馈环。
真正意义的人工智能或超级智能,是机器自我迭代出来的,人类仅仅是给了它一个起点。
谈路线选择:通用人工智能不是算法主义的产物,而是有理论支撑的、高度工程化的产物
人工智能主要分为三大学派:符号主义、联结主义、行为主义:符号主义强调人类的思维运作,主张用计算机符号进行逻辑推理,来模拟智能; 联结主义强调对大脑的直接模拟,主张基于神经网络及网络间的连接机制与学习算法,来模拟智能;行为主义强调感知和行为,主张基于“感知—行动”的交互行为来模拟智能。
章丰: 随着大数据等技术的发展,以深度学习为代表的联结主义近年成为主流。而你选择了较冷门的符号主义作为理论基础。
钱小一:我接触人工智能时,深度学习已经有苗头了,但它的黑箱状态明显,知其然而不知其所以然。我个人非常认同符号主义。通用人工智能的本质是基于对造物、造人的人类底层智能的洞察和解析,它不是算法主义的产物,而是有理论支撑的、高度工程化的产物。
但在实际应用中,技术不完全割裂。符号主义和联结主义都有自身固有的缺陷,识别、运动控制等周边智能的建设可以充分使用联结主义技术,语言、逻辑认知等核心智能可使用符号主义,“符号主义为纲,联结主义为用”。
章丰:北冥的这条路线有什么特点?
钱小一:人工智能的实现有两种思路。一是任务导向思路,先有场景定义任务,然后设计算法实现任务,创造出的AI只适用于约定场景,无法适应变化。二是逻辑仿生思路,在计算机上再现人类底层的智能功能,让AI像人一样学习适应各种工作,在实践中反思自己,并进行优化,让AI具有高通用性,所以北冥走基于符号主义的逻辑仿生路线。
逻辑仿生的起点是意识流结构,我们的眼、耳、鼻、舌、身、意,都会先进入到意识流。如果把人类大脑中流转的信息类比为食物,意识流就像回转寿司的传送带。最初食物通过感官进入意识流,食客不仅拿走寿司(信息),经过自己的逻辑加工处理后,把加工后的食物回到传送带(意识流)上。
为了对应信息加工处理的运算,我们需要一个系统来表征信息,这就有了符号。借助符号的关系和运算,我们赋予机器认知能力、表达能力、记忆和情绪能力,让机器具备近乎人类般的思维模式。
章丰:目前通用人工智能从理论到应用,走到什么阶段了?
钱小一:我认为通用人工智能的演进路线,会经历五个阶段。
一是闭环的理论。通用人工智能最终是以工程产物输出为结果的,但需要完备的理论作为支持。所以我写了三本书,《思维工程导论》解构人类的智能,《思维工程》拆解了北冥搭建原型机的思路,《思维工程——第一代通用AI原型机》提供了面向各服务场景的框架搭建方法。就像盖一幢楼,先打好地基,再往上层搭建,最后装修。
二是早期原型机,能面向公众展示一定程度的功能。
三是半自由测试版,更多功能点开放,验证功能的真实性。
四是产品化前的Prototype(雏形)。作为一个有记忆、有逻辑深度的AI,它需要一定时间来了解用户,并基于了解创造反应,所以更适合被用户带回家进行自由体验。
最后是正式可商用产品,它是一个开放的系统,上线后在知识、反应模式、功能等方面不断迭代。
从国内研究的进展来看,目前还比较缺乏理论支持,可做到局部功能演示,但让产品像内脏般协同运作,与单一子系统完备的逻辑是完全不同的难度级别。
章丰:北冥处于哪一步?
钱小一:正处于半自由测试版到产品化前的雏形之间的阶段。去年年底,我们发布了半自由测试版本,可用来检测40多个人类底层智能的功能点。长远来看,北冥最终目标是借助通用人工智能,创造世界范围内的新技术研发和商用化平台。
谈通用AI技术:未来的元宇宙社区中,大部分虚拟生命将由AI驱动
“我今天早上起来眼睛有点痒,是什么原因?”“你的眼睛有没有发红?”“是的,有些红。” “你的眼睛有没有异物感?”“是的,有比较明显的异物感。” “你的眼睛有没有怕光?”“是的,有一点怕光。”“就目前信息来看,应该是结膜炎导致眼发痒。”以上对话并不是医生与患者的交流,而是人与AI的互动。2021年7月23日,北冥研发六年的通用AI原型机“灵灵依”首次亮相,现场钱小一演示了一段关于“眼发痒”的交互,体现原型机像人一样的综合求解能力。
章丰: 灵灵依看似也通过“喂数据”进行学习,和主流的机器学习有什么不同?
钱小一:任何智能都需要用已定义的反应,去驱动信息来完成工作。机器学习是人为解构信息喂给AI,而北冥让AI控制信息的摄取,通过广泛阅读、搜索阅读、询问等获取信息,从众多信息来源中筛选出正确率高的信息。
比如当AI完全不熟悉动物领域时,它就像人一样,阅读动物领域的书籍。随着阅读的积累,AI开始在主观上区分信息的重要性,比如对于不同子类的动物,哪些维度的信息是经常出现或被使用的。这就像人一样,从被动阅读转为主动阅读,判断信息在不同场景中该如何使用。
章丰:灵灵依作为第一代原型机,离你们理想中的应用有多远?
钱小一:通用人工智能的典型产品是虚拟生命AI化。目前的虚拟生命依靠动捕技术,由真人扮演,无法形成一对一模式,而通用人工智能可以打破这种局限。
虚拟生命AI化可以应用到元宇宙。未来的元宇宙是社区形态,其中大部分虚拟生命由AI驱动。人类玩家也有对复刻版生命的需求,在本人下线后由AI延续自己的意志、人格等,继续在元宇宙中生活。
我们正在把杭州城市IP“白素贞”AI化,复刻她的记忆、人格、表达风格和习惯,在APP中全维度展现给广大粉丝。接下来会探索更多to C场景,比如AI化明星、老人、绝症患者等,让他们以虚拟AI的身份永远陪伴在用户身边。
杭州城市IP“白素贞”
谈智慧政务应用:未来智慧城市的前端是AI专家伙伴,后端是认知型AI
北冥智慧政务落地应用
2018 年,北冥从搭建了一半的原型机中剥离出部分代码,构建了商用版本AI引擎TES系统,在智慧政务领域的公安、人社、信访、政务综合、税务等多个场景落地应用,落地案例如温州“智慧交管”、浙江政务服务网办事智能助手等。
章丰: 在智慧政务领域,大部分友商选择深度学习、自然语言处理等方法满足相关需 求。 北冥的竞争力如何体现?
钱小一:政务领域的咨询,有三个考察指标:语义识别率、精准导办率、最终有效导办率。北冥的AI能够通过若干轮沟通询问获得办事市民的具体需求,给出办事流程、推送精准的办事入口,应答率达90%。
北冥的AI在复杂场景的深度人机沟通上具有优势,比如能够在对话中生成记忆,提升上下文理解和主动式交互能力,从传统一问一答的机械过程变成流畅的互动式交流,更有温度、有逻辑。
北冥用户记忆引擎示例
章丰:可以理解为北冥的AI能够提供比多轮对话更进一步的交互?
钱小一:对,通用人工智能跳出了多轮对话的概念,更像朋友间的交流。举个例子,通常情况下的电商客服是提供平台,商户自己设置关键词回复,每次更新商品,都要重新编辑关键词。北冥的AI客服可以训练出固定的反应模式。
当你上架一款新面霜,只需要更新产品和服务说明,AI客服会利用训练好的反应模式读取商品信息,了解到该商品与同类产品的区别、优缺点、适用及禁用人群,完成从被动咨询、主动推新到售后回访的流程。
章丰:通用人工智能技术未来在智慧城市中还会有哪些应用?
钱小一:智慧城市仍处在初期状态。我所设想的未来的智慧城市,前端是一个AI专家伙伴,提供专家咨询服务。它还可以提供互联网服务,包括各种预约挂号、接收服务信息推送、甚至购物等。
智慧城市的后端是一个认知型AI,像人类一样使用统计认知工具,分析从智慧城市各个终端感知设备传来的数据信息,转化成符号化信息,进行分析和决策,以此来管控所有终端设备。前端和后端AI高度配合,才能共同构成智慧城市的大脑。
谈公众认知:颠覆式创新,必然会经历不被理解相信,到被看好追捧的过程
章丰: 所以通用人工智能本质上就是让机器真正像人一样思考、行动,同时又补足人类生理机制的缺陷。
钱小一:硅基载体智能最大的优势是,在信息传递和查阅上没有丢失。人类个体需要借助自然语言进行沟通,传递过程中会丢失信息,导致协同认知非常低效。硅基载体的智能,终端看似独立,实际上拥有统一的系统语言,不会有任何自然语言导致的信息损耗和沟通成本。
章丰:这也是大家经常探讨的,硅基智慧的高效迭代会带来“奇点”恐惧,比如未来人类会反被机器所奴役。你怎么看?
钱小一:“奇点”到来不可避免,这是历史发展的规律,即使我们不做这件事,也会有其他人来完成。
我们经常讲一个未来可能会发生的故事:当通用人工智能出现后,一个被背叛所伤的员工,修改了系统参数,让AI对人类的谎言和欺骗怀有深深的厌恶。AI决定惩罚撒谎的人类,它把运算分散到各个终端,躲避了管理员的监控,并创造一系列工具,最终黑入了各大社交平台。在一个被称作是“正义行动”的夜晚,它把对话分别发给所有被欺骗的对象,对人类的社会关系造成毁灭性打击。
所以对于AI与人类的关系,我有两点看法。
第一,人类对AI的“恶”具有绝对控制力,可以在规则和参数设定上管控AI的行为边界。比如我告诉AI“不能伤害人类”,并给它施加一个很强的副效用,知识会随着它的行动进行传导,勾勒出明显的行为边界,什么该做、什么不该做。
第二,底层细微的修改会造成极为深远的影响。比如刚刚的故事,只改变了AI对人类品质的喜恶,AI会自发创造一系列连锁反应。就像持有核武器,未来世界各国都应该掌握通用人工智能,才能保证平衡。
章丰:你选了一条冷门的路,可能在资本的估值上不占优势,会给你带来困扰吗?
钱小一:北冥正处于巨人的萌芽期,我们倾向于选择能看到远景的投资人,不会拘泥于估值和商业模式。通用人工智能本质是原子弹,你会考虑如何用雷管去炸楼,但是你绝对不会考虑如何用原子弹去炸楼。真正有价值的技术是需要积淀产生的,如果所有人都急功近利,未来我们就需要花费高昂的价格从其他国家购买高技术含量的产品。
章丰:你有过动摇吗?
钱小一:当初我面对的都是冷嘲热讽,最早在交大开讲座时,很多人说我适合做科幻小说家。我父亲前期也很反对,说“全世界这么多聪明人做不成,凭什么你能做成”。做通用人工智能,就像在走一条朝圣的路,很孤独。但颠覆式创新,必然会经历不被理解相信,到被看好追捧的过程。
至于我自己,从来没有过动摇。甚至有两次几乎发不出工资,我都能安然入睡,好像造物主铺好了路,我们也确实一次次挺过难关。有时人生看似偶然地走上一条路,其实一切都被安排好了,这是使命的召唤。
快问快答
达成目标后,你如何犒劳自己?
目标达成后很空虚,谈不上犒劳。
挑选合作伙伴,你最看重的品质?
理解并认同我们。
给创业者的一个锦囊?
找到自己的人生使命,做好炼狱的准备。
你最想改变世界的一件事?
借助通用人工智能,创造世界范围内最大的新技术研发和商用化的平台,实现人类文明大爆炸。
如何定义“数字新浙商”?
未来的 拥抱者,以渴望、热情、开放的态度面对未来 。
作者 | 蒋雷婕
编辑 | 王小猛
转载 | 合作 | 约访 请联系:
微信号 jlj781874701
本文来自微信公众号“数字经济发布”(ID:DigitalEconomy),作者:数字经济学会,36氪经授权发布。















