众多客户、合作伙伴以及对这家芯片公司抱有极高期望的粉丝们纷纷聚集到 SAP 中心——美国冰球联盟圣何塞鲨鱼队的主场。在那里,他们聆听了黄仁勋为英伟达一场年度大会所做的主旨演讲。今年的会议地点可以容纳大约 11000 名听众。就在今年2月,职业摔角的 WWE Monday Night RAW 就曾在这里上演。今年5月,贾斯汀·汀布莱克(Justin Timberlake) 也将在这个舞台上举办演唱会。即便是每年备受瞩目的苹果 iPhone 与 iPad 发布会也未曾能让这样宽敞的空间座无虚席。但如今,能聚集科技圈所有目光焦点的,无疑是黄仁勋。他从一位拥有众多视频游戏忠实粉丝的半导体公司 CEO ,蜕变、成拥有足够吸引力,能吸引成千上万人参与公司庆典的人工智能专家。
相对于《华尔街日报》的类比,我确实认为拿iPhone 发布会比较会更加合适;尤其是在 iPhone 早期,苹果本可以轻轻松松就吸引到 11000 人填满一个场馆。不过,恐怕还有一个更合适的对照,那就是 Windows 95 的发布。2021 年,Lance Ulanoff在 Medium 上曾写过一篇回顾:
光靠一个操作系统就能够几乎引发全世界的关注,这种情形是很难想象的,但 1995 年 Windows 95 发布的时候就是这样的。1995年8月24日,记者们从世界各地涌向了当时尽管郁郁葱葱、但规模尚小的微软雷德蒙德园区。入场券印着原先的 Windows 开始按钮的图案(我至今仍保存着我的那张入场券)——“开始”成为了整场活动的核心主题,开启了这场只对受邀人开放的嘉年华般的盛会......那是技术界一段相对快乐且纯真的时光,或许也是在互联网成为一切主宰之前最后一场重大发布。在彼时,软件平台,而不是某篇博客或一件产品,还能改变世界。
作为 NVIDIA AI 企业解决方案的一部分,NIM 为开发者提供了一条简化的路径,可以开发基于人工智能的企业应用以及在生产环境下部署人工智能模型。
NIM 是一套云原生的、优化过的系列微服务,其设计理念是为了减少产品进入市场的时间、简化生成式人工智能模型在各种环境下的部署过程,无论其是云平台、数据中心还是 GPU 加速的工作站。通过采用行业标准的 API,NIM 将人工智能模型开发和生产部署的复杂性抽象出来,从而扩大了开发者的资源池。
NIM 实际上是预先打包好的容器,内置了组织启动模型部署所需的全部资源,而且这不仅仅是满足当前的需要,更着眼于未来的长远需求。黄仁勋展现一个吸引人的场景,即企业能够利用多个 NIM 在一种类似人工智能体的框架内协同工作,以完成复杂的任务。
想象一下 AI API 能做什么:AI API 就是一个交互接口,你只需与之对话即可。因此它属于这样一种未来软件,这种软件有一个非常简单的 API,我们称之为“人类”。这些不可思议的软件包将经过进一步的优化和打包,然后我们会把它们上传到网站,你可以随时下载、随身携带,可以在任何云平台、数据中心,或者在工作站上运行(前提是兼容),你唯一需要做的就是访问 ai.nvidia.com。我们称之为 Nvidia 推理微服务,但在公司内部,我们都叫它NIM。
想象一下,也许有朝一日聊天机器人就封装在一个 NIM 里面。你可以组合很多类似这样的聊天机器人,而这正是未来软件的开发方式。未来我们会如何开发软件呢?你可能不会从头开始去写软件了,也不太可能编写大量的 Python 代码。你更可能会通过整合各种人工智能的功能来组建一支人工智能团队。
很有可能出现一种所谓的超级人工智能呢个,用户可以通过它来下达指令,并将之分解成一系列的执行计划。这些计划中的某些任务可能会委派给专门的 NIM 来处理,比如某个擅长理解 SAP(其语言是 ABAP)的 NIM。或者,NIM 可能要从 ServiceNow 平台上检索信息。接下来,另一个 NIM 可能会对这些信息进行分析处理——也许是去运行某种优化软件,应用组合优化算法;也许仅仅是进行基础运算;又或者是利用 Pandas 这样的工具做一些数值分析。随后,它会带着结果返回,并与其他各方的结果汇总。由于它被告知了“正确答案应该是什么样的”,所以能够生成出合适的输出,并把这些展示给用户。我们可以利用所有的 NIM,每个小时准时获得一份报告,报告内容可能包括项目计划、预测、客户警示或是数据库的错误记录等相关事务。
由于这些 NIM 已经被封装好,可以在你的系统就绪,只要你的数据中心或云服务里配备了 Nvidia 的 GPU,它们就能够协同工作,完成不可思议的任务。
但你注意到一个问题了吗?英伟达既会自己开发NIM,同时还会鼓励更广泛的生态体系去开发,其目标是免费提供给人使用——但这些 NIM 只能在英伟达的 GPU 上运行。
NIM 只能在英伟达的 GPU 上运行
于是这篇文章的讨论又回到了最初的原点:在 ChatGPT 发布之前那个时代,英伟达围绕着其 GPU 的软件生态体系构筑了一个相当强大的(免费)护城河,但挑战在于,市场对这些软件的应用前景还不是十分的明朗。时至今日,GPU 的具体用例已经非常明朗,而且这些用例都是发生在 CUDA 框架之上很高层面的;这一点,再加上寻求更经济的英伟达替代品的巨大动力,意味着摆脱 CUDA 的压力与可能性比以往任何时候都要大(尽管对于较为底层的工作,尤其对于模型训练而言,这种情况可能还很遥远)。
英伟达已经开始做出回应:我认为,从一个角度去理解的话,DGX Cloud 是英伟达的一种策略,想捕捉的是尽管 AMD 芯片性能更佳但仍购买 Intel 服务器芯片的同一片市场(因为已经围绕着英特尔进行标准化了);而 NIM 则是英伟达想搞锁定的又一次尝试。