“商量SenseChat”开放服务,为什么商汤进展如此迅速?

蓝莓·2023年09月01日 18:13
在市场聚焦大模型带来的新一轮AI革命时,各人工智能公司都在寻求新的突破。

就在昨日(8月31日),作为自上一代就稳坐人工智能头部宝座的商汤科技,正式面向广大用户开放其自然语言大模型应用“商量SenseChat”。

“商量SenseChat”于今年4月正式推出,是国内最早的基于千亿参数大语言模型之一,截至目前已在金融、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立深度合作,通过提供多种灵活的API接口和服务。

8月28日,商汤发布截至今年6月30日的中期财报。整体来看,各项指标表现稳健。财报显示,期内营业收入14.3亿元(人民币,下同),同比增幅1.3%。

值得注意的是,期内商汤亏损净额按年收窄了2%,经调整亏损净额按年收窄6.7%。而且,财报显示,生成式AI的相关收入取得了670.4%的强劲增长。

这意味着,企业已经度过了前期技术投入带来高额亏损的阶段,随着人工智能技术应用逐步渗透,商汤迎来了研发投入与商业化经营的拐点。

行业横向对比来看,大模型商业化落地进程,同行更多停留在摸索阶段,商汤却在短时间内实现了技术到商业的转化,这离不开商汤多年来打下的坚实技术基础,从而得以在大模型机会来临时,先人一步落地。

十年技术基本盘

如果从商汤的技术发展路线来看,可以说商汤陪伴中国人工智能行业走过了多个发展阶段,是行业演变最重要的注脚之一。

在大模型风靡之前,商汤已经在AI的原生能力方面储备良多。

比如商汤是最早布局AIDC人工智能超算中心的AI公司。

2018年,商汤筹备落子的AIDC,于2022年正式于上海临港投用,实现对外输出算力2.5 ExaFLOPS,可支持最多20个千亿参数量超大模型并行训练。

某种意义上,这是中国人工智能从单一场景应用正式转向通用人工智能的标志。在此之前,全球范围内规模性算力中心多以传统串行计算为主、并行计算为辅。

此外,领先的智算工程能力也为其大模型训练打下基础。

AIDC——万卡(GPU)级别的智能计算中心,本身即是智算工程的产物。如今,商汤针对新大模型的自动化数据标注服务目前已将智能标注效率提升百倍;大模型推理部署服务可将大模型推理效率提高600%;大模型并行训练服务支持单集群3200卡5000亿稠密参数模型训练。

不难看出,商汤在人工智能1.0时代具有前瞻性的布局,和坚定的投入,帮助其高效地将技术优势延续到了人工智能2.0时代。

进而,商汤今年很早便顺理成章地输出了自家的大模型,并形成了一系列生成式AI产品。

财报显示,今年上半年,商汤联合上海人工智能实验室等多家顶尖科研机构发布了预训练大语言模型InternLM,成为国内首个超越GPT-3.5-turbo性能的基模型,并在其“日日新”大模型体系基础上发布了生成式AI产品系列,包括“商量SenseChat”、“秒画SenseMirage”及”如影SenseAvatar”等。

但在大模型赛道经历了年初的火爆之后,显然眼下,市场关注重点已经转向大模型的落地商业化竞争。从不少大厂接连推出行业大模型便可看出,业内形成的共识是,真正能赋能具体产业的人工智能能力,才是好能力。

商汤则再次走在了前面,扎实的技术基本盘推动其大模型不断迭代适配。

商汤已在通用模型领域,实现语言模型、图像模型、多模态模型与AIGC“四箭齐发”,据商汤2022年年报显示,截至去年年末,在专用模型领域,则已累计对外输出商业模型达6.7万个。

以中国当前产业高质量转型阶段的关键抓手——智能汽车制造领域为例,2023上半年商汤的智能汽车量产业务实现5.7倍同比增长,量产交付数量达到39万台车。

从AI1.0走向2.0

产业落地经验并非一日之功。从商汤过往落地成果来看,商汤已经形成了一套商业化生态构建的方法论。

以商汤业务架构来看,智慧城市、智慧商业、智慧生活和智能汽车是四大主要业务板块。这四大业务板块各自的成长,也对应了商汤的不同阶段,并为商汤提供了大量产业层面的“know-how”——这对于眼下大模型的落地至关重要。

在发展初期,做视觉AI起家的商汤,在智慧城市领域树立起了人工智能的壁垒。这是上一个人工智能高峰期,最为成熟的落地场景。

随后,商汤继续开拓B端业务,面向商家的智慧商业和智慧生活,成为接棒智慧城市之后的两大现金牛。

今年半年报显示,智慧商业和智慧生活持续保持高增长,其中智慧商业更是增长达50%,为商汤贡献近六成营收。商汤称,这主要受到AI大模型和生成式AI产品的落地推动。

甚至经过大模型及生成式AI能力赋能,全公司相关收入实现670.4%的大幅增长。

本质来说,商汤大模型得以快速转化为业绩的原因,是高效匹配客户需求。尤其在迭代速度按天计算的大模型时代,满足千变万化的客户需求,是最基本但也最具挑战性的环节。

商汤首席科学家王晓刚曾表示:“我们的这种更新,每天也都是不断的去接到用户的调用,还有很多客户,实际上是对我们模型有全方位的测试和评估,也会给出我们方向的建议,所以我们收到反馈以后,其实每隔几天都会进行一个快速的更新。”

此外,商汤还有一个“杀手锏”,就是高吞吐量的数据清洗能力。从4月到8月,商汤花费了非常大的力气做数据清洗,过程中专注于补充和构建有多步骤的推理语料,形成一套非常高效的闭环进行模型的训练,使得模型的推理能力得到了大幅提升。

目前商汤每月能够产出约2万亿token的高质量数据,预计年底高质量数据储备将突破10万亿token,足以支持更加强大的基模型的训练。

通过数据清洗,商汤在中文语料的储备方面达到了一个相当高的水平,是业内领先的能力,因此在知识理解和推理方面都有非常优异的表现。

更深层次来看,随着 AI技术的升级,商汤一早就开始尝试将自己的先进能力提炼出来,定义成一个AI基础设施——AI大装置SenseCore。这个大装置不仅成为公司迭代大模型的核心引擎,而且也能为业内提供一个足够低成本、低门槛的服务。

SenseCore相当于在大模型流行之前,就为大模型竞争抢占了先机。

最新财报显示,SenseCore持续升级,上线GPU数量由2023年3月底的27000块提升至日前的约30000块,算力规模提升20%至6 ExaFLOPS。

在此基础上,商汤大语言模型和文生图模型的迭代速度惊人。

今年8月,新模型InternLM-123B完成训练,在全球51个知名评测集(包括MMLU, AGIEval, ARC, CEval, Race, GSM8K等)共计30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型。

今年7月,秒画升级3.0,模型参数量提升至70亿参数,并采用全新的生成模型架构,秒画3.0核心算法在COCO benchmark上超过了谷歌的Imagen与OpenAI的DALL·E 2。秒画4.0则预计在2023年三季度内推出。

大模型的系统性改造

可以看出,在同行还在为了大模型找落地场景的时候,商汤大量的固有业务,已经可供大模型落地。大模型对整体业务,提供了系统性的、长期性的、成长性的升级。

半年报显示,智慧商业期内营收达到8.53亿元,同比增长超50%,服务客户数481个,单客户收入提高59.9%,该业务收入的大幅增长也使得其对公司的业绩贡献占比达59.5%,同比提升超19个百分点。

商汤称,随着大模型能力跨越应用红线,企业级AI市场打开了更多商业应用场景,公司把握了生成式AI相关业务新涌现的商机,在能源、金融、地产、传媒、工业等十个垂直领域定制行业大模型。

此外,智慧生活在今年上半年实现同比6.7%的增长,营收约3.12亿元,收入占比略提升至21.8%,客户数达到270个,同比增加87个。

该业务增长同样主要受生成式AI商业化的推动。商汤通过对手机、移动互联网等上百个客户提供大模型赋能的新产品及新功能,最终触达数亿终端、中小企业与个人用户。

近年来的新增长曲线智能汽车业务,同样进入了以量产规模为主导的成熟商业化阶段,量产交付数、量产收入及单车价值均实现增长。

科技投入从来讲究长期主义,但市场和资本又往往是焦急的,这样的错位中,不少企业难抗压力,选择屈服或放弃,但商汤是少有的那个从实验室走出来,一路上又坚定不移投入科技的技术企业。

眼下,大模型的到来,是个考验,也是个礼物,奖赏如商汤这样有深厚技术基础的企业。水滴石穿,从AI1.0时代走到2.0时代,商汤显得更从容了。

+1
179

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

从可再生材料到可持续旅行目的地,时尚x旅行的绿色创新实验还将延续。

2023-09-01

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业