AI硬件战事凶猛 钉钉用3个月完成逆袭
本文约4500字,建议阅读9分钟
AI硬件赛道从未如此拥挤。
从Meta两个离职员工做出能对话的智能戒指Stream,到集成AI助手的眼镜与便携录音卡片,甚至是吊坠和腕带,科技公司正试图将人工智能嵌入一切可穿戴设备中。即便马斯克不做出“边缘智能会兴起”的论断,在硅谷,一场围绕交互入口的硬件争夺战早已全面打响。
国内大厂也不遑多让。在8月底一个代号为“蕨”的大版本发布上,钉钉首款AI硬件产品Dingtalk A1面世,它带着钉钉的硬件基因。在阿里内部,这是一支打过硬件胜仗的团队。于外部而言,很多人以为这只是一次智能硬件赛道的狙击,而“大厂下场”只是给本就拥挤的赛道投注了更多的关注度。
但钉钉为什么要在这个时候下场做AI硬件,可能很多人都想错了。
很多人在高举高打,抛出各种关于AI改变世界的宏伟叙事,这会带来眼球的关注和钱的流动。钉钉则有些不同。
AI如果能够改变世界,一定是多数人参与,但首先,人要帮助AI理解物理世界。要让每个人都能主动地借助工具,帮AI提升对物理世界的理解,工具普惠是必经之路。
在钉钉看来,所谓AI普惠,绝非少数公司从上至下的灌输可以完成。它由每一个普通员工在日常体验的观感塑造:它可能是一张表格的搭建,可能是一个钉钉客服点对点的响应,也可能是某个钉钉程序员奔赴各地的客户拜访。一切的发生是琐碎的,小声的,如同细水长流。
但如果能够更深地理解钉钉长久以来的坚持,可能会认同这一点:Dingtalk A1绝非为战胜某一家公司或作为某一款爆品而生,它是钉钉AI普惠理念落下的第一子,也是一段漫长跋涉的起点。
“沉默的大多数”和永远在场的AI
截至2024年底,全国有6000多万家企业,中小企业占全部规模企业中的绝大多数,他们维系着中国经济的活力。
然而,AI浪潮轰鸣而至时,一些小微企业却离涛声很远。他们害怕被时代抛下,“必须做AI。”已然成为共识,但怎么做、怎么用,却四顾茫然。他们成为了当下AI热浪中“沉默的大多数”。
这里首先是技术的门槛。
如今AI大模型仍然是少数人的生产力工具,它需要人不断调校、优化,对于一家缺人、缺钱、更缺时间的小公司,显然有极高的应用门槛。以义乌为例,十人以下的企业占了绝大多数,它们没有明确的“管理部门”,很少“开会”,更谈不上流程。
“我们在短视频 App 上天天在刷 AI,感觉 AI 已经统治了整个世界。但真正走进企业,你会发现,很多企业连最基本的办公软件都用不好。”一位钉钉服务商观察到。
很多企业对AI大模型的落地无从下手,也没有额外的精力去和各种AI工具磨合。这些用户期待出现一种产品,能以最简单、高效的方式,解决日常问题,可见、可感地提高生产力。
这就是中国最真实的企业级市场,层次丰富,环境复杂。
因此,AI真正走向普惠,不在于让模型更强悍,而是让门槛归零。
作为在这个市场沉淀多年的产品,此时此刻,钉钉很清楚,软件作为入口,已经触及其边界:软件有极高的启动成本,正如钉钉团队调研中,一位客户所说:“当我真正想要记录什么东西时,根本来不及打开软件。”
这也是DingTalk A1的源起,它的使命很明确:让“AI永远在场”。
爱迪生点亮电气时代第一盏白炽灯,苹果以触摸代替键盘的iPhone开启了移动互联网时代,每一次技术革命的飞跃,终究要以物理硬件为载体。毕竟,人类只能和可触碰的物品产生更密集的互动和关联。
作为钉钉的第一个AI硬件,DingTalk A1以卡片式录音笔的形式呈现。这主要是基于使用“无感”的考虑。AI硬件毕竟是新事物,交互界面必须足够简洁清晰,才能最快上手。DingTalk A1贴合手机,实现了全场景、全天候随身携带,而且可一键操作,用户只需要做两件事:按键,开始。
比如一位销售公司的负责人,有时会想到代办事项或解决方案,会随手打开A1录下。“比打开手机找app方便多了,人家也不会奇怪,我自己也方便。”
如果几年后回头看,DingTalk A1的意义远不止于一张卡片录音笔,更像打通数据世界和物理世界的桥梁,也是“空间智能”时代的一次关键占位。
开启空间智能的第一把钥匙
11月10日,美国斯坦福大学教授李飞飞发文,提出“空间智能”的概念。她认为,这将成为AI技术的下一座高峰。当前以大型语言模型为代表的AI系统,虽然能熟练生成文字与图像,却仍停留在“语言的世界”中,缺乏对现实空间、物理规律与因果关系的真正理解。
而人与人、人与物之间的互动,构成了世界远超语言的复杂性。毫无疑问,新一代的AI大模型要真正具备能动性,像人类一样在现实世界中感知、推理和行动。
当下,我们通过摄像头、麦克风、传感器等等,丰富输入方式。通过语音智能、视觉智能、触觉智能,让AI逐渐打开“五感”,一步步理解物理空间中人类行为的意义,最终在几何、物理层面“重建”世界。
如果我们认同这样的路径,DingTalk A1无疑是建立语音智能的一个开端。
通过这个无门槛的接口,AI能获取不间断的非结构化、多维度空间的信息。
相比普通智能机只能调用麦克风,DingTalk A1配置了5颗全向麦克风加1颗骨传导麦克风,可以识别8米内的声音,结果是这种信息获取的广度和深度远非手机能企及。
如果说此前注入企业级大模型的数据是涓涓溪流,在DingTalk A1配合下,汇入的数据将如滔滔江河。
比如与DingTalk A1配合的AI产品“AI听记”增加了“可视化录音”功能,利用DingTalk A1的5个麦克风,能通过声纹识别不同发言人和他在空间中的方位。回溯录音时,界面上会以可视化的方式呈现谁在何时、何处发言,还原会议现场。
最终,钉钉希望这些信息能沉淀为“知识”和“智慧”,在工作场景中,提高普通员工、企业主的生产力,帮企业构建起自己的AI能力,也就是形成从数据汇集到模型构建、辅助决策、反馈学习的完整闭环。
显然,在这个闭环的形成过程中,人和AI的关系,已经明显从单向输入-输出进化为双向的人机协同。由DingTalk实现软硬件一体后,钉钉AI能将DingTalk收集的信息处理完毕,并嵌入整个工作流程。
对于钉钉的用户,助力“决策和行动”是最显性的变化,这让钉钉从一个被动的工作软件,变为有自我驱动力的参谋者和顾问。
一个案例是,某位做房车进出口的创业者,给海外客户打了电话,要做记录并翻译,接着自己写邮件。他现在用DingTalk A1开会后,电话会议直接实时转成中文,并根据会议要求生成邮件,他要做的,只是做最后的修改和把关。
而对于员工,这种效率提升并不会增加额外的时间成本,还能帮他们不断精进业务。比如一位社工平时开会用Dingtalk A1录音,钉钉能通过AI整理好文本,而且根据会议纪要,提供分析和总结。比如,AI助手会告诉他/她,在完成任务时,使用了什么方法,哪些方面已经做到位,哪些方面又存在不足。
这是钉钉引领的一场无声变革,在无数企业的办公室、仓库,钉钉用AI解放了中小企业管理者和一线员工的生产力。正如钉钉服务中心一个小二莫商所说:“钉钉做的事,其实就是在铺设管道。只有把这条管道修通,把服务做到极致,水、电、煤,也就是AI能力、算力和数据,才能真正流进每一家小企业。”
阿里真正跑出来的第一款AI硬件
在企业级AI市场,数据的源头来自全国数以千万计的企业,数据无疑是AI应用的原料,而算力才是AI世界的基座。
纵观全球,AI的算力、人才军备竞赛已经走到中场。进入空间智能AI时代后,可以料见的是各大势力的版图将继续延展。
以企业级AI硬件为例,中国珠三角超强的产业链,已经彻底消解了硬件制造的门槛。成本几十元,就可以在深圳造出一台卡片式录音笔。显然,AI硬件最终比拼的仍然是AI软件能力,甚至是整个系统和生态的开发能力。
最后留在场中的只有不断进击的强者。正因如此,AI普惠的责任,必然由钉钉这样的国民级应用承接。毕竟,钉钉的AI背靠整个阿里集团的算力、技术和人才。
作为阿里的重要布局,钉钉最直观展现了这样的实力。今年发布会上,钉钉一次发布了包括钉钉One、AI搜问、AI表格、AI听记、智能硬件DingTalk A1等超过10款AI产品。这种数量、质量和速度的产品矩阵推出,绝非创业公司可以企及。
背靠阿里技术也让钉钉的AI产品呈现出惊人的效能。钉钉AI表格和阿里云ADB-PG数据库团队协同推出存算一体架构O-Table,其支持单表千万行的实时更新,只需要秒级。
钉钉的DingTalk A1,严格意义上也是阿里真正跑出的第一款AI硬件。它也是行业内第一家加入实时转写功能的卡片式录音笔。实时意味着没有给AI模型修改的时间,容错率极低。在算力侧,如果将事后转写变为同步转写,模型必须具备处理高并发场景的算力。
而目前市场上的卡片式录音笔只能在录音结束后上传到云端,再通过外部大模型处理,之所以没有加入实时转写,是因为这一功能会让转写难度和成本指数级攀升。
更重要的是,卡片录音机普遍按时长计费,只能计算最终上传到云端的录音时长,一旦加入实时转录功能,需要重构整个收费模式。所以目前产品缺失这个看似简单的功能,实际上是算力鸿沟必然的结果。
开路者的重任落到了钉钉头上,因为也是这样的壁垒让DingTalk A1敢于实时转写的尝试。而且DingTalk A1提供了1000分钟的免费时长,为行业最高,其中,DingTalk A1的实时转写并不计入时长。
毋庸置疑的是,DingTalk A1作为一个硬件产品,并非一个高ROI的产品。产品背后的算力成本,短期内很难摊薄。
实际上,钉钉在AI软件侧也在行业首次使用了AI按效果付费的模式。在当下企业对AI付费产品仍心存犹疑时,作为一个头部企业,钉钉愿意垫付中小公司入场的“门票”,最终目的,是为了让企业“敢用、能用、用得起AI”。
这算得上是钉钉对AI普惠的某种担当。
“他们真的想把这个东西做好”
“很多人认为精英能改变世界,不是的,是脚踏实地的精英改变世界。”在8月份的Dingtalk A1发布后,钉钉创始人无招在接受36氪采访时说。
政治哲学学者迈克尔·桑德尔也曾提出过一个观点,精英之所以成功,不仅仅依靠自己的努力,其中也有出身、运气甚至时机的因素。一旦精英认为这种幸运理所应当,就会陷入“精英的傲慢”。
作为阿里的核心产品之一,钉钉天然能调动大量资源、资金,它的起跑线,已经远超同侪。
比如这次钉钉发布的这十多款产品身后,都有阿里大开大合的支援。仅仅以“AI听记”这一个产品为例,钉钉就与通义实验室完成了超过1亿小时的音视频数据训练。最终的结果,是对中国30多种方言、全球140种语言的识别准确率达到了90%的水准——他们用一个月时间,跑完了创业公司几年的路程。这种产品能力落实到DingTalk A1这个硬件上,就能在语音转写这个能力上快速与别人拉开差距。
这是很容易让人骄傲的现实:产品的成功固然有团队的自身努力,但绝不能否认钉钉“生而优越”的资源禀赋。
不过,钉钉团队始终对这种“优越感”保持着距离 ,力求坚持谦逊、脚踏实地的作风。
如果深入钉钉内部,你会发现,这是一群从高层到基层员工都很“落地”的团队。他们的管理层和研发人员,都要亲自走访客户,倾听客户的很多看似琐碎的疑问,包括找不到入口、为什么要收费等等。DingTalk A1的产品团队也是如此,有用户在小红书上称赞这个团队:在社区中,每天都有官方人员一条一条回复用户的问题,可以看出,他们真的想把这个东西做好。
在刚刚结束的双11,DingTalkA1已经成为录音笔相关品类的黑马,在抖音、天猫等平台销量和成交额都实现了领先,短短一周销量过万,把一批新老玩家都甩在了身后。从发布到现在仅有3个月,钉钉已经开始用逆袭的姿态改造这个赛道。
对于钉钉来说,DingTalk A1只是真正定义AI时代全新工作方式的开始,也是构造AI改变人类生活某一块拼图的开始。钉钉数亿用户、甚至竞争对手,都是这群构造者中的一员,他们会竞争、会合作,但都会奔往共同的未来。















