从苹果收购传闻到ASML豪掷13亿成大股东,起底Mistral AI的技术与商业密码
9 月初,苹果被曝出有意收购法国初创公司 Mistral AI 的消息,而紧随其后,半导体巨头 ASML 又以 13 亿欧元领投其 C 轮融资。目前,该公司估值已飙升至 140 亿美元,成为了欧洲 AI 赛道最炙手可热的标杆力量。
科技行业的风云变幻,让巨头们的每一个动向都备受瞩目。近期,苹果对 Mistral AI 收购意向的传闻甚嚣尘上,而就在 9 月 9 日,荷兰光刻机巨头 ASML 也官宣以 13 亿欧元领投 Mistral AI 的 C 轮融资,并与其建立战略合作伙伴关系。这一系列动作迅速让 Mistral AI 成为了讨论焦点,不禁让人好奇,Mistral AI 究竟是何方神圣,为何能引得科技巨头们竞相追逐?它究竟拥有怎样的独家优势,能在竞争激烈的 AI 赛道中脱颖而出?
巨头青睐,崭露头角引关注
Mistral AI 于 2023 年 4 月在法国巴黎正式创立,虽然诞生时间不长,却在 AI 领域迅速崭露头角。这家公司由 3 位 90 后天才 —— Arthur Mensch、Timothée Lacroix 和 Guillaume Lample 联合创办,其团队堪称豪华,核心成员皆来自 DeepMind、Meta 等顶尖机构。
Mistral AI 联合创始人 Guillaume Lample、Arthur Mensch、Timothée Lacroix(从左至右)
自成立以来,Mistral AI 的发展势头可谓迅猛。在成立仅仅 2 个月还未发布首批模型时,就成功斩获 1.05 亿欧元(约合 1.17 亿美元)的融资,这一成绩创下了当时欧洲史上最大的种子轮融资纪录。随后,2023 年 12 月,其完成 3.85 亿欧元(4.15 亿美元)的 A 轮融资;2024 年 6 月,又获得 6 亿欧元(6.45 亿美元)的 B 轮融资,彼时公司估值已飙升至 58 亿欧元(62 亿美元)。到了 2025 年,据路透社 9 月 8 日报道,在最新的 C 轮融资中,Mistral AI 成功筹集 17 亿欧元(20 亿美元),融资完成后,其估值更是有望高达 120 亿欧元(140 亿美元),较去年 6 月几乎实现翻倍。而此次领投的正是有着「全球光刻巨头」之称的半导体设备制造领域霸主——ASML,其投入的 13 亿欧元(15 亿美元)资金,使其成为 Mistral AI 的最大股东,并在董事会中获得重要席位,也让 Mistral AI 再次成为全球科技行业关注的焦点。
除了 ASML,苹果对 Mistral AI 的青睐也早有端倪。据彭博社著名记者 Mark Gurman 爆料,苹果公司近期正认真考虑收购法国人工智能初创公司 Mistral AI,或将成为苹果历史上最大的并购案。不难发现,虽然苹果在 AI 领域的发展一直较为稳健,但面对日益激烈的市场竞争,尤其是在 Siri 等智能助手的表现上,相比竞争对手略显逊色。而 Mistral AI 所展现出的强大技术潜力,恰好能够弥补苹果在 AI 方面的短板,这也使得收购 Mistral AI 成为苹果提升自身 AI 能力的一个极具吸引力的选择。
技术领航,多元模型实力超群
Mistral AI 之所以能够在短时间内获得如此高的估值,并吸引众多科技巨头的目光,其核心在于拥有一系列领先的技术和卓越的模型研发能力。据公司官网介绍,Mistral 系列模型共包含 8 类,并应用于 3 类任务:
* 支持批量执行的简单任务,如分类、客户支持或文本生成等
* 支持需要中等推理能力的中级任务,如数据提取、总结文档、撰写电子邮件、撰写职位描述或撰写产品描述等
* 支持需要强大推理能力或高度专业化的复杂任务,如合成文本生成、代码生成、RAG 或 Agent。
Mistral AI 模型系列
在众多系列产品中,Mistral AI 在轻量化和多模态技术领域的探索更是成果斐然。
轻量化模型,性能卓越
Mistral AI 推出的多款模型在业界引起了广泛关注。其中,开源的 Mistral 7B 模型堪称惊艳。该模型虽然仅有 70 亿参数,却展现出了超越同级别模型的性能。在诸多复杂的推理和编码任务中,Mistral 7B 的性能表现甚至可与一些参数规模更大的模型相媲美。这种轻量化的设计使得模型在运行时对硬件资源的需求大幅降低,同时推理速度得到显著提升,能够在有限算力的设备上高效运行。这一特性不仅契合了当下对设备性能和能耗优化的需求,也为 AI 技术在更多场景中的应用拓展了可能性。论文地址:https://hyper.ai/papers/2310.06825
在此基础上,改进版的稀疏专家混合模型(Mixture of Experts, MoE) Mixtral 8×7B 更是一举成为当时 Hugging Face 上最先进的 MoE 模型。在多数权威的基准测试中,Mixtral 8×7B 成功超越了 Llama 2 70B 等知名闭源大模型,且推理速度相较传统模型提高了 6 倍之多。这一优势使得在实际应用中,能够快速响应用户的请求,极大提升了用户体验。在 Apache 2.0 开源许可的条件下,其在人类基准测试(human benchmarks)中超越了 GPT-3.5 Turbo、Claude-2.1、Gemini Pro 和 Llama 2 70B 聊天模型。论文地址:https://hyper.ai/papers/2401.04088
多模态(Multimodal)技术的探索
除了在语言模型领域的深耕,Mistral AI 还积极布局多模态技术。其推出的 Pixtral Large 模型,成功实现了图像理解与文本生成的融合。在医疗领域,该模型可以对医学影像进行分析理解,并且生成相应的诊断报告或辅助医生进行病情分析;在自动驾驶场景中,能够根据摄像头捕捉到的道路图像信息,生成对应的行驶决策建议;在内容创作方面,用户仅需输入一张图片,Pixtral Large 便可基于对图片的理解生成与之相关的文本描述,为创意工作者提供了新的创作灵感。多模态技术的发展,拓展了 AI 的应用边界,使得 AI 能够在更多复杂场景中发挥作用,也让 Mistral AI 在 AI 技术多元化竞争中占据了有利位置。论文地址:https://hyper.ai/papers/2410.07073
独特的开源与丰富的产品矩阵
除了独特的技术优势外,Mistral AI 还注重开源生态的建设以及矩阵产品的布局。
开源模型,推动社区协作
Mistral AI 旗下多个重要模型,如 Mistral 7B、Mixtral 等,均开放权重,并且采用 Apache 2.0 开源许可。与一些坚持闭源路线的 AI 公司不同,Mistral AI 坚信开源能够汇聚全球开发者的智慧和力量,通过社区协作的方式,实现模型的快速迭代和优化。在开源社区中,来自世界各地的开发者可以自由获取这些模型的代码和权重,根据自己的需求和创意进行二次开发、改进和应用拓展,创造出各种适用于不同场景的 AI 应用,包括智能客服、内容创作工具、教育辅助软件等。
免费开放的重量模型
而开发者在使用过程中发现的问题和提出的改进建议,又反过来促进了 Mistral 模型的不断优化和升级,形成了一个良性循环。这种开源模式与 OpenAI、Anthropic 等闭源路线形成了鲜明对比,不仅为模型的性能提升和功能完善贡献了大量有价值的代码和算法,也为 Mistral AI 赢得了良好的口碑和广泛的社区支持。
开发者到企业全覆盖的产品矩阵
Mistral AI 丰富的产品矩阵为开发者和企业提供了一系列实用工具。以 La Plateforme 和 Codestral 为代表的一系列工具为开发者提供了从模型定制到应用开发的全链路支持,降低了开发者使用 AI 技术的门槛。不仅能够轻松创建具有特定功能的智能体,还能对模型进行个性化微调,甚至能够为开发者提供免费的基础补全能力,从而提高了代码编写的效率。
在企业服务方面,Mistral AI 开发的企业智能助理能够自动处理客户咨询,快速准确地回答客户问题,极大提高了企业客服效率,降低了人力成本。在企业内部流程优化方面,该智能助理可以协助处理文档,提高办公效率。
此外,通过推出面向企业的对话式 AI 助手 Le Chat,企业可以通过订阅或授权的方式使用 Le Chat,利用其连接企业内部知识库,为客户提供定制化解决方案。Le Chat 在推出后短短 100 天,就帮助公司将业务规模翻了两番,并且取得了显著的商业成绩。
Mistral AI 产品的核心特色
青睐 Mistral AI 的原因剖析
从技术到模式,Mistral AI 展现出与众不同的竞争力,但这并不能完全解释为何 ASML、苹果这样的科技巨头会如此大手笔投资或收购。要揭开背后的逻辑,需要进一步结合现实需求与战略考量进行分析,通过查阅多方资料,小编对其原因进行了如下猜测。
弥补苹果 AI 技术短板
苹果在 AI 领域的发展虽然一直在稳步推进,但其 Siri 语音助手在与竞争对手的同类产品(如 Google Assistant、亚马逊 Alexa)的比较中,逐渐显露出自然语言理解能力不足、功能不够丰富等短板。而 Mistral AI 在语言模型技术上的卓越表现,尤其是其先进的自然语言处理能力(NLP)和高效的模型架构,苹果形成技术互补。通过收购 Mistral AI,苹果可以迅速获得顶尖的 AI 技术和研发团队,加速自身 AI 技术的迭代升级,提升 Siri 等产品的性能,增强在 AI 领域的竞争力。
此外,其丰富的产品矩阵和多元的技术应用场景,也能为苹果的产品生态注入新的活力。在生产力工具方面,将 Mistral AI 的 AI 技术融入苹果的办公软件(如 Pages、Numbers、Keynote)中,可以实现智能文档编辑、数据自动分析等功能,提升用户办公效率;在企业服务领域,借助 Mistral AI 的企业智能助理和定制化解决方案,苹果可以进一步完善其企业级服务产品(如 iCloud 企业版、Apple Business Essentials)。
协同 ASML 产业升级
ASML 作为全球半导体制造设备的领军企业, 一直致力于通过技术创新提升其光刻系统的性能和生产效率。在当今数字化、智能化的时代背景下,人工智能技术在半导体制造领域的应用潜力巨大。不管是光刻设备的设计优化还是生产过程中的参数调整与监控,AI 技术都发挥着重要作用。在与 Mistral AI 的战略合作下,ASML 能够深度整合其先进 AI 模型和算法,将其应用于自身的产品研发、生产运营以及客户服务等各个环节。借助 AI 技术强大的数据分析和智能决策能力,ASML 有望进一步提升 EUV 光刻机等核心设备的性能,实现更精准的光刻制程,缩短设备研发周期,降低生产成本,从而为全球半导体行业的发展提供更先进、更高效的设备和解决方案。
写在最后
尽管目前 Mistral AI 市值和地位蒸蒸日上,但并非毫无争议。
今年 8 月,就被爆出其涉嫌抄袭的丑闻。据 Mistral AI 前员工爆料,公司最新模型疑似直接蒸馏自 DeepSeek 模型,却对外包装成自主强化学习(RL)的成果,还存在歪曲基准测试结果的情况。
事实上,早在 2025 年 6 月,AI 领域专业人士 Sam Paech 就通过技术分析发现,Mistral-small-3.2 模型与 DeepSeek-v3 在语言模式输出上高度相似,暗示前者可能 「借鉴」 了后者的输出风格。
DeepMind 研究员 Susan Zhang 更是大胆开麦,直接点名了 Mistral AI 的不道德行为。
然而,在众多批评声中也不乏有赞同的声音,HuggingFace 联合创始人兼首席执行官 ClementDelangue 就曾为其发声「蒸馏开源模型有错吗?」
诚然,蒸馏技术在 AI 领域属于常见技术手段,且 DeepSeek 未禁止此类操作。但 Mistral AI 刻意隐瞒技术关联、夸大自主研发成果的行为,仍引发了业界对其技术诚信的质疑。
即便存在这样的争议,Mistral AI 的投资价值仍被巨头认可。有人猜测背后其实暗藏更深层的行业逻辑:大家投资的根本原因其实因为它是欧洲目前唯一放的上台面的模型,大家都在赌欧盟因为某种原因限制美国模型后的替代。当前全球 AI 领域,美国企业凭借技术先发优势和生态积累,占据了主导地位,OpenAI、谷歌等公司的模型几乎垄断了中高端市场。欧盟作为全球重要的科技市场和监管主体,近年来不断加强对 AI 技术的监管,无论是《人工智能法案》的出台,还是对数据安全、算法透明性的严格要求,都显露出对外部 AI 技术依赖的警惕。一旦未来欧盟出于数据安全、产业自主等考虑,对美国 AI 模型实施限制措施,欧洲市场将面临优质 AI 模型供给缺口。
在这样的背景下,Mistral AI 作为欧洲本土少有的能与国际顶尖模型抗衡的企业,自然成为了资本眼中的 「备用选项」—— 投资者看重的并非仅仅是其技术实力,更是其作为 「欧洲本土标杆」 的战略价值,本质上是在为可能到来的地缘科技博弈提前布局,这种源于 「替代焦虑」 的不安全感,才是支撑 Mistral AI 估值飙升的关键推手之一。
纵然争议与质疑仍在持续,但不可否认,Mistral AI 已成为欧洲人工智能版图上的重要棋子。未来,Mistral AI 能否真正兑现其技术潜力,并在复杂的市场与政策博弈中找到平衡,仍有待时间验证。
参考资料:1.https://mistral.ai/models2.https://huggingface.co/blog/zh/mixtral
本文来自微信公众号“HyperAI超神经”,作者:椰椰,36氪经授权发布。