让3000万开发者低门槛使用AI能力,MindsDB种子轮融资5410万美元
如果说大语言模型推动了计算机工作范式的转变,那么MindsDB则推动了数据分析范式的转变。通过直接在数据库中进行建模,MindsDB使得开发者不需要AI技能, 企业不需要为AI能力专门招募AI人才,而是直接让原有的工程师上手AI。
企业使用AI能力的门槛正在进一步降低,可商用的开源大模型让企业省去了模型训练的成本,AI部署平台让企业省去了搭建AI算力基础设施的麻烦,而一家叫MindsDB的创业公司让企业连专业的AI技术人才都不需要招募,原有的IT工程师们就能直接上手AI。
MindsDB将AI模型抽象成一个叫“AI表(AI Table)”的东西,开发者直接使用SQL语句与AI表交互,就能在不改变传统的软件和数据堆栈的情况下,方便地使用AI的能力构建应用。
MindsDB由一个开源软件开始创业,目前有超过500个代码贡献者,Github平台17700颗星,以及超过15万次的安装实例。
从2017年创立到2021年,MindsDB处于积累阶段,陆续获得了760万美元的早期融资,投资人包括YCombinator、OpenOcean(专投开源项目)、加州大学伯克利分校SkyDeck基金。
但是在2023年,乘着生成式AI的东风,MindsDB连续获得3次融资,分别是2月由Benchmark投资的1650万美元,6月由Mayfield领投的2500万美元,以及8月由英伟达旗下NVentures投资的500万美元,目前其种子轮的总融资额达到5410万美元。
除了亮眼的融资经历外,MindsDB也获得了权威机构和顶级合作伙伴的认可,它是《福布斯》2021年度AI 50,CBinsights 2023 AI 100,以及Gartner 2022年数据和AI的Cool Vendor,Snowflake、SingleStore和基于Apache Cassandra™的DataStax也与它建立了深度的合作伙伴关系。
让软件开发者“不懂”AI也能使用AI的能力
MindsDB的两位联合创始人Jorge Torres和Adam Carrigan是连续创业者,他们的上一家创业公司Real Life Analytics做的是软硬件结合的数字营销业务,但是按照Torres的说法,这次创业“失败得很彻底”。
将AI引入数据分析并不是新鲜事,但是传统的AI建模需要数据预处理、模型构建、模型上线等步骤,相对复杂。而且对于数据分析师和开发人员也提出了较高要求(需要懂业务,懂数据,懂AI)。显然,中小企业承担这样的成本比较困难,大型企业做起来也不容易。
Jorge Torres和Adam Carrigan的创业初心就是简化AI的上手难度,让普通软件开发者也能方便使用AI的能力。
“目前,全球大约有3000万软件开发者,但只有不到五分之一的开发者熟悉AI/ML工程技术。然而,我们正面临一个新的转型,未来大部分软件会以AI为核心。我们利用AI数据库,帮助普通开发者在现有的软件技术栈上构建AI能力。”MindsDB联合创始人兼首席执行官Jorge Torres说。
MindsDB最初的创业发展并不顺利,在开源软件开发的最初六个月,不少人都对他们的想法表示怀疑。
但是随着时间的推移,MindsDB的创业之路越走越顺,这主要得益于Y Combinator的帮助和开源社区的力量。Y Combinator的董事总经理Michael Seibel邀请它们进入其2020年冬季的批次中,经过多次的“辅导”,Jorge Torres表示:“我们现在是真正的公司了。”
Jorge Torres认为MindsDB的成功离不开开源社区:“自开发开源软件5年来,社区的开发者们不断测试和完善MindsDB的技术,使它逐渐成为市场上最成熟的解决方案之一。
MindsDB一开始只集成少数数据源,但自生成式AI热潮到来,我们的数据源呈指数级增长,这些都来自开源社区的帮助。而且我们很多的付费用户,都是通过试用开源产品后,再与我们合作的。”
MindsDB是截止2022年,Github平台,星星数增长速度最快的开源机器学习平台。目前,它在开源社区有超过500个代码贡献者,17700颗星,以及超过15万次的安装实例,它还有超过130个平台集成,包括OpenAI、Hugging Face这样的大模型公司,以及Snowflake、MongoDB、Databricks这样的数据巨头。
MindsDB的投资人Mayfield在云计算和数据领域深耕,曾经投资了HashiCorp,它的管理合伙人Navin Chaddha表示“我们对MindsDB在开源生态中的成功,以及其与数据库和AI生态系统的广泛合作印象深刻。我相信整个软件技术栈将为AI优先时代而重构。作为业界第一个为AI逻辑提供服务的“数据云服务”,MindsDB的创新平台提高了组织内部的AI可用性,加速了企业对AI的采用。”
利用“AI表”连接和操控数据与AI模型
MindsDB将自己定义为AI数据库,它可被用于部署和管理AI模型(无论是先进的生成式AI模型还是经典的机器学习模型),它还能自动化连接AI模型与企业数据库的工作流。
MindsDB的核心技术,“AI表”
MindsDB的产品使组织能够通过将AI模型抽象为“AI表”(AI Table),这种抽象使企业的软件开发团队能够使用他们现有的SQL技能构建由AI驱动的应用程序。“AI表”能够从输入数据中学习,并在被查询时根据底层模型生成预测结果。
从这张图可以很直观的理解,左边是各种数据源,右边是AI模型,MindsDB通过整合数据源和AI模型,弥合了AI和数据之间的鸿沟。
“AI表”本质上将AI模型抽象成虚拟数据库表,能够根据给定的输入产生开发者和企业需要的输出。通俗些说,它不仅连接了数据源和AI模型,而且像编辑器一样,让开发者很方便的操控AI模型。
用MindsDB创始人Torres的话说:“我们的平台是连接数据源和AI模型的中央枢纽,使得创建有用的AI驱动的解决方案成为可能。”
从这张图可以更详细的了解MindsDB在整个技术堆栈中的位置和作用。这是一个数据分析的例子。
首先,ETL工具(Airbyte)从数据源(intercom)中提取和整理数据到数据仓库(Google BigQuery)。
然后,MindsDB作为AI数据库与GPT-4连接,并将数据从数据仓库中提取,定义好分析逻辑后,将数据输入GPT-4中处理。接着,再把经过处理的数据传回数据仓库。
最后,BI工具从数据仓库中提取GPT-4处理好后的数据,进行深度的分析。
从这个例子中,我们可以看到MindsDB作为“控制器”将开发者定义的逻辑和规则输入到大模型中,在不增加开发者和数据分析师负担的前提下,充分利用了大模型的能力。
MindsDB有用丰富的数据源和功能集成,目前它的平台有超过130种的AI集成功能,并且能够使用来自OpenAI、Anthropic、Hugging Face、Langchain和Nixtla的多种高级机器学习框架和生成式AI模型。
在数据源方面,它与Amazon Redshift、Google BigQuery、MySQL、Postgres、MongoDB和Snowflake等数据平台兼容,能够从这些数据库和数据仓库中提取数据。
每年帮客户节省500000美元
金融服务平台Domuso使用MindsDB创建并实施了一个可靠的ML模型,该模型使用MindsDB的AutoML解决方案,并得到了机器学习专家的支持。
Domuso设计了分析规则并将它们转变为实时操作,使用其现有的团队和技术资源完成了这一任务。MindsDB帮助Domuso在两个月内退单费用减少了95000美元,每年可能节省大约500000美元。
除了以上两个数据分析类型的用例,MindsDB的用例还包括,搭建虚拟角色聊天机器人,打造基于工作流的AutoPilot等。
如果客户不满足于MindsDB提供的AI模型,他们也能上传或部署自己的模型使用,在MindsDB平台,客户还能微调自己的AI模型。
按需收费的MindsDB Pro云服务
因为起源于开源软件,所以MindsDB可以本地部署。此外,它也有自有云服务MindsDB Pro和第三方云服务(主要由AWS提供),它的云服务专为AI/ML项目的实验和部署而设计,这个服务可以让客户无缝地集成并使用AI模型,消除了复杂的基础设施设置和管理的需要。
此外,它与企业数据库的集成拥有强大的数据治理和安全性。通过利用现有的数据库安全措施,MindsDB使客户能控制AI模型的访问、权限和审计。这种集成还确保了与数据隐私法规的符合性,为AI驱动的应用提供了一个安全和可信赖的环境。
在价格方面无论是自有的MindsDB Pro还是AWS,都是按需收费,每小时0.7美元。
企业无需招募专业AI人才也能使用AI的能力
MindsDB的核心价值,在于创始人创立公司的愿景“AI普惠”,它直接服务的对象是软件开发者和数据科学家,MindsDB让他们可以用自己已经熟悉的SQL技能操控最新的生成式AI的能力。
对于企业,MindsDB的价值在于成本的节省和效率的提高,有了MindsDB,企业不用自己部署和训练AI模型,也不需要专门雇佣或培养懂AI的高端人才,直接就可以解锁生成式AI的巨大力量。
核心关注开发者的MindsDB选择从开源软件起步也是一个很好的选择,因为开源社区可以帮助他们不断地测试和改进自己的软件,用很低的成本完成软件的快速迭代和完善。而且当客户使用了开源版本软件后,再进行商业化拓展时,就已经跨过了“这个软件能不能用,好不好用”的客户教育过程。MindsDB的发展过程可以说“从开发者中来,到开发者中去。”
目前海外已经越来越多出现这种以开源软件出发,再进行商业化的创业模式,数据科学领域的巨头Databrick和MangoDB,还有AI领域的Hugging Face都是如此。中国也拥有开源软件,但是很多是大公司开源自己的软件,比如阿里云将通义千问的模型和AliSQL数据库。而且中国的开源软件生态比较碎片化,不少还是由大公司运营,由开源软件进而商业化创业的路径还不明确。
在AI领域,越来越多的公司在帮助人们降低使用AI的门槛,那么利用AI能力进行浅表层应用创业会越来越容易。应用创业当然可以瞄准某一个行业或某一个具体领域,但像MindsDB这样瞄准某一个特定群体创业,也是很好思路。
本文来自微信公众号“阿尔法公社”(ID:alphastartups),作者:发现非凡创业者的,36氪经授权发布。















