36氪首发 | 视觉空间智能大模型及应用平台「兔展智能」连续完成E、F轮数亿元人民币融资
文|黄志敏
编辑|廖尧
36氪获悉,视觉空间智能大模型及应用平台深圳兔展智能科技有限公司(下称「兔展智能」)正式宣布连续完成E、F轮数亿元人民币融资,嘉道资本、龙岗金控、中国风投、青岛华通、青岛海诺、南山战新投、赛维时代、晶泰科技、新城市、昆山周庄投资等机构参与了投资。此次融资后,企业将正式进行股份制改革,并计划于今年赴香港上市。
「兔展智能」成立于2014年,由北京大学校友与北大系视觉技术领域的领军人才共同创建,是国内唯二的视觉领域底层模型研发公司之一,企业初期发明了国内较早的H5营销设计工具,被企业和个人广泛使用;而后企业不断探索AI技术在视觉、营销等领域的运用,打造了全链路AI产品矩阵,形成协同联动的企业AI生态。
「兔展智能」产品矩阵
企业CEO董少灵表示,“「兔展智能」诞生于移动互联网,我们已经积累了大量的企业客户服务经验,更加清楚企业在相关工具和服务使用时面临的痛点和难点”,他判断目前广泛的企业虽已开始尝试采用各类AI模型和工具参与营销业务和有关内容的生成,在实践过程中普遍遇到一些难点:首先,大部分视觉模型的精确度不够,无法准确表现商品、商品与环境的融合,物理规律性能表现较为基础,更多只能用于娱乐;其次,企业级营销内容(如视频)制作链路较长,制作环节中的各自软件、应用协同较复杂,现有AI工具或模型并没有提升内容制程效率;最后,目前用户在使用企业服务时会出现应用间重复跳转,企业应用普遍面临App/小程序交互冗余、转化链路过长、用户流失率高的难题。
董少灵介绍道,“「兔展智能」针对企业AI时代的营销痛点,自研针对性的视觉大模型和专业化AI工具,持续深入研究和不断优化技术和能力,让信息传递和交互更生动、高效,帮助企业用户实现更好的营销和推广效果。”目前,企业已推出“UniWorld”系列视觉模型,在商业级AI图片生成、AI视频制作方面开发了“AnyReal”画布系统及“TUVE”短视频制作Agent,并打造了AIOS入口平台“SkillsUI”及“DeiNai”出海营销平台。
「兔展智能」的UniWorld系列视觉模型早在2023年就开启研发,并在2025年发布了V1和V2版本,其中V1版本早于Nano Banana三个月推出,V2版本在权威评测(GEdit-Bench)中综合性能超越OpenAI的GPT-Image-1,多项关键指标亦一度优于谷歌的Nano Banana系列模型。UniWorld是行业内较早实现“理解、生成、编辑”统一的视觉大模型,打破了以往各类任务割裂的局面,真正做到了结构、语义与计算的深度协同,且有国内商品数据做算法支撑,更贴合商用需求。
本次融资后,「兔展智能」正式发布了UniWorld-V2.5版本,本次模型版本更新进一步把生图模型和理解模型两条路线合并成一条:同一个模型,既能看懂图像,也能生成图像,还能在理解的基础上生成更准确的图像;因此,在社交媒体场景和 InfoGraph(图形化方式呈现数据与信息的视觉设计)都能做到逻辑精准。更重要的是,UniWorld-V2.5的prompt(提示指令/提示文本)非常简短,相比其他模型,UniWorld统一了多模态理解生成的 Agentic 模型,优化了一体化视觉生成系统逻辑和能力,只需要一句话即可生成多样、复杂的视觉信息图,它背后是一整套完整的视觉生成系统。
董少灵分享道:”UniWorld不是在‘画’一张看起来像的图,而是在理解并构建一个完整的信息体系。这种能力是真正的技术护城河,标志着它从‘生图工具’向‘会思考、懂设计的视觉生成系统’的跨越。在国际评测中,同样用一句自然语言 prompt,UniWorld-V2.5在 InfoGraph、图文交错、文字密集等场景上对齐 GPT-Image-2 的生成能力,做出 Qwen-Image、LongCat-Image 等主流模型暂未实现的生成效果。
「兔展智能」UniWorld-V2.5案例示意
基于自研模型能力,「兔展智能」针对商业级图片及视频生成均开发了相应工具;其推出的“AnyReal”实现了真实场景还原、模特交互、可控可调等电商刚需能力,企业可以高效生成棚拍级AI商品图,帮助企业将商品图设计成本降低80%。目前,“AnyReal”已广泛应用于亚马逊、独立站、天猫、京东等货架电商平台,以及TikTok、抖音、小红书等社媒电商渠道,成为众多跨境大卖和头部品牌的标配内容工具。
「兔展智能」的对话式AI短视频创作Agent “TUVE”把传统需要脚本、分镜、生图、生视频、剪辑拼接的全链路流程,压缩为一次自然语言对话。用户只需描述创意,“TUVE”即可调度多模态能力,端到端交付一条可发布的短视频,显著降低视频化表达的门槛。目前,“TUVE”已接入多家 MCN机构与品牌方,覆盖电商带货、品牌宣传、知识科普等多个场景;帮助案例企业单条平均制作周期从3天压缩至40分钟,月均产出200+条竖屏素材,内容团队扩能约5倍。
为解决企业交互平台重复开发、用户多应用切换实现需求功能的问题,「兔展智能」还推出了原生开放式AI交互平台SkillsUI,帮助用户通过“一句话需求,实时生成可操作界面”,实现“边聊边办”。企业无需重复开发,只需一次接入,即可将原有服务升级为可对话、可操作的AI办事能力。目前 SkillsUI 已实现多项成熟落地应用,包括“i深圳”政务AI助手、深圳某试点医院AI助手以及龙岗智慧社区等场景,在政务服务、医疗服务、社区管理等领域切实提升服务效率与用户体验。
「兔展智能」SkillsUI案例:“i深圳”房屋转租登记
目前「兔展智能」依托研发优势及庞大的用户数据积累,目前已构建起较好的技术护城河,目前企业已拥有授权专利26件,另有在审实审专利16件,企业与北京大学共建AIGC联合实验室,汇聚顶尖科研团队,全力投入底层模型研发,其自研的“兔灵”大模型是广东省内首个完成备案的视觉空间智能大模型;其开源的Open-Sora Plan是全球最早的开源视频生成模型之一,曾连续多日登顶GitHub全球趋势榜榜首,单模型超过2600万次下载,2024年视觉大模型代码引用量全球第一,被字节、腾讯、华为等国内外大厂广泛采用。
目前「兔展智能」自成立以来已服务了超过4100万家企业用户,其中包括300家头部企业,总付费用户突破48万,涉及行业类目超过100个。企业通过设立“DeiNai”一站式AI跨境营销平台,将旗下功能进行打通,形成“内容生成→红人投放→本地履约”全链路。2025年「兔展智能」AI商业化年签约额突破亿元,帮助海外企业降低内容成本30%至50%,AI业务月度复合增长率超过60%。
「兔展智能」目前已取得国家高新技术企业、国家级专精特新“小巨人”企业等资质,目前企业拥有100多名员工,其中研发人员占一半以上,公司骨干都是来自北京大学、清华大学、中山大学、北京交通大学等知名高校的AI native人才,其中包含多位在国际计算机顶会和顶刊上发表多篇论文的AI研究领域高智商“天才少年”,核心人员则有来自腾讯、华为、阿里、Facebook等互联网巨头的产品及技术专家。与北京大学共建的AIGC联合实验室,入选工信部国家视觉大模型揭榜挂帅单位;企业还与多所高校开展产教融合项目,培养专业AI应用人才,获批广东省首个“AI国家级高技能人才培训基地”。
企业创始人、董事长兼CEO董少灵是北京大学校友,北京大学深圳研究生院-兔展智能AIGC联合实验室主任,深圳市青年创新领军人才;首席科学家袁粒是北京大学助理教授、博导、研究员,新加坡国立大学博士,国家优青(海外)获得者,连续三年入选全球Top2%顶尖科学家榜单。首席技术官周星,深耕 AI 产品工程领域,曾任 TCL 新技术技术总监、华为首席架构师。
对于AI产业的发展,董少灵表示,“全球AI产业正在快速发展和剧烈变化,经历从‘技术驱动’到‘价值驱动’的深刻转型,生态将重构为‘底层技术-中间层能力-上层应用’的三层架构。中国企业对于产业化、全球化的认知更加深刻,未来三年,具备‘中国技术+全球场景’能力的企业将占据市场主导地位,这正是兔展战略投入跨境AI赛道的核心逻辑。基于这些判断,「兔展智能」将持续深耕视觉空间智能模型底座,也更注重将其转化为企业可感知的价值。未来AI企业的竞争,本质是产业理解深度与价值创造效率的竞争,而非单纯的技术竞赛,我们相信,兔展智能一定会成为最后一百家有价值的智力驱动型公司。
投资人说
中国风投投资总监陈珍国:此次投资「兔展智能」并非追逐短期 AI 风口,而是看好 AI 作为新一轮技术革命对生产力体系的长期重构价值,坚持以终为始的 AI 投资逻辑,聚焦能够将技术转化为企业可落地、可交付、可规模化的生产力系统、并穿越行业周期的企业。「兔展智能」作为深耕视觉 AI 多年的企业级公司,已在技术与商业化层面形成核心壁垒,兔展智能兼具北大团队背景、底层模型技术、十年企业服务经验与规模化客户基础,走出了一条与大厂错位竞争、贴合产业真实需求的稳健路线,契合 AI 重构内容生产与人机交互的长期趋势,具备成长为AI时代基础设施型企业的潜力。















