声智科技:宏观经济波动下的企业战略进化丨案例精选

时氪分享·2026年05月25日 18:14
声智科技从B端技术商进化为自有终端声学AI企业。

摘要

北京声智科技有限公司是一家融合声学物理与人工智能的科技创新企业。公司成立初期以服务企业与政府客户为主,2024年初推出搭载声学AI核心算法的AI耳机终端,依托直播与内容渠道构建用户直连体系,成功切入消费市场,验证算法硬件化闭环。历经近十年技术沉淀与实践,声智科技从技术服务和解决方案商,进化为拥有自有终端品牌的声学AI企业,实现底层技术在消费市场的规模化落地。

由北京大学光华管理学院陈玉宇、仇心诚、马莹莹、王冬霞、熊小丽整理编写的案例《声智科技:宏观经济波动下的企业战略进化》目前已正式入库。本案例全面梳理其发展历程与各阶段战略重点,呈现技术驱动型创业公司在外部冲击与市场需求变化下的韧性演进逻辑。

陈玉宇

你一定听过“小爱同学”,这一唤醒词正是声智科技为小米训练的模型。从小米、华为到阿里、腾讯,众多智能音箱与智能家居设备背后,搭载的都是声智的远场声学算法。多年来,声智科技一直在国内消费电子头部企业身后的技术供应商。

声智科技创立于2016年国内人工智能投资热潮时期,创始团队核心成员均出自中科院声学所。成立至今十年间,企业平稳渡过新冠疫情冲击,扛住全球经济周期的波动:疫情阶段,公司依托政企数字基础设施项目,完成算法与硬件产品的大规模落地实战验证;2023年生成式AI浪潮席卷行业,企业顺势调整战略重心,以自有品牌AI耳机正式入局消费市场,随后逐步拓展至AI助听器、AI睡眠耳机等全新产品赛道。

一家在B端市场站稳脚跟、具备稳定正向现金流的技术型企业,为何主动走向充满未知挑战的消费终端市场?从单纯输出算法授权到自研算法硬件,从深耕幕后技术服务到打造自有终端品牌,这既是企业穿越行业周期的发展趋势,也是主动布局新赛道的长远布局。本案例将带你回顾声智科技十年发展历程,一同探寻企业转型背后的深层逻辑与答案。

以下内容为案例文本的部分摘选。

创业是一种修炼。创业公司天生就要面对极度不确定的未来,就要处理极度高风险的任务,就要承担前所未有的压力。科技创业是种心灵的洗礼和信念的坚持,是对人工智能的未来憧憬和对科技引领生产力的信念。

——声智科技创始人、董事长陈孝良

近年来,人工智能技术对消费者影响持续加深,2023年生成式AI爆火带动相关AI硬件产品集中涌现。智能耳机作为用户佩戴时长、使用频率最高的穿戴设备之一,成为AI硬件领域焦点。据Canalys 预测,2025年全球AI耳机市场将保持两位数高增长,年出货量有望突破一亿副。

智能耳机正是声智科技从消费电子巨头身后走向台前、打开市场大门的首款智能产品。2025年10月,公司推出的 SoundAI FairyClip A 系列智能耳机在东盟市场上线两个月覆盖东南亚主流电商平台,登上TikTok榜单前列,单品单月销售额增长2392%;北美市场上线两周销量增长2938%,跻身北美TikTok 榜单TOP10。

声智科技诞生于中国人工智能投资黄金热潮期,成功穿越疫情冲击与全球经济周期剧烈波动。在充满不确定性的宏观环境中,公司将外部挑战转化为内部技术蓄力契机,依托高强度实战场景完成核心算法与硬件架构规模化验证,凭借深厚技术积淀精准捕捉产业代际更迭机遇。历经近十年磨砺,声智科技从幕后走向台前,以自有品牌产品叩开消费市场,交出亮眼市场答卷。

一 过去十年全球宏观经济发展

2016年前后,全球经济处于2008年金融危机后缓慢复苏期,GDP增速在3.5%左右波动,增长动力偏弱、通胀低迷,主要央行维持宽松货币政策。2020 年新冠疫情重创全球经济,经济收缩3.1%;2021年在大规模财政与货币刺激下强劲反弹至5.9%。2022 年起高通胀迫使主要央行激进加息,全球经济增长承压,2022年增速回落至3.4%,2023年降至3.2%。2024—2025年全球经济呈现分化,美国依托AI投资与技术优势保持2.8%增长,欧元区复苏乏力(1.3%),中国增速从5.0%逐步放缓至4.5%左右。

据国际货币基金组织2025年10月报告,全球经济增长预计从2024年的3.3%放缓至2025年3.2%、2026 年3.1%,显著低于2000—2019年3.7%的历史均值,标志全球经济进入中低速增长新常态。

二 声智科技:深耕声学 AI 的专精特新企业

北京声智科技有限公司成立于2016年,是声学人工智能领域创业公司,早期团队五位成员来自中国科学院声学研究所。公司依托长期声学技术积累,聚焦核心AI算法化,将远场声学算法与真实世界建模深度融合,搭建多语言、多模态人机交互技术,面向全球消费电子、医疗健康等领域,提供声学AI算法、AI硬件及AI订阅服务,覆盖声学阵列、声学芯片到AI终端的全链条硬件产品。

声智科技拥有超1PB专有训练数据、2000余项全球知识产权及150余项行业标准,是国家第二批专精特新“小巨人”企业。公司采取“技术驱动商业”精兵策略,86人团队中研发人员占比82.6%,未设专职销售团队,以标准化流程串联生产制造、仓储物流、售后服务合作伙伴,协同保障产品质量与用户体验。公司服务华为、小米、百度、腾讯、阿里、中国移动、赛诺菲等约500家企业客户。

资本层面,2016年声智科技获峰瑞资本、洪泰基金领投2600万人民币天使及Pre-A轮融资;2017年获百度领投近亿元A轮融资;2018年12月完成毅达资本领投2亿人民币B轮融资;2019年底B+轮融资后,公司实现稳健正向现金流,主动降低外部资本依赖,专注长周期核心技术研发。

三 远场声学交互技术:声智的核心技术底座

智能声学交互通过语音识别、自然语言处理等技术实现人机交互,用户以语音指令获取反馈。语音交互分为近场与远场两类:近场语音(如手机、麦克风交互)识别率超90%;远场声学通常指3米以上距离,在噪声环境中识别效果不佳,“鸡尾酒会效应”是行业经典难题。远场声学不仅处理人类语音,还需探测猫狗、鲸鱼、鸟类、舰船等自然界各类声音。

图1:智能语音关键技术环节(来源:作者整理)

远场声学交互技术面向真实复杂场景,让机器“听见”并理解远距离声音,核心是声学计算而非语音识别,需解决噪声、混响、回声、多声纹、端点检测等问题,攻克距离、延时、精度三大核心难题:距离上,需在长距离条件下解决多噪声干扰;延时上,人耳可感知30毫秒以上声音差异,超过80毫秒易出现回声,声音处理需控制在30毫秒内,最优达10毫秒内;精度上,声学作为交互入口技术,精度需高于语音、语言,否则会导致后续理解全链条出错。

2014年亚马逊推出智能音箱Echo,将语音交互从近场升级至远场,北美市场远场声学产品逐步落地,彼时国内多数产品仍停留在近场阶段。联合创始人兼首席知识官常乐表示,国内近场语音交互已达95%以上识别率,但远场声学交互与远场实时通话技术尚未商业化,声智科技成立初衷就是推动远场声学交互技术产品化落地。

四 商业化探索懵懂期:技术攻关与B端服务

(一)固本:攻克远场声学核心技术

传统语音处理难以解决远场声学交互痛点,声智科技创立初期聚焦声学前端模块(麦克风阵列、降噪芯片、硬件模组)研发,主攻体验最差的远场声学交互。智能语音交互系统核心环节包括信号处理、语音识别、语言处理、语音合成。

信号处理层面,远场声学采集设备核心依赖麦克风阵列精准定位与增强声源,其性能由硬件架构、声学结构、信号建模、时钟同步等决定。麦克风阵列通过波束成形技术,捕捉声波到达不同麦克风的时间差,锁定目标声源并抑制环境噪声,实现360°定向捕捉,提升远场信号识别能力。

声智科技在麦克风阵列方案中集成十余种核心声学算法,采集声音时实时监测估算环境噪声,动态优化阵列参数,加权融合多通道信号,输出高信噪比音频,实现空间滤波、声源定位、混响去除、噪声抑制等功能。

语音识别层面,公司声学模型覆盖500多种声学事件,可识别生物声学与日常多元声音;通过声调、语速、音色等特征识别说话人情绪,在医疗领域可辅助评估情绪风险;建立128—1024向量尺度声纹库,基于AI实现声纹加密与隐私保护,遵循用户授权原则,优化多人场景交互体验。

历经一年多技术攻关,声智科技攻克复杂环境声学难题,打造全链路AI声学架构,将远场声学识别率提升至95%以上。夯实前端优势后,公司持续补强自然语言处理能力,覆盖知识图谱、语义理解、数据挖掘、智能搜索等领域。

(二)开源:深耕B端技术服务

彼时国内远场声学交互需求激增,尤其互联网巨头需求旺盛。声智科技确立底层技术供应商定位,出售高附加值技术服务,秉持“与巨头合作,共拓AI市场”战略,发挥算法独特优势。

创始人陈孝良认为,To B市场需求碎片化、交付定制化,烧钱难快速形成规模效应,创业公司定位清晰、力量集中、执行高效,更具服务优势。声智科技面向全球消费电子龙头提供声学算法授权与定制化服务,小米首台智能音箱、360首款远场安防摄像头、阿里天猫精灵魔盒、华为智能音箱、赛诺菲糖尿病患者陪伴设备等均搭载其技术。小米“小爱同学”唤醒词由声智科技基于声学原理提出四字建议并训练模型,至今国内唤醒词仍沿用该规范,智能音箱声学设计也沿用公司早期定义结构。

服务B端过程中,声智科技深刻感知市场需求与技术边界,逐步从单一语音技术向多技能、多模态融合转型,拓展声光融合技术,对齐声音、视频、温度等传感器数据,解决数据异构问题。2018年,公司推出壹元人工智能开发框架SoundAI Azero,整合远场声光融合、多模态识别、推理翻译、推荐搜索等技术,为开发者提供便捷工具与接口,快速集成声学交互功能。

图2:SoundAI Azero开发框架(来源:声智科技)

与消费电子巨头的合作,为声智科技带来稳定收入、客户与供应链资源。2021年,公司远场声学交互算法占据中国70%市场份额,技术赋能智能音箱套件累计销量破千万套,成为行业幕后基石。但单纯算法授权难以释放AI技术潜力,为打破技术与终端用户隔阂、解决长尾场景算法数据匮乏问题,声智科技决定从“幕后赋能”转向自主产品触达C端用户,2019 年开启从“技术供应商”到“终端品牌商”的转型,却因疫情爆发中断市场验证。

五 疫情期:技术规模化验证与能力沉淀

2019年底爆发的疫情重创全球经济,却为语音交互行业带来机遇 —— 疫情前语音交互是“锦上添花”,疫情中“零接触”需求使其成为“必需品”。

声智科技紧抓行业机遇,依托SoundAI Azero框架,承担北京、云南全省及河北、河南、山西等多地防疫数字平台建设,覆盖核酸检测、疫苗接种、疫情监测预警、社区联防联控等功能;在合规框架下参与公安声纹检测系统、AI数字人大屏等项目。同时,公司拓展工业互联网业务,开拓智慧园区、智慧城市项目,从单纯技术提供转向完整解决方案输出,包括智能语音控制、声纹故障诊断等方案。

疫情期间,多数园区传感器数据相互独立,声智科技基于SoundAI Azero框架搭建统一数据与接口能力,推出AI电梯、AI数字人红外测温系统,实现员工 “无感通行”,在园区与企业授权前提下保护隐私、提升协同效率。

疫情极端场景成为声智科技全栈技术与硬件规模化生产的“高并发、高可靠性验证场”,高强度实战验证了全栈算法稳定性,团队积累海量并发与大规模硬件处理经验,为后续支撑亿级C端用户奠定底层架构基础。2022年北京冬奥会期间,公司承担冬奥防疫应检尽检决策系统、冬奥数字哨点“声智门”、赛事综合保障指挥调度平台、冬奥大脑人员信息分析系统四项基建项目,语音交互技术也广泛应用于智能导览、语音控制、多语翻译等场景。

2022年ChatGPT问世,为智能产品“不够智能”提供解决方案,行业迎来新机遇。声智科技面临抉择:继续承接稳定政企项目,或重拾消费终端战略。公司坚定产品触达消费者的信念,决定战略重心转向AI 硬件载体与自有品牌建设,构建“感知 - 算法 - 服务”数据飞轮,完成从“技术赋能”到“算法直达” 的价值闭环,开启从 “技术幕后”到“生活台前”的跃迁。

六 从算法授权到算法硬件:消费市场破局

(2023— 至今)

“智能化必须回归物理世界的基本单元 —— 空间与人。”

——声智科技创始人、董事长陈孝良

AI 大模型推动智能产品性能升级,据Verified Market Research预测,2030年全球AI硬件市场规模将达4741亿美元,年均增速38.73%。全球科技企业纷纷布局AI与硬件融合赛道,声智科技也开启技术产品化新阶段。

2023年,公司聚焦技术迭代与产品研发,自研壹元大模型AzeroGPT引入MoE架构与动态路由技术,实时解析语音及上下文,智能激活匹配专家模型,避免全模型计算资源浪费;依托PB级训练数据优化模型,适配中文环境与文化,提升中文处理精准度。

同时,公司深入调研AI硬件细分市场,智能语音硬件覆盖家居、汽车、商务等场景,包括智能音箱、车载导航、智能学习机、智能手表、蓝牙语音耳机等。为在竞争中突围,声智科技选定赛道遵循三大原则:具备足够市场规模与潜力;与声学AI技术深度结合,提升用户体验;打造高附加值AI产品,保障研发投入,让用户为价值买单。最终确定重点布局智能耳机与智能助听器两大领域。

(一)智能耳机:C端爆款与全球扩张

2018 年谷歌推出Google Pixel Buds无线耳机,主打多语互译等功能,但受限于翻译、降噪、语音识别技术,长期未掀起消费热潮。声智科技将语音交互技术积累转化为产品竞争力,坚持市场驱动研发,通过灰度发布与用户改进计划,验证算法真实场景稳定性。

2024年初,公司推出首款AI耳机SoundAI FairyClip,这款封装声学AI算法的穿戴式计算终端,可在嘈杂环境实现高精准语音交互,根据用户习惯提供个性化音频体验。配套声智App搭载66种语言同传翻译、智能写作、音频转写等功能,声智公开信息显示,其AI播客为国内首个同类功能,支持文本生成口语化播客,提供11种音色选择,降低内容制作门槛。

图3:声智科技AI耳机产品资料(来源:声智科技)

图4:声智APP示意(来源:声智科技)

设计层面,产品采用微型化堆叠技术,以“珍珠”造型提升时尚感,单耳机重量约4克,搭配慢回弹夹耳设计,实现轻便舒适佩戴。产品上线后远超市场预期,抖音上线即获用户认可,加购量周周翻倍,2024年8月稳居抖音直播间同品类销量第一,相继入选“北京礼物”“海淀礼物”,并在京东、淘宝、视频号等渠道快速增长,逐步打开东盟、北美、亚马逊全球市场。

声智科技将抖音等内容平台打造为用户共创社区,通过直播间直连用户,打破传统硬件“开发 - 发布 - 固化”周期,构建“收集反馈 - 版本计划 - 灰度验证” 敏捷迭代模式,探索“硬件即服务(HaaS)”。用户购买硬件的同时,可享受持续更新的算法订阅服务,在用户授权匿名化反馈下优化算法,OTA升级让耳机持续进化,构筑传统巨头难以复制的算法护城河。

(二)智能助听器:科技赋能健康普惠

中国听力障碍人群超2亿,60岁以上老年听障人群超1亿,但助听器佩戴率不足5%,传统产品存在功能单一、价格昂贵、验配门槛高、外观刻板等问题,市场存在巨大未被满足需求。

声智科技AI助听器融合声学技术与大模型,实时分析环境声音,实现降噪、啸叫抑制、风噪抵消、360° 广角拾音,自动适配场景调整参数,提升听力补偿效果,还原原声并避免二次听力损伤;提供AI助听字幕,实时语音转文字,授权后生成对话摘要;搭载AI听力验配师服务,用户通过声智健康App5分钟即可完成快速验配。

公司聚焦听障群体“去标签化”与社交尊严需求,打破医疗器械刻板印象,以珠宝美学设计融合科技与人文关怀,兼顾性能与美感;打破高端医疗器械价格壁垒,让听障群体平等享受AI红利,赋予品牌深厚社会价值。

图5:声智AI助听器和声智健康App(资料来源:声智科技)

七 未来:全场景听觉AI与消费级终端探索

凭借智能耳机与助听器的成功,声智科技未止步于单点技术突破,而是聚焦用户全场景服务能力。2025 年10月,公司在海外推出AI睡眠耳机FairySleep Z1,提供睡前、睡中、睡醒全流程智能睡眠管理,实时监测分析并给出个性化优化建议。

除耳机、助听器外,公司围绕“听觉AI+健康与睡眠”家庭场景谨慎拓展,优先选择与声学核心能力强相关、可统一体验标准的方向。面向“后手机时代”,公司推出AI 原生终端,突破传统外设定义,以轻量化佩戴为形态,集成声学感知、光学传感、心率监测多模态技术,内置独立eSIM芯片实现全时联网,作为独立个人AI计算平台,实时感知生理指标、处理复杂信息,探索“人机共生”未来体验。

陈孝良坚信:“AI的最终大规模落地肯定是在消费领域。”

成立近十载,声智科技历经行业浪潮始终坚守初心,B端与政企项目沉淀的产品化交付、稳定性、合规治理经验,成为其从技术走向消费级产品的坚实底座。长期技术沉淀与商业化探索中,公司构建以SoundAI Azero为核心的技术矩阵,自主研发壹元声学、语音、语言大模型及脑机声码交互、多模态物理约束大模型等前沿技术。凭借独创算法、海量数据、可信交互能力,公司在技术端筑起壁垒,通过自研AI硬件打开消费市场,实现技术创新到商业落地的完整闭环。

从战略进化终局视角看,声智科技这类具备深厚技术护城河的科技企业,突破百亿级营收规模仍是核心命题。面对C端巨头生态竞争与技术加速迭代,公司能否将算法优势转化为可持续规模效应,仍待市场持续检验。

版权声明

本文摘编自由北京大学光华管理学院陈玉宇、仇心诚、马莹莹、王冬霞、熊小丽根据企业访谈整理编写的案例《声智科技:宏观经济波动下的企业战略进化》,案例仅用于课堂讨论,而非管理决策或活动是否有效的证明。案例版权归北京大学管理案例研究中心所有。未经北京大学管理案例研究中心授权许可,禁止以任何方式复制、保存、传播、使用本文或者案例正文中的任何部分。

Copyright©2026北京大学管理案例研究中心

本文来自微信公众号“北大管理案例研究中心”,作者:案例中心,36氪经授权发布。

+1
21

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

对于其他潮玩公司来说,至今还没有LABUBU。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业