36氪首发 | 声纹识别市场需求规模化初现,「声扬科技VoiceAI」获香港X科技基金领投的千万级Pre-A轮融资

瑞雯@超人学院 · 2019-02-18
声纹识别是指纹和人脸之后的下一个生物识别技术

36氪获悉,「声扬科技VoiceAI」近期已完成由香港X科技基金领投、BrizanVentures等跟投的千万级Pre-A轮融资。

本轮融资将主要用于人才团队的建设与培养,一方面在全球范围内招募智能语音领域的科学家、算法工程师等顶尖人才,与香港科技大学人工智能研究中心(CAiRE)合作在香港筹建智能语音研究院,开展相关研究课题;另一方面投入产品与开发团队建设,拓展安全、金融、物联网等领域市场份额。

服务客户方面,声扬科技已为中国南方电网、ASUS华硕、广发证券、印尼国家社保机构TASPEN、墨西哥国家级贷款银行INFONAVIT等国内外企业与政府机构等提供技术服务。

声纹识别赛道是一个正在爆发的蓝海市场,涌现出了不少玩家。百度2017开始与农业银行共建AI智能银行;曾获IDG投资的「SpeakIn」也在安防领域拓展新的落地场景;主攻固定短语和自由文的「君林科技」获海泉投资基金千万天使;清华教授郑方带领的公司「得意音通」也赢得了建设银行、国家信息中心、中国银联等大客户。智能音箱赛道中,天猫、ROKID等也都加入有声纹识别模块。

本轮领投方香港X科技基金由红杉资本全球执行合伙人沈南鹏,香港科技大学李泽湘教授及香港大学陈冠华教授,联合22位香港超级教授及科技精英于2016年7月在香港创办。

Brizan Ventures风险投资基金是由全球顶级芯片领域专家、香港科技大学工程学院前院长高秉强教授和拥有丰富国际资本市场以及并购交易经验的邝宇开律师联合创办。基金专注于投资全球芯片领域、人工智能以及智能消费电子等行业。

关于本轮投资逻辑,香港X科技基金陈冠华教授表示:

短期内多个项目的实施让声扬科技积累了大量而宝贵的domain knowledge和技术优势,在即将爆发的市场需求下,是企业快速抢占市场的重要竞争壁垒,也是本轮投资非常看重的方面。

以下是 36氪此前对「VoiceAI」的报道:

原标题:语音转文字已是红海,「VoiceAI」从“声纹识别”切入安全解决方案

作者:徐宁

人工智能主要有三个研究方向:视觉识别、智能语音、自然语言处理NLP。其中,在语音识别领域,声纹识别属于相对蓝海市场,解决的主要是“我是我”的问题,多应用在安全验证场景。

语音转文字赛道,各家的效果可能趋于0.1%、0.2%的差距,为了避免同质化竞争,VoiceAI(声扬科技)选择从“声纹识别”切入,给企业提供解决方案。公司在2016年下半年注册成立,2017年开始全面运营。

VoiceAI有一个典型案例,就是服务了印尼养老基金。这是一个国家级的社保项目,覆盖印尼250万人,于2018年5月2日起分批上线。此前,为了确保受益人尚且在世、避免养老金冒领等不合法操作,印尼居民需要去银行、养老机构等地进行现场认领,效率低下。如今,居民可以在线上选择指纹拍照、人脸识别、声纹识别三种方式之二进行认证。与合作伙伴一起拿下该项目后,VoiceAI负责其中的声纹识别部分。

居民提前线上注册,通过麦克风录制一段音频,在养老金申领时,收益人需认读随机的数字,VoiceAI根据声纹比对判断是否为本人。“语音识别会涉及口音,对结果产生较大干扰,而声纹是由人体发音系统的物理结构决定,人体构造是独一无二的,所以声纹也是唯一的。”VoiceAI创始人兼CEO李亚桐解释。

这个过程中,其实涉及语音识别+声纹识别两种技术。语音识别是需要判断读出来的随机数字是否正确,能一定程度上排除机器,声纹识别的作用则要判断是否活体、是否本人。之所以把认读内容限制为数字,主要是避免遇到“文盲”。

据悉,识别的准确率受场景、内容、语句长短影响,李亚桐告知,在养老基金这个项目中,可以做到99.5%以上的准确率。当然,倘若人因故声音沙哑,势必影响结果。“但声纹并不是唯一的验证方式,未来安全方面的趋势,一定是采取视觉、声纹、指纹等多因素综合验证。”李亚桐表示。

此外,值得一提的是,VoiceAI并不是只做声纹识别,前端的麦克风阵列、信号处理、语音识别等团队都有自研技术。

比如,VoiceAI服务了某知名油烟机厂商,为其输出语音指令控制模块。再比如,在某电力项目中,VoiceAI帮企业做语音转文字的部分。

李亚桐告知,VoiceAI现处于项目制落地行业的阶段,目前侧重大金融、智能硬件等方向。金融主要是反欺诈场景,确定“你是不是你”,建立欺诈者的声音黑名单库;智能硬件则是语音控制模块,已经服务的油烟机厂商是按照“一次性开发费+出货量抽成费计算”。

据了解,VoiceAI(声扬科技)团队现在13人。联合创始人兼CEO李亚桐2005年本科毕业于南开大学,2016年获香港中文大学工商管理硕士学位,多年从业于身份安全及生物识别领域,曾为国内外多个公共安全、外交、金融、电子证件等商业项目提供基于生物特征识别的身份安全解决方案。CTO陈东鹏博士于2010年本科于中国科学技术大学,2015年获香港科技大学计算机科学与工程博士学位,随后在联想香港研发中心从事语音、数据挖掘和自然语言理解的研究工作,曾在IEEETASLP, ICASSP, Interspeech等语音领域的国际顶级期刊和会议发表多篇文章。

公司于今年春节获得个人投资的天使轮融资,目前已启动Pre-A轮。

+1
5

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的机构

合创资本专注于ICT和医疗健康相关领域的早期风险投资。
中国企业可靠的长期合作伙伴

文章提及的项目

语音转文...

得意音通

中国银联

南方电网

百度

未来安全

鹏博

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业