科大讯飞推离线语音输入,意在拓展产品适用场景

新用户940482166·2013年09月13日 21:23
继Google之后,科大讯飞先于苹果推出了离线语音输入技术。该技术通过将语音资源库保存在本地,实现弱网络或无网络环境下的语音识别和输入。依靠较小的资源占用、较高的中文识别率和相应速度,讯飞离线语音已被小米3采纳。

提起科大讯飞,毫无争议是国内语音技术界的金字招牌。依靠相对深厚的技术储备和广泛的合作关系多年来一直领跑行业,目前可以说是三分天下有其二(70%的中文语音技术市场份额)。就在昨天的一场小型媒体交流会上,讯飞向我们展示了其最新的离线语音技术。

以往的语音资源库保存在云端,应用在提取音频特征后上传云端处理。而离线语音将资源库下载到本地,在弱信号或无信号环境下也可进行高精度的语音识别和输入。由于在资源占用和识别精度上的技术矛盾,目前在该领域推出成熟产品的公司屈指可数。

据统计,中国只有 26.1% 的手机用户接入 3G 网络,许多用户仍然处于流量敏感的状态。而讯飞的离线语音包仅有 15M 到 30M 大小,对不同性能的设备会自动在语音包体量上做出适配。再加上离线语音不受网络延迟的影响,对用户体验会带来较大提升。目前讯飞离线语音的中文识别准确率可以达到 85%,识别速度 300ms,两项指标相比 Google 均有一定优势(据称 Google 的 Offline Voice Typing 中文识别率不到 40%)。基于特定语言模型的分析,讯飞也可以实现长句语音输入和自动标点,用户无须再对文本频繁修改。另据小米官方消息,讯飞离线语音已被小米3采纳。

值得一提的是,讯飞的个性化语音识别也将应用在稍后版本中出现。系统会为用户数据建立个性化资源库,通过个性化资源的动态加载、融合使得语音智能更加“聪明”。

离线语音不是个新鲜名词,Google 在去年发布的 Android 4.1 版本中就已经应用了此技术,而据媒体此前报道,苹果即将推出的 iOS7 也具备这一功能。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

看到这个账号,我的第一反应是:马太效应,好的更好,坏的更坏。在互联网的世界里,我们很容易利用长尾理论和注意力经济学,把那些受人关注的名人所积累的注意力,转化为金钱。但我觉得,这件事并不是在让世界变得更好,因为那些长尾的付费,很有可能只是因为无条件的喜欢而付出并不容易得来的金钱,换言之,他们获得收入的难度会是远远大于陈坤的,但他们依旧在付出。

2013-09-13

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业