语音识别

语音识别最新快讯,36氪聚合所有语音识别相关的新闻快讯,并为你提供最新的相关资讯。
本次共找到 44 条【
语音识别
】相关快讯
微软160亿美元收购公司Nuance已获美国反垄断许可
根据最近人工智能与语音技术公司Nuance向政府提交的文件,微软收购Nuance的这笔交易,已经获得美国的反垄断许可。(新浪科技)
2021-06-05
苹果正在研发带有摄像头和功能的机顶盒
据俄罗斯卫星通讯社报道,美国苹果公司正在研发一种将机顶盒“Apple TV”与摄像头和功能相结合的设备。消息指出,该设备尚处于早期研发阶段,其方案可能会发生变化。预计,新产品将兼备机顶盒、“智能”扬声器和摄像头的功能。通过扬声器可以播放音乐,使用Siri语音助手,摄像头则用于视频通话。消息称,这种设备上市后可能会成为最先进的智能家居系统。(第一财经)
2021-04-13
微软将以每股56美元的价格收购巨头微妙通讯Nuance
微软将以每股56美元的价格收购巨头微妙通讯Nuance,交易价值达197亿美元。(彭博)
2021-04-12
标贝科技发布2800小时系列儿童数据集
36氪获悉,标贝科技今日对外发布2800小时有效时长的儿童中文、英文、中英文混数据库,匹配儿童ASR训练模型,提升儿童准确率。
2020-11-24
云知声推出AI开放平台
36氪获悉,近日,云知声基于语音云平台,推出AI开放平台。云知声AI开放平台面向各行各业,为企业及个人开发者应用增加人机对话、多模态交互技术服务。除现已全面开放的、语音合成、口语评测之外,声纹识别、语音唤醒、多模态交互等技术,客服、会议等解决方案也在持续上线中。
2020-09-14
腾讯云发布专属模型:支持韩语、粤语
36氪获悉,4月29日,腾讯云正式发布金融、音视频等多个领域专属模型,新增对粤语、韩语的支持,并将陆续开放对上海话等方言以及日语、泰语、印尼语等国外语言的支持。
2020-04-30
人工智能芯片企业“启英泰伦”获东方富海数千万元投资
36氪获悉,人工智能芯片企业“启英泰伦”近日完成新一轮数千万元融资,本轮由东方富海管理的国家中小企业发展基金(深圳南山有限合伙)独家投资,本轮资金将主要用于下一代语音AI芯片研发及投片。
2019-11-14
谷歌宣布开源Live Transcribe转文字工具
昨日,谷歌在其开源博客中宣布开源 Android转录工具——Live Transcribe的语音引擎(Live Transcribe Speech Engine),它旨在将语音或对话实时转录为文字,还能够为听障人士提供帮助。(开源中国)
2019-08-18
云从科技时隔半年再次刷新世界纪录
10月 29日,云从科技宣布在技术上取得突破,在全球最大的开源数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校。(亿欧)
2018-10-29
谷歌高管:将是科技的下一次飞跃
谷歌搜索业务负责人戈麦斯表示,科技的下个飞跃将是语音技术的发展。他认为,更好地理解普通语言对互联网的未来至关重要。戈麦斯认为,和语言理解是未来搜索和信息的核心,然而还存在很多困难的问题,包括理解参照对象是什么,例如句子里的“他”、“她”和“它”指代的是什么。(新浪)
2018-09-25
腾讯地图8.0版本发布,智能语音助手正式上线
36氪讯,在新发布的腾讯地图8.0版本中,智能语音助手正式上线。依托腾讯叮当的语音唤醒、、语义理解等全栈AI 能力,以及整个腾讯的内容和服务资源,智能语音助手能够实现全语音操控,无需按键操控;用户可随时与其问答出行、驾驶相关问题,也可语音指令“将我的行程分享给微信好友或者朋友圈”,快速便捷报平安。
2018-09-20
云知声联合平安好医生起草智能行业标准规范
36氪讯,日前,云知声联合平安好医生共同起草了《中文难度分级认证规范》讨论稿,这是国内首个关于中文智能难度的标准规范。《认证规范》将中文难度分为L1-L4四个等级,并分别从声学和语言学两个维度确定了信噪比、普通话水平等十余个影响因素,对智能语音交互类产品在实际应用场景下的识别率提供了定级依据。
2018-09-12
Facebook正推进技术:未来会进化成语音助手
据TechCrunch报道,Facebook正在测试一种叫做“Aloha”的技术。Facebook给新功能取名叫作“Aloha Voice Testing”,代码暗示语音功能可以支持外部WiFi或者蓝牙设备,也就是说Aloha有可能会成为跨平台语音助手,与Siri、谷歌助手一样。(新浪)
2018-08-22
阿里达摩院公布自研模型DFSMN并宣布开源
阿里巴巴达摩院机器智能实验室推出了新一代模型DFSMN,将全球准确率纪录提高至96.04%(这一数据测试基于世界最大的免费数据库LibriSpeech)。达摩院机器智能实验室的团队主导了这个模型的研发,并宣布向全世界企业与个人开源。(网易)
2018-06-07
康语发布首款基于的人工智能虚拟健康助手
36氪获悉,健康保险科技创业公司发布了一款由Sensely提供技术支持的、首款基于的人工智能虚拟健康助手,可帮助保单用户进行初步症状的预判、提供自我诊疗的指引以及前往医疗服务的指南。据了解, 这个基于人工智能的症状预判分类功能将会正式在康语平台上线。
2018-05-17
罗永浩演示“革命性系统”现尴尬 出故障
锤子科技今日发布了据称会重新定义下一个十年的个人电脑、Office办公套件、信息搜索的方式和即时通讯工具。不过在演示该产品时,遇到了一些尴尬。比如语音功能打开应用时,会存在识别不了的状况;在使用Excel时,语音输入数字也多次出现了识别问题。不过后来演示功能逐步恢复正常。(新浪)
2018-05-15
阿里研发高工业噪声环境下及传输技术,终结“耳聋工厂”
阿里巴巴机器智能技术实验室消息,其正研发在高工业噪声环境下的及传输技术,以后,众多车间工人将告别“通讯靠吼”的境况,简单的交流言语会转换成文字,让彼此心领神会。阿里巴巴AI语音工程师介绍,他们研究的语音交互技术,已实现在85分贝工业噪声下,将一米处正常音量语音转换为文字。(cnBeta)
2018-05-02
俄企推出面试机器人,集合多种技术
俄罗斯圣彼得堡初创企业Strafory推出用于机构招聘的人工智能机器人。它名叫“薇拉”,不仅能从招聘网站筛选求职者简历,还能通过视频或语音电话同时面试多至数百名求职者。它结合了谷歌、亚马逊、微软和俄罗斯搜索引擎Yandex的技术,拥有庞大词库。(亿欧)
2018-04-02
中兴推出首款AI机顶盒 支持可视电话
近日,中兴推出首款智能AI机顶盒S100,是业界首批自带AI功能的机顶盒设备,具备远场语音交互能力强,唤醒时延低,能力高的优点。S100可为用户提供丰富的应用,包括天气、新闻、股市等互联网交互服务和中兴通讯的智慧家庭业务,例如:多屏互动、可视通讯、智能家居等。(腾讯科技)
2018-03-07
深鉴科技加速系统上线AWS,为全球用户提供云加速服务
36氪讯, 深鉴科技昨日宣布在亚马逊AWS正式上线基于深鉴Descartes稀疏神经网络处理架构的自动引擎DDESE (DeePhi Descartes Efficient Speech Recognition Engine), 开始面向全球用户提供加速试用服务。
2018-03-06
告别打字:谷歌前员工用AI开发App,“实时”记录文字
谷歌的一名前员工Sam Liang与软件公司Nuance,共同开发了一款App“Otter”。这款软件利用人工智能学习来对文字进行转换,着超高的准确率,而且还能做到“实时”将语音转化成文字档。得益于近年来“语音助手”的蓬勃发展,Otter相较于其他软件,拥有一项独特的“声音辨识”功能。(IT之家)
2018-03-05
科大讯飞:腾讯小Q机器人采用讯飞技术
11月8日,科大讯飞在互动平台上回答投资者询问时表示, 腾讯小Q机器人采用的是讯飞的技术。另外,相关负责人表示,科大讯飞面向全行业提供人工智能能力,目前累计终端数达15.7亿。公司的技术和图像识别技术处于国际领先水平,目前在包括教育、医疗等领域均有应用。
2017-11-08
微软出错率达5.1%创新低,比肩专业速录员
微软公司在当地时间周日宣布,其对话式系统的出错率达到5.1%,创下目前为止的最低水平,超过了去年微软人工智能及研究事业部一组研究人员所实现的5.9%出错率,达到了专业速录员的同等水平。 在此次研究中,专业速录员具备重复收听录音等优势。这两次研究转录的是Switchboard语料库中的录音。Switchboard语料库包含了2400段电话对话,自上世纪90年代以来一直被研究人员作为测试系统的样本。
2017-08-21
火狐开发技术,挑战谷歌AI霸权
负责开发火狐浏览器的Mozilla,已经开始测试一项功能,让用户通过语音而非在键盘上打字输入搜索关键字。此举有助于Mozilla提升火狐针对谷歌Chrome浏览器的竞争力。
2017-08-06
Mozilla基金会正筹建众包式库项目Common Voice
Mozilla基金会正在酝酿一项名为Common Voice的众包式音源和识别库,该数据库将免费向三方测试开放,供那些需要在开发项目中应用(语音转文字)训练功能的开发商使用。该项目的目标是收集超过一万小时以上的音频音源,包括各种口音并且预计在今年晚些时候渐进式开放。而现在每个人都能够在该网站贡献上传自己的音源,通过自然地朗读指定陈述句,或者判断听到的他人录音口音及语调是否准确。还有相关的iOS应用供移动设备用户直接上传语音音源。当然Mozilla对项目贡献者做了非常严格的隐私保护。
2017-07-19
现代汽车在地图和领域与百度达成合作
韩国现代汽车将与中国百度在地图和服务领域展开合作。作为第1项举措,现代将在2017年底之前,在面向中国销售的汽车的车载终端中引入与百度共同开发的导航软件“百度 MapAuto”和对话型服务软件“OS Auto(度秘)”。双方希望将来在确立自动驾驶技术等方面加强合作。
2017-06-16
哈曼发布远程解决方案 SONIQUETM
6月8日,哈曼国际发布全新的远程解决方案 SONIQUETM。该解决方案将面向快速发展的消费类语音电子产品、企业及机器人语音应用市场,提供有别于传统手动输入的新型语音输入技术。
2017-06-08
腾讯 AI Lab 副主任俞栋:的研究从近场麦克风转向远场麦克风
腾讯 AI Lab 副主任、西雅图人工智能研究室负责人俞栋博士表示,如今我们研究的问题越来越没有环境、说话风格、口音、词汇等限定(不像以前有非常多的限制),这极大地增加了的难度,同时研究的前沿也从近场麦克风转向远场麦克风。两者的区别在于,在远场情况下,当人的声音传达到麦克风时,声音衰减很厉害。所以以前在近场麦克风很难见到的一些困难,在远场麦克风场景下就变得很明显。如果不解决这些问题,用户在很多的应用场合仍然会觉得效果欠佳。
2017-06-01
腾讯西雅图人工智能研究室负责人探讨的四个前沿问题
5月27日,腾讯AI LAB副主任、西雅图人工智能研究室负责人俞栋博士出席在京举办的GMIS,发表了主题为《领域的前沿研究》的演讲,探讨分享了领域的四个前沿问题。第一是更有效的序列到序列直接转换的模型。第二是鸡尾酒会问题,即屏蔽掉周围的说话声或噪音,非常好地听懂他/她要关注的那个人的说话声音。第三是持续预测与适应的模型。第四是前后端联合优化的问题。
2017-06-01
谷歌云端服务上线,能识别80种语言
谷歌公司近日正式推出了旗下云端服务(Cloud Speech API),其能够识别全球超过80种语言,并能将语音转换为文字。其中,中文也在被支持之列,包括繁体中文、粤语、普通话。据介绍,谷歌的云端服务采用与Google Now、Google搜寻及Google Assistant相同的语音辨识技术。在刚刚上线的正式版本中,谷歌加强了长句子的识别和转换精度,新增支持WAV、Opus和Speex文件格式。而且识别处理速度比2016年推出的测试版快了3倍。
2017-04-21
IBM宣布在自然对话环境中的上创造新纪录
IBM宣布在自然对话环境中的上创造新的业界纪录:5.5%的错误率。(网易科技)
2017-03-10
麻省理工学院新芯片助力AI助手,功耗最多降低99%
据外媒报道,AI语音助手必将成为今年科技界的“爆款”产品,不过一直在后台待机的它们功耗可不小。麻省理工学院(MIT)的研究者就针对该问题拿出了新的解决方案,他们开发的低功耗芯片最高能把的功耗降低99%。MIT的研究人员表示,现有手机分给的电量高达1瓦特,如果用上他们的新芯片,电量消耗能直接降到0.2-10毫瓦。
2017-02-15
用AI分析销售电话 Chorus.ai获1600万美元A轮融资
一般来讲,通用语音的识别要比销售领域中的常用更难。即使在问题已经基本解决的今天,许多系统仍然无法克服语言的复杂性问题,Chorus.ai 公司以销售领域中的常用为切入点,致力于通过 AI 为销售团队提供解决方案。近日,Chorus.ai 公司获得 1600 万美元 A 轮融资,由 Redpoint领投,Emergence Capital Partners 参投。截止目前,该公司累计融资 2230 万美元。此外,Emergence Capital Partners 还领投了该公司去年 10 月获得的 630 万美元种子轮融资。
2017-02-10
谷歌自2012年以来已把词错率降低逾30%
据科技博客VentureBeat报道,谷歌高级研究员杰夫·迪恩(Jeff Dean)周三在人工智能前沿峰会(AI Frontiers)上表示,自2012年以来,谷歌已经把的词错率(WER)降低了30%以上。谷歌发言人证实了这一数据。迪恩称,词错率的下降得益于神经网络的使用,后者是谷歌和其他公司在深度学习中使用的一种系统。
2017-01-12
IBM 新方向:仿生蝙蝠耳能用声纳精准“聆听”
IBM 学院奖获得者 Rolf Müller 教授协同他在弗吉尼亚理工学院(Virginia Tech)的团队,设计了一种人造蝙蝠耳。IBM 专家韩金萍(音译)的神经计算团队希望借该项技术提高人类语音理解的能力。他们把原始语音数据和经人造耳处理的声音数据,放入分类器( classifier )中进行识别。67% 的语音信号能被成功识别出来。而在没有动态外耳的对照组中,只有 35% 的声音数据被识别。
2016-11-29
百度搜狗讯飞准确率达到97%
11月21日到23日,搜狗、百度和科大讯飞三家公司接连召开了三场发布会,向外界展示了自己在和机器翻译等方面的最新进展。值得注意的是,这三家公司几乎在同一时段宣布了各自中文准确率达到了97%。
2016-11-24
三星Galaxy S8将推AI助手功能
韩联社报道,三星电子4日在收购美国人工智能(AI)公司Viv Labs后举行的记者会上表示,将于明年上市的三星新一代智能手机Galaxy S8将搭载人工智能功能。三星方面表示,Galaxy S8将成为三星电子首个配置语义识别人工智能的平台,与以往的人工智能助手将有显著不同,性能优越。此次Galaxy S8推出的AI助手属于对话型服务。如同苹果(108.84, -0.99, -0.90%)的智能语音控制功能“Siri”一般,在识别用户语音后,提供所需的信息。
2016-11-06
计算机率首次媲美人类,率增至94.1%
据麻省理工学院网站近日报道,微软雷蒙德研究院开发出一种机器学习算法,使计算机对指定主题对话的率增至94.1%,首次与人类水平相当;对亲戚朋友日常对话的识别率达88.9%,甚至比人类略胜一筹。
2016-10-29
微软机器出错率首次小于人类
据外媒报道,人工神经网络研究迎来新进展,微软声称其所训练的神经网络在人声上已经媲美人类。在周一发布的公告中,微软表示其用NIST 2000自动化系统来同专业笔记员进行能力对比,首次实现了机器出错率小于人类的突破。微软CEO萨提亚·纳德拉对不吝赞美之情,称的突破意义不亚于当初图形界面(GUI)被引入电脑。并预言技术将在未来几年迅速普及。
2016-10-19
微软错误率6.3%为行业最低
近日,微软首席语音科学家黄学东在论文中表示,他们在近期产业标准Switchboard基准测试中,实现词错率(WER)低至6.3%的这一技术突破,这比IBM上周达到的6.6%WER下降了0.3%,达到目领域错误率最低的水平。微软的技术已较为成熟,在不断突破基础技术的前提下,其继续提升以技术为基础的各种应用服务,包括Cortana以及Skype翻译等。
2016-09-16
百度宣布免费开放两项技术
6 月 23 日下午消息,百度语音技术媒体开放日上,百度方面宣布免费开放语音唤醒和自定义语义 2 项技术。百度表示将为开发者提供百度大脑的声学模型和语音模型,基础服务免费,可永久使用。百度语音唤醒技术目前主要应用于百度小度机器人和百度车联网 CarLife/Codriver,唤醒率达 95%,支持自定义唤醒词和连续表达。自定义语义技术则主要应用于方言、口音识别。据了解,语音技术是百度目前主要专注的人工智能研究方向之一,2015 年 11 月,百度首席科学家吴恩达领导的百度硅谷实验室开发的新一代技术 Deep Speech2,被美国权威杂志 《麻省理工评论》 列为 2016 年十大突破性技术之一。
2016-06-23
公司Semantic Machines获得1230万美元B轮融资
Semantic Machines成立于2014年,总部位于麻州。 Semantic Machines是一家专注于同步的人工智能公司。据悉,该公司目前的CTO Larry Gillick曾任苹果Siri语音研发的首席语言科学家。而创始人兼CEO Dan Roth曾经创立Voice Signal Technologies但公司在2007年被Nuance Communications以3亿美元收购。公司在网站上写到:我们目前研发的人工智能将使电脑正常交流和了解彼此。据了解,人工智能在近年来受到了多家公司的关注。Google最近推出了 更为精准的语音搜索软件;Facebook也在今年年初收购了一家创业公司Wit.ai来支持公司的人工智能研发。本轮投资的公司为Bain Capital Ventures和 General Catalyst Partners。
2015-12-24
Google 发布最新技术
Google的语音研发小组在公司的Research Blog上称,公司的搜索技术目前有了新的进展。新的技术能够识别说话者的短暂停顿,并且反应更快速、准确和有效。Google称,即使在嘈杂的环境下,这项功能也将有较好的表现。目前,iOS和Android版的谷歌搜索app已经开始使用这项新的成果了。
2015-09-25
NTT 开放API
NTT是日本最大电信服务提供商日本电信电话株式会社的全资子公司。NTT 开放的API支持 Chrome、Firefox 和 Opera三种浏览器。开发者可以在 SkyWay(NTT的免费网页实时通信平台)找到该 API。
2015-07-29
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业