【Build 2015】微软发布 Project Oxford,供 Azure 用户免费集成图像理解、人脸识别、语音识别、语音合成等功能

sinCerus·2015年04月30日 15:19
别造轮子了,拿这些去做产品吧


Image title

昨天 Build Day1 Keynote 一开始的时候,有人说它被红衣主教 Scott Guthrie 变成了 Azure 展销会,当然这么理解其实没什么问题。

后续的 Section 里,微软公开了 Project Oxford 服务,主要为 Azure 用户免费提供图像、语音识别等智能 REST API 和 SDK。

这一服务由微软研究院(MSR)主导开发,其为开发者提供的模型都由微软现有其它产品中使用的深度学习和机器学习技术训练得到。

Project Oxford 目前为止提供图像识别 API、人脸识别 API、语音识别/处理 API 和名为 "LUIS" 的语义识别服务四类功能。其中:

Image title

Image title

Image title

  • 图像识别 API 提供图像分析、OCR 和智能缩略图获取(智能提取图片主体)等功能。

Image title

Image title

Image title

Image title

  • 人脸识别 API 则提供人脸检测、人脸验证、分组和身份认定等功能。

Image title

Image title

Image title

  • 语音处理/识别 API 提供语音转文字和文字转语音两种服务。其后端与 Cortana 的识别引擎相同。发布之初语音转文字提供 7 种语言支持,文字转语音提供 17 种。

Image title

Image title


  • LUIS (Language Understanding Intelligent Service)服务提供语义分析、实体检测和自学习模型特性。

此前我们采访机器学习/深度学习界泰斗 Alan Yuille 时,他提到微软研究院是目前商业公司内几乎唯一一个纯以学术为目的的研究性机构,本次微软将 MSR 多年的积累提供给开发者,无疑是给创业公司们一个信号:别再折腾自己造轮子了,直接买个 Azure 然后专心做产品吧。

消息来源:Channel 9(现场 Keynote 也能从本链接下载)、Project Oxford 项目地址

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

提及的项目

查看项目库

下一篇

阿里巴巴最近宣布将冻结招聘,但是实际上除了天猫、淘宝、聚划算等电商业务,其他部门受到的影响并不大

2015-04-30

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业