Google街景是如何识别门牌号的?

boxi·2014年01月13日 13:17
知道Google街景是如何识别各种千奇百怪的门牌号的吗?靠的是它搭建的一个疯狂的神经网络。


知道Google街景是如何识别各种千奇百怪的门牌号的吗?靠的是它搭建的一个疯狂的神经网络。

我们知道,在受约束环境下(如文档处理)的字符识别技术,比方说OCR技术已经被研究得很透。但是对照片中的多字符文本识别却是个难题,因为这些照片中的字体、颜色、样式、方向、排列不一,再加上光照、阴影、镜像、遮蔽等环境因素影响,还有图像本身的分辨率、焦点模糊、抖动等问题。而传统的图像文字识别,一般要经过字符定位、分割和识别三个步骤,处理效率不高。考虑Google街景的每天上传的图片量,以往的这些方法显然缺乏实用价值。

为此,Google开发了一套大型的神经网络来处理海量的Google街景图片中的门牌号识别问题。这个神经网络的代号是DistBelief,其学名是深度卷积神经网络,我们之前曾介绍过这套会思考的深度学习系统。经过DistBelief训练的这个大型分布式神经网络,可以把定位、分割和识别三个步骤集成到一起,直接对每一个像素进行操作。其性能随着神经网络的深度增加而提高,在11层的时候达到最高。


根据论文的数据,该系统对SVHN(街景门牌号数据集)中的门牌号识别率达96%,而单数字识别率达97.84%,对于Google街景图库的上千万门牌号的识别率也超过90%。该系统每天可识别百万门牌号(不到1小时即可将法国的街景照片中的门牌号找出来)。目前该系统已经帮助Google从街景图中分析出全球近1亿个门牌号。

感兴趣的可到此处下载Google的这篇论文:Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

见惯了小巧的可穿戴式设备,看见SolarCooler这个大个头的硬件还真有点不适应。SolarCooler是一个正在Indiegogo上众筹的便携式制冷器,它的特别之处在于它是依靠太阳能产生的能量来制冷的。其团队号称它是“世界上第一台太阳能的便携制冷器”,并且由于他们使用了高级的电源能量管理环路,因此可以平衡制冷过程中的电力负荷、太阳光电能量的输入以及电池内的能量存储。 如果你认为SolarCooler只能用在日常沙滩娱乐活动中,并不能给大家带来太大意义,那你就错了。SolarCooler团队的期望是可以将其用于冷链物流和疫苗运输,以及将其用于一些电力并不发达的发展中国家的基础生活制冷需求上,除此之外,连接上SolarCooler还可以给LED照明灯提供能量。

2014-01-13

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业