超越Google图片搜索,卡内基梅隆大学让你用一张素描就能搜遍不同时间、角度和颜色的“相同场景”照片

曾子嶒·2011年12月07日 16:33
事物在不同场合都能够辨别,这是人类拥有的一种基本认知能力。这种能力既不会受颜色、季节、角度等因素影响,也不会因为素描、油画和照片等载体的差别而减弱。但这却是目前的<a href="http://www.36kr.com/tag/%E5%9B%BE%E7%89%87%E6%90%9C%E7%B4%A2" target="_blank">图片搜索</a>引擎和计算机视觉领域所欠缺的。而如今卡内基·梅隆大学的研究团队在这方面已经取得了<a href="http://graphics.cs.cmu.edu/projects/crossDomainMatching/" target="_blank">初步成果</a>。 目前在计算机视觉领域并没有现成的特征库或算法可用,因此卡内基·梅隆大学的研究人员在图像特征识别方面独辟蹊径。他们并没有像传统做法那样把目标图片和其它图片对比寻找相似点,而是将目标图片与大量随机图片进行对比寻找其最独特的特点。以此类推,让其他的图片也进行类似的对比。如果某一副图片也得到了相似的特点,那它就非常可能和第一幅图片是同一类——即它们描绘的都是同一个场景。

对具有明显特征的事物在不同场合都能够辨别,这是人类拥有的一种基本认知能力。这种能力既不会受颜色、季节、角度等因素影响,也不会因为素描、油画和照片等载体的差别而减弱。但这却是目前的
图片搜索引擎和计算机视觉领域所欠缺的。而如今卡内基·梅隆大学的研究团队在这方面已经取得了
初步成果。

目前在计算机视觉领域并没有现成的特征库或算法可用,因此卡内基·梅隆大学的研究人员在图像特征识别方面独辟蹊径。他们并没有像传统做法那样把目标图片和其它图片对比寻找相似点,而是将目标图片与大量随机图片进行对比寻找其最独特的特点。以此类推,让其他的图片也进行类似的对比。如果某一副图片也得到了相似的特点,那它就非常可能和第一幅图片是同一类——即它们描绘的都是同一个场景。

不过,采用这种方法唯一的局限就在于它并不是那么高效,处理器的工作量会非常大,因为你需要比较和筛选大量的图片。而目前Google提供的图片搜索服务则效率更高,只是精确度不如此项目。但是相信随着时间的推移,效率问题将会逐步得到解决。

总体来说,这种方法还是很有发展前景的。图片搜索又是当前的热门领域,因此这一项目将会继续下去。另外值得指出的是该项目的背后还有Google的支持。感兴趣的朋友可以到
项目主页上去查看演示视频。如果想深入研究,也有相关文档可供下载。

Via
TC

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

近些天来抨击Siri似乎已成了潮流。<a href="http://gizmodo.com/5864293">Mat Honan以“Apple’s broken promise”一文</a>极尽嘲讽,<a href="http://searchengineland.com/why-siri-cant-find-abortion-clinics-103349">CNN报道了Siri所谓的反堕胎偏见</a>,<a href="http://daringfireball.net/">John Gruber</a>评论说苹果的旗舰极新产品“在小处如此粗糙”,实在是不可思议,但他也同时指出:被广泛使用以后,语音识别更容易提高。 这不仅是更容易,而是只能这样! 我在IBM Research的语音识别项目里工作了近六年。我们参加了由DARPA(美国国防部高级研究计划局)赞助的研究项目、实地测试、以及各种应用的实际产品开发:听写、呼叫中心、汽车、甚至是听障人员的课堂助理。尽管具体项目不一,但基本的东西从来不变:给我们更多的数据!(数据在这里指语音录音)一些研究员还认为最近语音识别准确性的提高要归功于更多的更好的数据,而不是更好的算法。

2011-12-07

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业