私人搜索引擎Greplin已收录15亿份文档,6名工程师维护

pestwave·2011年04月28日 15:49
我们 曾报道过有个19岁的以色列高中生想通过私人搜索Greplin来挑战Google。现在看来他是认真的,该服务已经收录了 15亿份文档,每天约收录3000万份文档。

我们
曾报道过有个19岁的以色列高中生想通过私人搜索Greplin来挑战Google。现在看来他是认真的,该服务已经收录了
15亿份文档,每天约收录3000万份文档。

Greplin由 Y Combinator 资助,于2月份正式上线,该服务可以收录你的在线社交数据,比如Facebook、Twitter、LinkedIn、Gmail、Evernote、Dropbox等,然后你就可以在这些数据中进行搜索。

在首次登录Greplin时你需要授权该网站访问你的各种社交服务,它会抓取这些服务里的数据,如Facebook更新,推讯和私信,Gmail邮件等,然后你就可以对这些内容进行搜索。

Greplin搭建在亚马逊云服务商,目前的15亿份文档只有6名工程师和一名技术支持搞定。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

半个多月前“百度文库门”事件被炒得沸沸扬扬的时候,爱范儿上有一篇 《少不是0》谈数字产品是不是应该免费的问题,大部分观点 @NoTor 都同意,但总觉得还有很多东西需要更深入地谈谈。所以写了这篇文章,希望能用浅显严谨的语言和几个实际的案例来解释数字产品盗版和免费背后的一些经济学问题。为什么数字商品会趋向于免费 我们从1986年的纽约开始讲起。当时美国东北部地区的一家电话运营商Nynex(现在已经成为Verizon的一部分)在纽约推出了第一个数字版的电话黄页,用一张CD存下整个纽约地区的电话号码信息。他们以10000美元一个副本的价格把产品销售给FBI,美国税务局这样的政府机关和其他大型的商业机构。该项目的负责人James Bryant看到了这个业务背后的巨大商机,独立出户创立了自己的公司Pro CD,经营同样的业务,但把目标放到全美的电话信息。 Nynex利润丰厚的黄页业务因此受到了威胁,自然地拒绝授权Pro CD使用他们的数字化数据。James Bryant是个个性顽强的聪明人,他跑到北京雇佣了一批相对廉价的劳动力,将全美各地区的纸版黄页手工输入到电脑里,制作完成了包含7000多万个电话号码的CD盘。Pro CD制作一份CD副本成本不过1美元不到,以接近1000美元的价格出售CD副本,比原来Nynex的价格低了不少,而且内容更丰富,自然赚得盆满钵满。 这样顺风顺水的生意做了没多久,就有很多竞争者被丰厚的利润回报吸引进入这个行业。这些竞争对手提供的产品跟Pro CD基本没有分别,为了竞争大家只好大打价格战。结果是到了90年代末,只需不到20美元就能买到一张全美电话黄页CD。

2011-04-28

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业