Facebook的“大数据”到底有多大?

橙皮书·2012年08月23日 10:21
据说这是一个“大数据”的时代,到底有多大呢? Facebook最近在总部的一次会议中披露的一组数据可以给大家一个初步的印象,来一起看看每天Facebook上都得处理多少数据吧: 25亿 Facebook上分享的内容条数 27亿 “赞”的数量, 3亿 上传照片数 500+TB 新产生的数据 105TB 每半小时通过Hive扫描的数据 100+PB(1PB=1024TB) 单个HDFS(分布式文件系统)集群中的磁盘容量

据说这是一个“大数据”的时代,到底有多大呢?

Facebook最近在总部的一次会议中
披露的一组数据可以给大家一个初步的印象,来一起看看每天Facebook上都得处理多少数据吧:

25亿
Facebook上分享的内容条数

27亿
“赞”的数量,

3亿
上传照片数

500+TB
新产生的数据

105TB
每半小时通过Hive扫描的数据

100+PB
(1PB=1024TB) 单个HDFS(分布式文件系统)集群中的磁盘容量

FB的工程总监Parikh解释了这些数据对于Facebook的意义:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”

目前Facebook有着世界最大的分布式文件系统,单个集群中的数据存储量就超过100PB。在Facebook内部,从一开始就没有在不同的部门之间(比如广告部和用户支持部)设立障碍或者分割数据。这样一来产品开发者就可以跨部门获得数据,实时知晓最近的改动是否增加了用户浏览时间或者促成了更多的广告点击。

作为普通用户,大家也许会对如此海量的数据心存不安,担心自己的数据被随意浏览。对此Facebook表示有各种防范措施来防止此类事情的发生,比如所有的数据读取记录都会被存档,哪些人看过哪些数据都是记录在案的;如果有员工越线,会被直接开除。Parikh着重强调:“在这件事上我们的政策是零容忍。”

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

提及的项目

查看项目库

下一篇

虽然美国的人口老龄化情况并没有中国严重,但他们也面临着很多问题。不过既然有问题,自然就会有解决问题的需求。面对这个庞大的老年人群市场,美国创业公司已经开始有所动作。 个人理财规划网站<a href="https://www.futureadvisor.com/" target="_blank">FutureAdvisor</a>在两年前就推出了为老年人群提供<a title="百科词条" href="http://wiki.mbalib.com/wiki/401K%E8%AE%A1%E5%88%92" target="_blank">401K(美国养老金计划)</a>的理财咨询服务,不过最近几个月才公开发布。 目前FutureAdvisor已经为1100万401K账户提供金融理财建议,总资产约40亿美元,预计能为客户省下5000万美元的费用。

2012-08-23

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业