Netflix负责IT的副总裁谈网络基础设施的未来
风投机构Amplify Partners最近对Netflix负责IT部门的副总裁Mike D Kail进行了一次专访。Mike负责的工作包括Netflix本地和云端的网络设施,以及网络建设、安全、数据方面的一系列重要的改革。除了在Netflix的工作之外,Mike也是Amplify Partners的资深顾问。以下是专访的全部内容。
首先,您能跟我们说说您的背景吗?您是怎么来到Netflix的?
我有着超过23年Unix系统网络架构师的背景,曾经做过开发运营(DevOps)和大数据等相关工作,只不过那时候这些概念还没有这么火。在来Netflix之前,我在Attensity工作,负责一个大型的Hadoop和Hbase集群,并管理着其它一些大数据相关的部门。2011年夏天,我加入Netflix,现在是负责IT运营的副总裁。更多关于我如何加入Netflix的事情,可以看我曾经写的博客。
您能描述一下您加入Netflix之前,它的网络设施是什么样的以及您对其接下来几年的发展怎么看?
在我加入之前,公司内部的IT系统是按照传统的模式建立在本地的,有两个数据中心。我们的人力资源系统是本地的Apache + PHP, 金融系统是Oracle提供的,还有很多大型设备和存储器。我们2014年的目标是将我们的网络设施100%的放在云端或者使用SaaS。更多的细节可以看我之前在这里公布的Netflix IT 部门2014年路线图。
我听说过Netflix 100%移动的文化。您能详细地描述一下这种文化吗?您希望给你的团队带来一种什么样的文化,您期待什么样的效果?
对我们文化的最好描述就是“一切皆移动”(“everything is mobile.”)。为什么人们只能在公司里工作?我们希望消除这个界限,把内网变成分布式的网络结构。
这种转变的目标是使得人们不管在Netflix总部,在咖啡馆还是在家都能享受到同样的体验。甚至能做得更好,在Netflix,包括我在内的一些人已经没有办公室了,我所需要的就是我的iPhone 5S、Nexus 5、Macbook Air和Chromebook,我可以在任何我想要的地方办公。
从基础设施和安全的角度来说,一切都使用云服务带来了什么?
使用公有云(laas)和SaaS作为你的网络基础设施迫使你换个思路来思考,要求你在不存在地理边界或边界不确定的情况下布置网络设施,同时确保安全。因此,身份验证和数据接入权就成了确保安全的重中之重。我们开始探索如何通过一种新的途径解决问题,使得这样的网络布局内安全能够得到充分的保证。
您对于监测和分析是怎么看的?在管理IT部门时,您发现在哪些方面做的分析非常有帮助?
我认为,使用一种有用且合理的衡量标准和分析手段非常重要,很遗憾,很多公司的IT部门没想到或者是无法做到有效衡量。我们能想到的例子比如helpdesk ticket的趋势,不仅是ticket的容量,而是能依据这个系统得到一种预测性的方法。就网络来说,不能只分析总产能和吞吐量,要衡量服务质量,比如说SaaS提供者(比如Google,Workday,Box等)的循环时间(Round Trip Time, RTT)。
您之前说过分布式的网络架构,您能不能解释一下这对Netflix意味着什么?您将如何管理网络接入控制(Network Access Control, NAC)?
我们采用分层的方法进行分布式布局。首先将通过升级我们的Aruba WAPs 到802.11ac来进行同步。我们正在引入基于证书的身份验证,而不用传统的用户名密码的验证模式。
此外,我们通过Sumo Logic的审查或分析透视来记录所有行为,并且开发了控制面板来进行一些更深层的分析和相互关联。
基于我们现有的设备实验室并且本着减少麻烦的原则,NAC可以说是带来了一种非常独特的挑战。接入NAC的一种方法是直接默认允许各种设备接入80/443 TCP接口,在与团队分享时需要可拓展的权限。
您曾说过关于移动设备管理(Mobile Device Management, MDM)慢性死亡的问题,您能分享一下为什么会这样以及相应的会出现什么替代品?
我认为,如果你考虑一下应用和数据接入,MDM和移动应用管理(Mobile Application Management, MAM)从来都不是可行的解决方法。在设备上设置更多的规则和控制并不是解决安全问题的正确方法。我们应该关注应用和数据更强的验证方法以及对于设备上的缓存进行加密的能力。关于这一点,我在我的博客中也有写到过。
您曾经观察到数据仓库(Enterprise Data Warehouse, EDW)或数据抽取、转换、装在过程(Extract, Transform, Load, ETL)将成为下一代的解决方案,我很好奇,您怎么看这一趋势。
现在的EDW (incumbent)解决方案既不是弹性的,也不是多用户式的。一旦你的数据量爆发到GB/TB/PB级别,你就需要在基础设施方面一次性投入大量资金进行升级,迁移数据。在这个过程中,你会浪费宝贵的时间和对数据良好的管理。下一代EDW将是以云为中心的,拥有充分的弹性和多用户支持,并且能够以用户速度获取数据。
和这些转变一起,还会有新的ETL通道,能够利用其他数据库技术作为通道的一部分。人们可以看到数据如何通过Hadoop cluster来MapReduce它,然后用内存进行转换,最终在云端EDW进行加载和分析。
随着一些工程师和分析工作开始变得更加突出(比如,数据工程师,运营开发(DevOps),数据科学家),您觉得在Netflix的IT部门文化有变化吗?
我认为IT应该始终有工程开发和数据分析两个方面。我也相信,产业的发展会随着时间的变化对每个公司提出更加严格的要求。每个人不需要成为一个全能的开发者,理解数据的力量并且知道怎样解锁和发掘它将会成为至关重要的一点。
您现在有希望招募的职位吗?
你可以在我们的官方招聘网站上看到我们的招聘需求。
如此大规模地把Netflix的网络设施迁到云端带来了哪些挑战?公司有哪些服务或组件你认为是应该自有的。
主要的挑战是我设定的严格的时间进度。认为有什么东西需要自有是旧世界的思考方式,感觉更像是有人想要满足控制欲,而不是做真正正确的事情。
您怎么看到开放与软件专利权之间的平衡?您怎么看未来几年这种平衡在更广泛范围内的发展。
我们讨论了很多“建设还是购买”的问题,这个问题通常会得到一个综合的解决方案,我们会提高“购买”的数量,这需要更多灵活性以及控制能力的。在开放这块,我认为,我们会看到开源会逐渐进入到所有的科技领域。你也会在接下来几个月看到我们团队在开源方面做出的贡献。















