美国Bowdoin学院在美国所有文理学院中排名第七,成立于1794年,至今已经有200多年的历史。近年来,Bowdoin学院发展迅速,日益增长的服务、应用需求让他们必须添加更多的服务器,原来的数据中心空间已经远远不够用了,他们得把学校500平方英尺的数据中心扩大一倍才行,但200万美金的扩建成本让Bowdoin学院望而却步了。
Timothy Antonowicz
尽管望而却步,但扩建压力仍然存在,2003年,该学院系统管理员Timothy Antonowicz决定通过虚拟化整合服务器,一台物理服务器上运行多个虚拟服务器,每个虚拟服务器可以运行一个或多个不同的应用程序,甚至不同的操作系统。
这样一来,学校就可以节省地面空间,不必再为扩建资金不足而发愁了,因为现在根本没必要扩建了。Antonowicz介绍说,他们的虚拟化项目只用了20万美元-----仅仅是扩建成本的十分之一,其中15万美元用来购买了16台惠普刀片服务器,其余的5万美金用于VMware虚拟化软件。
两年半后,2006年,Bowdoin学院70%的应用程序是运行在虚拟机上的。如果不采用虚拟化技术,Antonowicz预计共需要101物理服务器。但通过采用虚拟化,学校只有46台服务器,包括16台刀片服务器。这46台服务器当中,有10台在运行VMware ESX软件。 Antonowicz称,虚拟化技术帮助他们节省了约60台服务器,避免了新数据中心的建设。除了省下购买新服务器的费用,虚拟化还间接的带来了电力、冷却、额外备份成本的支出等等。 Antonowicz把这些成本形象的比喻成了滚雪球,“如果把后续运维成本都考虑进去,200万美元可能还是保守数字。
CIO和董事会的评价
该学院的CIO Mitchell Davis表示,通过虚拟化节约了很大一部分扩建资金,学校领导改变了他们对IT部门的看法,而且这个项目还改变了IT部门在学校的作用。
该学院董事会非常欣喜的看到Davis要求的预算正在逐年减少,同时大家对IT部门的满意度又有大幅提升。 2003年,IT预算占学院总预算的8%;第二年,这个数字下降到7%,第三年再次下降至6%。相比之下,该部门在学校的支持率已经从2003年的10%提至2004年的35%,而到2005年则高达95%。
Bowdoin学院院长Barry Mills称,“Mitch彻底改变了人们对IT部门的看法,“这些项目树立了信誉、建立了大家对它们的信任。我认为IT部门真正建立信誉是在实际使用的过程用,拿我们学校来说,一个教授在课堂上能够获得他授课需要的IT支持,这些IT技术能够正常工作,一旦发生问题能迅速解决并重新运转起来,授课可以不间断的进行下去。
Mills还指出,当董事会成员看到服务器整合项目落到实处,以及对财务、人力资源服务变化时,董事会对IT部门的信心大幅上升,“看到改进使得董事会对IT部门更有信心,他们更愿意拨出钱来进行IT建设。
虚拟化改变了大家对IT部门的认识
曾在斯坦福大学工作过的CIO Davis介绍说:“随着系统的改变,我们的文化也在变。Davis和他的团队有少花钱多办事的本事。学校各个部门开会都会邀请IT部门参加,因为它已经成为各部门运转的基础。然而最开始,情况并非如此。当Davis刚开始在这里担任CIO的时候,他发现了一个沮丧的事实------IT部门并没有得到其他部门的信任。 IT部门有责任保证业务与数据的正常运行,但是IT部门却缺乏应有的权利。比如,一些学院、图书馆拥有自己的技术人员,一些服务器就放在他们的办公桌下而不是在数据中心。
但是,随着时间的推移情况慢慢发生了变化。首先,Davis接管了所有的IT采购,并逐步加强监督。他带领他的IT人员以短跑选手的速度工作着。他上任后仅仅几个月,开始进行校园网改造,用千兆以太网取代了原来的10/100兆以太网络。到2006年,他们共有1.3万个千兆以太网端口和250台交换机。
董事会认为,Davis和他的IT团队真正了解学校的使命,包括学院的业务和教育工作。而且他们也明白,IT部门推行的技术是为了帮助学校更好的完成使命的。在IT部门的带动下,多个IT项目上马。他们坐下来与教师认真讨论教学的方式。 校长Mills说“我们把IT人作为我们团队的一部分,而不认为他们只是坐在角落的IT爱好者------这是思想上的改变。
为什么虚拟化
系统管理员Antonowicz表示,决定采用虚拟服务器是思维方式的巨大变化,因为虚拟化对所有人来说是一项全新的技术。
Antonowicz 说,“当时的决定是在我们数据中心机房资源很紧张的情况下做出的。当时我们无法添加新服务器,如果增加那么就必须得改变电力系统、冷却系统和KVM。而且地板空间也接近极限了。
他说,走向虚拟化的另一个原因是:软件支持遇到了问题。软件厂商看到他们的软件产品和其他应用跑在同一台硬件设备,就不愿意提供服务支持。 Antonowicz称,“我们就想通过虚拟化硬件基础设施,创建多个可独立安装在一个物理节点上的虚拟服务器。
Antonowicz开始在Virtual Iron软件公司的开源Xen、微软的Virtual Server、SWsoft公司的Virtuozzo软件,和VMware公司的ESX Server中寻找答案。“我们最后选定了VMware的ESX,因为它能够虚拟化我们的Intel硬件平台。其他产品支持的操作系统或管理工具不够广泛。在单台ESX服务器上,我们可以运行5个虚拟服务器。Windows 2000,Windows 2003,Windows XP,Linux和Sun Solaris-------所有都可以在同一物理硬件上运行。
对于容灾的帮助
不过,找到合适的虚拟软件仅是个开始,还有很多事需要慎重考量。
Antonowicz想知道VMware是否足够稳定,是否可以放心的在生产系统中使用。“这是一个全新的尝试,我们对此没什么经验,我们想知道虚拟化后,在日常的生产压力下,系统的可靠性、备份、数据恢复、灾难恢复、容错性能如何? 不过这些问题并没有困扰他太久。
Bowdoin有服务器出现故障,一直查不出原因,Antonowicz试着测试了虚拟服务器。他发现,虚拟化软件工具能够帮助快速轻松地让虚拟机从某台物理服务器迁到不同的物理服务器,而且并不需要中断业务,也不会造成数据丢失或停机。 Antonowicz 告诉CIO Mitch Davis:“我们需要购买这个!我们需要启动并运行它。这是一大进步。
在之后的3个月里,Antonowicz和他的IT团队换掉了四到五台需升级的基于英特尔芯片的惠普服务器。而性能并没有受到影响,事实上,Antonowicz称,增加了处理器和内存后,性能得到了改善。
虚拟化之后
Bowdoin学院已经开始依赖虚拟化了。大部分应用程序,从Windows、SQL、Apache Web服务器,管理程序包、重要的财务应用,都跑在一个虚拟基础架构上。 Antonowicz介绍,一台物理服务器通常会运行7个虚拟服务器。但是,虚拟化会给数据中心带来一些其他意料之外的影响。
管理程序设计过程中的安全隐患会传染同台物理主机上的虚拟机。Antonowicz表示:“这是有可能发生的,入侵者或者安全漏洞会在虚拟机之间来回捣乱,但是我们将它们看做是开发过程中的必须面对的问题。我们用隔离虚拟机的方式来提供安全性, 通过在资源集群里隔绝虚拟机来尽量回避这样的问题,这主要依赖应用程序或者虚拟机信息的敏感程度。
虚拟机成倍增长,应对补丁更新负担。Antonowicz介绍,当服务器成倍增长已经超出控制之时,要及时增加补丁服务器的数量。过去他们会将40台服务器作为补丁,但是2008年,用于安全保障的补丁服务器数量已经超过了80台。他希望将来能有一款工具能更好的实现该过程的自动化。Antonowicz表示: "在没有任何物理约束的情况下,虚拟机的增长速度不断加快。在我们创建更多虚拟机之前,我需要了解更多关于补丁自动化的信息"。