什么是最大、最快的局域网交换机?这其实是一个有着很多复杂答案的问题,而答案就取决于你如何定义“大”和“快”。
3Com、Extreme、Force10、Foundry、惠普ProCurve和思科等以太网交换机厂商为谁具有最高性能、最大密度和最小时延而争斗不休。然而,目前这些厂商所提供的产品技术,平均来看都已经有3年的历史了。同时,Woven Systems和Raptor Networks等一群饥饿的新兴厂商,正向着如何建造“最大的”以太网交换机发起新的挑战。他们采取的方式不同于单台大型机箱的方式,而更像是群集式超级计算技术或InfiniBand网络拓扑结构。
高性能体现在多方面
以太网的速度受到当前802.3ae标准(速度为10Gbps)的限制,因此可以推测,没有一个独立端口的速度超过万兆。其他一些衡量交换机性能的方法是根据交换机结构的带宽,以及机箱支持的端口密度。此外,端口本身的性能、时延和抖动都是交换机性能中的要素。
Network Test公司总裁、《Network World》测试联盟成员David Newman说:“所有人都提到每端口线速。那么,现在问题就变成了在出现丢包之前你能在多少个端口上达到线速。”根据已公布的设备规格,最大的企业级核心交换机包括Force10的E1200、Foundry的RX系列、思科的Catalyst 6500和Extreme的BlackDiamond。在比较这些规格参数时,Foundry的RX-16交换机是容量最高的交换机,它能以全速度运行64个万兆以太网端口,在超量配置(即所有端口上的总带宽超过交换机的容量)的一台机箱中共有多达192个万兆端口。Force10的E1200 TeraScale交换机可运行56个万兆端口,或者超量配置时的224个万兆端口。Extreme的BlackDiamond 10808机箱可支持48个无阻塞万兆端口。而思科的Catalyst 6513可处理以全双工运行的32条万兆以太网连接。
有些人认为,与厂商如何划分每个插槽和总系统的带宽相比,交换机如何处理全速运行时的抖动和丢包率等变量并不十分重要。Newman说:“我认为比吞吐量更有用的指标是时延。在这方面,思科显然是最好的。”他曾经测量过一台思科 Catalyst 4948设备,在万兆速度时的时延约为3微秒。Newman表示:“这是我所测量过的设备中最低的时延。Force10的时延通常比思科交换机高数百倍,这意味着数千个数据包没有处理。但他们已经逐渐解决了这个问题。”
美国能源部设在加州Berkeley市的研究实验室—Lawrence Berkeley国家实验室(LBNL)在数据中心和局域网核心同时使用了Force10和思科的交换机。实验室LBLnet服务部高级网络工程师Mike Bennett表示,具体指出这两种产品哪一种“更快”或“性能更好”十分困难,因为这些交换机处在不同的应用当中。Bennett说:“我测试过配置两个万兆端口的6500和E1200交换机,它们都没有发生过载,也没有出现丢包。因此,并不能简单地说一种交换机比另一种更快,它们还要像广告中所说的那样有效运转才行。”
下一代架构的研究
在Berkeley市另一端的Lawrence Livermore国家实验室中,网络小组正在研究使以太网达到存储区网络中的带宽和时延水平的下一代交换机架构。
该实验室网络部负责人Dave Wiltzius说:“下一代设备的所有性能都将提高一个数量级,所有东西都将是万兆的。因此我们要寻找一种可以提供2000多个万兆端口的交换机或交换机结构。实际上我们对使用胖树形拓扑结构和类似这样的东西创建融合的交换机环境感爱好。”
Wiltzius设想的胖树形拓扑结构涉及一种Mesh(网状网络)无阻塞交换架构。这种架构有点像传统的公共电话网,其中交换机都是通过多条路径互联在一起、并具有若干连接端口的简单设备。重要的是它们可以有效地利用带宽。而以太网还没能做到这点,或者说做得不是非常好。
Wiltzius已经在利用端口聚集或二层“散列”的技术来实现这种胖树形效果了,也就是将多条千兆或万兆以太网链路捆绑在一个更大的虚拟管道上。将交换机利用散列的以太网管道连接在一起(或将服务器连接在交换机上),可以带来更大的虚拟吞吐量,但这种连接仅局限于8个端口(即8条散列的万兆链路最多提供80Gbps吞吐量)。这种方法采用的是一种在捆绑的连接上随机传送数据包的算法。由于算法的随机性,利用散列技术,用户将得到一种不平均的分布,不一定能提供最佳的带宽利用率。
数据中心交换机的突破
Arastra和Woven Systems都是积极寻求交换技术实现突破的新兴厂商。Arastra是Palo Alto市一家私人持股的路由器公司。Woven Systems是Santa Clara市一家处于半秘密状态下开发基于以太网Mesh网络产品的公司。
Woven总裁兼CEO Harry Quackenboss说:“我们正在做的事情是在万兆以太网结构上提供最好的光纤通道或InfiniBand的特性。”Woven采取的方法类似网格或分布式群集计算技术。在这种技术中,对称的多处理器(SMP)服务器被通过网络连接在一起的单/双处理器节点所取代。
Quackenboss说:“同样的事情将发生在数据中心的局域网交换技术上。大型局域网交换机价格昂贵,你可以为数据中心应用购买的最大的无阻塞交换机也只是64端口的Foundry系统。”
Woven正在开发二层千兆和万兆以太网数据中心交换机,这种交换机使用非凡算法,能够以某种方式模拟InfiniBand或光纤通道网络。在这种结构中,交换机之间可以建立多条路径。由于传输流通道不被关闭(类似基于生成树的以太网),带宽可以更加动态地分配到这些路径上。
Quackenboss说:“假如你想建立一个由两台以上交换机构成的网络,可以使用链路汇聚或中继技术将以太网网段捆绑在一起。但是假如你想将三台或更多的交换机放在网络中,其中一台交换机就会成为瓶颈。”三层交换技术以及OSPF(开放最短路径优先)和ECMP(等价多路径路由)等协议,可被用于创建多路径网络,但这些方法也增加了成本。根据IDC的调查,三层交换机端口的平均成本是二层端口的5倍。
此外,将数据中心的连接变为多路径二层以太网,可以帮助治理人员动态地重新配置应用和服务器而不用实际召回它们。这种想法有点类似于运营级设备制造商正在开发的二层城域以太网技术。
用Mesh虚拟大型交换机
另一家已经推出产品的公司是有着三年历史的Raptor Networks,这家公司生产相互连接在一起组成Mesh结构的固定配置千兆和万兆以太网交换机。Raptor没有将焦点放在高密度数据中心上,而是针对局域骨干网和配线间传输流的聚集。公司CEO Tom Wittenschlager说:“我们创造了在二层上提供非凡功能的能力,这些功能其他公司只能在三层上提供。”
Raptor交换机配置有24个千兆端口和6个万兆以太网端口,具有160Gbps的总交换带宽。这种单机箱交换机支持二至四层交换,并采用一种专有的修改版万兆以太网技术。这种以太网技术使得设备无须使用生成树协议,就可以在二层上连接在一起组成多路径Mesh网络。
这些交换机利用Raptor自适应交换技术(RAST)连接起来。RAST是一种以特定方式将交换机连接起来的协议,这种方式类似于将机箱式交换机中的模块连接在背板或交换机结构中。Wittenschlager列举了公司内部的测试数据:在由4台Raptor交换机组成的Mesh网络中将1个数据包输入输出万兆以太网端口8次,得到的传输时延结果为6.48微秒。他说:“每台Raptor交换机就像是模块中的刀片那样,使传输流以低时延非常快地在交换机之间传送。为了做到这点,Raptor将路由信息插入到标准以太网帧中未使用的报头空间里,这些信息使得交换机心跳和路由路径数据在群集当中的交换机之间往返传递。”
此外,Raptor还开发了物理上分离的交换机在公共背板上通信的能力,就似乎它们全都在同一台机箱里一样。这实际上是一种虚拟交换机,当利用单模长距离光纤上的万兆以太网进行连接时,交换机相互之间的距离可以达到80公里之远。Wittenschlager介绍说,连接在万兆或千兆端口上的非Raptor交换机,则将其看作是一台独立的大型局域网交换机,无须额外的配置就可以像简单的以太网那样连接。
最近,一个由4台Raptor交换机组成的Mesh网络取代了L.A. Care公司网络中的两台Catalyst 6509交换机构成的核心网。这些Raptor交换机被用来将公司的扁平二层局域网分隔为VLAN子网,同时核心网络为万兆以太网,3条万兆以太网管道连接Mesh网络中的每台设备。而Catalyst交换机则被转移到局域网边缘,用来连接公司的350个最终用户和其他设备。
L.A. Care公司IT与安全经理Rayne Johnson说:“在解决了基于IOS的思科路由器与基于RAST的Raptor交换机之间最初产生的一些生成树回路问题后,网络运行变得既平稳又快速。”另外,Raptor的产品安装费用在18万美元左右,而思科向Johnson的报价是50万美元,用于通过万兆以太网和VLAN功能升级核心网络。Johnson说,“我通常不让自己卷入那些刚刚开发出来的产品当中。这在某种程度上是值得的,因为你无法抵御价格的诱惑。”