宾夕法尼亚州立大学使用信息技术服务部( ITS )的教学服务和新兴技术( ASET )设计、开发和经营信息技术设施以支持教师、学生、研究人员在教学、学习和研究领域的工作。在ASET/ITS,高性能计算( HPC )帮助研究人员通过在校园的中央实验室开发和维护几个先进的计算集群,帮助研究人员计算和管理数据。高性能计算组的最新集群-LION-XO-为学生和教师提供成三低、多用途的并行计算周期。为了使80节点集群互连,高性能计算组需要Force10 E600交换机/路由器的可预见性能、无阻塞性能和可靠性能。
据高性能计算和可视化集团主任Vijay Agarwal介绍,宾州州立大学在使用成本低、高性能、可扩展性的集群模式之前,依靠大型的计算机来处理研究应用的要求。该集团的四个集群利用一些先进计算机的合并计算能力来为几个学科编程语言、数字图书馆、统计软件包和计算代码。该小组帮助研究人员优化代码和并行代码。集群还连接世界上其它高性能系统进行数据以共享和解决更尖端的问题。
最新的集群--LION-XO,目前有80个计算节点,预计将增长到160个。该系统有基于80 Opteron处理器的Sun Microsystems SunFire服务器,每个配有8千兆随机存取存储器( RAM )和73千兆字节的Ultra SCSI磁盘存储。为更好地满足用户的应用要求,高性能计算组配置了两个互连交换机:一个是Infinicon Systems' Infiniband交换机,另一个是Force10 E600千兆以太网交换机。

以往,高性能计算组配置昂贵的专有交换结构,以规避与以太网技术有关的潜在问题。然而,随着成本日益成为一个关注的问题,千兆以太网成为一个最具吸引力的替代品,因为其是无延迟性的网路应用软件。
“千兆以太网的成本/性能上的优势对于专属性解决方案是非常重要的,其已成为需要高吞吐量但能维持少量延迟时间的应用软件的替代品,且成本较低。” 阿嘎瓦拉说 。“在许多情况下,千兆以太网的性能优势可让我们更好地利用我们的资源。”
阿嘎瓦拉说,通常情况下,计算集群当时只被利用20%至30%。但是,该集团的集群,利用率超过90%,因此可以说,互连交换机是非常可靠的。
使用率如此地高,且200多名学生和教职员工依靠集群为一种资源,任何意外停机可能是灾难性的,且代价昂贵的,会丢失数据造成研究延迟。每次当研究费用增加时,可靠性能和高利用率为HPC节省了很多的经费,节省的费用可应用于其他科研项目。

宾州州立大学高性能计算和可视化小组的意图是提供一个世界级一流的网络,使学生和教员能够利用尖端技术进行研究。为了满足这一目标,该小组要求其集群基础设施提供不仅无阻塞吞吐量、可扩展性和端口密度,而且还提供高度的可靠性,支持近百分之百的利用率次。 Force10 E600具备全部这些性能。
对于LION-XO集群,我们要求千兆以太网成为一个可扩展和高度可用的互连技术基础设施的核心,很多解决方案不尽合适, ” 阿嘎瓦拉说。“然而,Force10 E600符合我们的每一个严格要求,这证明我们确实可以利用千兆以太网的成本优势而不损害我们集群的性能或可用性。 ”
对于高性能和可视化小组, Force10 E600的可靠性是决定性的因素。随着互连交换机/路由器在LION-XO集群的应用,无论出于何种原因E600应用率减少,整个集群应用率也将大大减少,这会妨碍学院200名学生或教师利用网络的处理能力来进行世界一流的研究工作。
“有关最大化网络正常运行时间,Force10 E-Series在几方面都具有高可信度,基本上确保它在我们的集群绝不是故障点, ” 阿嘎瓦拉说。“卓越的可扩展性和弹性支持我们对时间的高利用率,其无阻塞吞吐始终确保达到最高的效能。 ”
Force10 E600采用了完全分布式体系结构,分别行驶交换、路由和管理功能。每个功能都有受到保护的内存和处理能力,E600确保即使在面临拒绝服务攻击时也有可预测的性能。所有关键部件(包括交换结构、电源供应器和路由处理器模块)和Force10的无缝容错技术确保在发生故障零数据包丢失时Force10 E600继续转发容量。
LION-XO集群最初拥有80个节点,高性能计算组预计在不久的将来将这个数字扩增一倍。为了避免昂贵的铲车式升级为集群扩展, 阿嘎瓦拉需要高密度的Force10 E600来建立一个适应处理能力增加的千兆以太网基础设施。
“过去,我们最大的集群已达到176个节点,其中Force10 E-系列远远超出这个数字, ” 阿嘎瓦拉说 。“Force10 E-Series的密度优势让我们坚信我们能继续以更大的处理能力建立新的高性能集群。
为进行尖端研究,宾州州立大学高性能计算组需要一个高性能的网络。Force10 E600提供了所需的性能、可靠性和可扩展性,使小组在最先进的集群内配置千兆以太网。