Stratus(美国容错技术公司),一家成立于上世纪八十年代的老牌服务器厂商,但对于中国市场的很多用户来说,相比较于IBM、惠普、戴尔而言,Stratus却显得低调神秘很多。大家对于Stratus所力推的容错服务器也接触不多。
说到关键业务系统的可靠性,经常用到所谓4个9或者5个9,也就是99.99%与99.999%。那么,4个9或者5个9的差距有多大,差距是0.009%,还不到0.01%。但对于系统而言,恰恰是这不到0.01%的差距,决定了系统完全不在一个档次上。
在功能定位上,x86被定位于通用服务器,安腾被定位在关键业务应用服务器。如果进一步细分,x86又可分为单路、双路和多路服务器,对应英特尔的处理器是3000、5000和7000系列。其中,采用5000系列处理器的双路服务器是市场的主流,应用在大多数的应用场合,其价格也比较便宜,在万元左右。与之相比,采用7000系列处理器的多路服务器,价格要高出很多,被定位在高端应用,对可靠性有很高的要求的应用场合。
在医疗行业,三甲医院在信息技术人员配备方面通常要好一些,人多一些,技术水平也好一些,这些用户在选择系统平台方案时,会倾向选择双机集群的方案,以彰显技术实力。因为 双机集群系统的维护,没有一定经验和技术实力,将会很难应对系统的突发事件。
在信息技术日新月异的今天,医疗机构越来越依赖信息系统来开展业务,对于门诊、临床等关键业务应用而言,提供7×24×365连续运营至关重要。目前大多数医院所采用双机热备、集群服务器在可靠性方面存在着不小的安全隐患,加之不少医院专业人员有限,在这种情况下,具有更高安全级别的容错服务器解决方案更加备受关注。
作为上海易可思复高数码科技有限公司系统集成部的总经理,汪国亮经常为医院的用户设计各种解决方案,在上海医疗软件领域占有较高的是市场份额。
信息技术复杂性使得用户在选型中常常难以抉择,对于核心系统选型用户经常面临着三选一,甚至四选一的难题。选择大型机、小型机,还是选择IA架构服务器并不是一个简单的结论。
容错系统特有的ASIC故障检测系统将对CPU、 内存、 芯片组、磁盘、 I/O 等部件的处理结果进行比对,相同执行下一步,不相同则从新计算。容错系统不仅可有效应对硬件故障,还可以避免各种不可预知的因素,如电磁干扰、尖峰脉冲等对可靠性的影响,避免潜在的计算错误所导致的风险。
有些CIO清楚容错系统较之集群具有更高可靠性,但让CIO为难的是应该如何说服CEO,事情明摆着:一台容错服务器20多万元,集群服务器一台2万元左右,2台不过是4万多元,要说服CEO并不容易。CEO可以不选择最好的方案,但一定要让CEO意识到可能存在的风险。
对于一个信息系统,特别是关键业务系统而言,可靠性非常重要。有数据统计显示,金融信息系统每小时的停机代价是250万美元,制造业最少也要2.8万美元。这还仅仅是2000年的统计结果,如今企业对信息系统的依赖程度更高,停机所造成的损失也就更大。
有些CIO清楚容错系统较之集群具有更高可靠性,但让CIO为难的是应该如何说服CEO,事情明摆着:一台容错服务器20多万元,集群服务器一台2万元左右,2台不过是4万多元,要说服CEO并不容易。
整个水调度系统分两大部分。一部分是以SCADA系统为中心,集成了管网地理信息系统、动态仿真系统、专家调度决策系统、视频调度系统、语音调度系统和调度管理自动化系统的调度自动化系统。另一部分是包含了生产管理与办公自动化系统、WEB系统的管理信息化系统。
美国Stratus公司所提供的ftSSS远程监控系统服务是技术人员看好的另外一个特性。通过全球主动服务网络ASN的接入,Stratus 24/7对ftServer的硬件参数进行监控,可以及时发现潜在的问题。不待故障发作,消除问题于无形。用户可以根据情况选择是否采用远程监控系统服务。
随着云计算蓬勃发展,系统硬件似乎变得不重要。应用构建在云基础之上,不用更多关注具体硬件产品和型号,云计算屏蔽了硬件系统的复杂性。真的是这样吗?
在一台容错服务器内部有超过 500个故障检测点,随时都有可能发出错误报警和通知。这些故障中,有处理器、芯片组、内存寻址、字节和电源错误,也有内部总线协议、CRC、ECC、系统时钟、系统服务和散热系统错误等
为什么需要采用双机冗余方案?道理很简单,该系统不容丝毫闪失,需要系统7×24小时不中断服务,追求系统的高可靠性。
IT已经告别百花齐放、万马奔腾的时代。曾几何时,王安、DEC、Compaq、SUN、SGI等这些响当当的企业已经淡出了视野。但是很奇怪,Stratus,这个容错机的代表,仍然好好的活着。从1980年Stratus诞生至今,几十年过去了,没有大红大紫,但容错服务器始终活跃。
采用虚拟机Fault Tolerance方案,还需要容错服务器吗?从原理上看,容错服务器的处理器、内存以及I/O全部是冗余设计,通过锁步技术,对软件每一个进程的计算结果进行比对,结果一致才确信处理的正确性,可以有效解决可能的硬件故障。
对于国内用户为什么不选择容错机,很重要的一个理由就是价格贵,资金预算有限。目前容错机的价格大体分为高中低档,价格为60万、40万和20万不等。这相当于多路服务器的报价,较之双路服务器高出很多。在这种情况下,用户常常选择双机冗余方案来提升可靠性。