|
硬件的考虑
在你决定使用何种系统管理方案之后,剩下要如何增强服务器的稳定性就更简单了。现在你只需考虑硬件和应用上的问题。
让我们从电源问题开始讲起吧。任何一个服务器都宣称:因为配备了有备用或热插拔的电源供应器而使得稳定性和可用性的级别上大幅提升。然而,我拜访过许多企业,他们都把备份电源供应器插入同一个UPS
(不间断供电系统)上(注释4),你们应该花点时间想想电力在你的服务器上是如何运转的。如果可能,应该将每个备份电源系统使用独立的电路。我们都听说过有些系统监管员仅为了预留吸尘器的插座而将重要设备的插头拔下。我不懂为什么要甘冒服务器当机的危险而做这么愚蠢的事?
内存的故障会迅速地毁坏服务器。大部份的服务器制造商都提供有各种类型的内存保护功能预防任何因soft
error导致的服务器故障,而且额外增加的错误更正码
(Error-Correcting Code,ECC)内存可以防止因部份hard
error而致使整个内存模块
(DIMM)得损坏。(所谓
soft error通常发生在电压骤增而产生的故障,这种情况在内存功能重新更新之后就可以正常运转;而hard
error则是内存坏掉必须更换)。像Compaq等厂商,因为有高级的ECC内存,可提供进一步的内存防护措施避免产生hard
error。IBM
的Chipkill技术,与系统主板相结合,让你可使用非专用的内存来预防任何hard
error产生(注释5)。
系统管理员最常碰到的硬件问题可能就是硬盘故障。你可能常常听到如下的建议,而这些建议真得是值得你一听再听的:使用一些有容错能力的硬件。不管是Win2K或是NT都能让你运用软件来实现RAID功能,然而硬件RAID通常较可靠且性能较好。硬件RAID提供较佳的配置选择,也能让你更详细地掌控和管理磁盘驱动器(注释6)。
你一定要小心谨慎地配置你的计算机系统。查看一下你系统分区与数据分区在RAID上的分布。尽管大型企业的系统管理员已相当熟悉如何优化其RAID配置,但是一些小型企业仍倾向避免更改原厂对硬盘组的设置。
从最近和小型网络IT工作者的讨论中,我得到一些惊人的发现。在许多案例中,这些小型企业的RAID5只有3块硬盘,且放在同一个SCSI接口上,在本质上这就如同把所有的蛋放在同一个篮子里一样危险。更令人惊讶的是,这些企业竟然将系统分区与数据分区同时放在这些硬盘上。而许多系统管理员不了解实际上
RAID 5 会使性能降低
(和其他数据区隔技术比较而言)。而且,因为他们的暂存交换文件及系统分区与其数据文件都共享相同的磁盘,这样将面临到不必要的性能问题。
如果可能的话,请在RAID
5磁盘阵列上使用3块以上的硬盘,不要将你的数据文件及系统分区放在相同的硬盘上,并且充分利用服务器系统制造商所提供的多通道
SCSI 控制器。(注释7)依目前的
SCSI 技术,你可使用不同速度的
SCSI 设备,而使得每个设备上达到最佳的性能。所以,你必须随时让
RAID上热插拔插槽放满硬盘,而且确定有备份硬盘可让你随时作更换。对于从未服务过用户的系统管理员,当使用以RAID
5建构的服务器,他们经常被RAID
5的一句承诺:“绝对不当机”所蒙蔽。的确,系统仍可运转,但是你不想让系统在硬盘坏掉未完全恢复之前工作量太重吧。
你也可考虑使用外接式的设备。即使是一个小公司也可从外接式磁盘驱动器组中获益。在你恰当的设置外接式磁盘驱动器组之后,它就不太可能成为你机器的单一故障点。外接式磁盘驱动器组能够简单的插入服务器,这样大部份的数据不在主系统机体内,可大大减少当机时间。
另一个你值得考虑的重点则是热插拔
(hot-swap) PCI 卡功能---一个属于最高级服务器特有的功能。(注释8)有相当多的品牌都在卖这种可热插拔的
PCI 卡,它可让你即使在
SCSI
卡及网络卡发生故障的情况下仍能正常运行你的服务器。只有极少数的硬件设备支持这种技术,这主要是因为必须使用特殊的驱动程序使系统能动态地关闭再重新打开PCI。然而,这项功能有其特色,也值得你考虑。
高可用性的优势
一般中小型企业的系统管理员可采取相当多的方法来让服务器运转正常,而不当机,特别是通过精心地挑选及维护服务器的硬件平台。最高级的服务器所提供的标准配备工具已能让你公司重要的数据存取无虞,用不着再花钱投资在更多9的追求上。虽然大型企业级的用户仍追求于高可用性的优势以及投资大笔金钱在能保证可用性达到
99.9% 的系统上(甚至更多的9,例如Win2K
Datacenter服务器),一般在有预算限制的小公司的系统管理员仍然能为公司构建一个高可用性的系统。
【点评】
一个信息系统的完整,硬件设备占有很大的一部份,一个不稳定的硬件平台上的应用程序,怎能期待他有高稳定的表现。文章中提醒系统管理人员,在未来管理购置相关硬设备时兼容性的检查确定将会影响整个信息系统的可用性,查询相关的硬件厂商数据,熟悉硬件产品中所附的相关管理软件及硬件,建立未来维护处理的相关顺序步骤才能拥有高妥善的系统。
【关于作者】
David Chernicoff
是Window 2000杂志的资深技术编辑及实验室主管。他从事编写与计算机相关领域的产品及特色评论已超过
15 年,并且自1992年开始将评论重心摆在Window
NT的产品上。你可上网找到他的网站,网址为david@win2000mag.com。
(注释4)UPS分成在线式On-Line跟离线式Off-Line两种,最近又有厂商推出在线交互式
(LINE INTERACTIVE),尽可能购买在线式的UPS对于系统的稳定才能达到较高的水准,相关的
UPS 数据可以在国内相关的公司网站中得到详细的解答,读者请自行上网查询。
(注释5)不同系统厂商的服务器所使用的内存模块可能会有所不同,而且通常无法在市场上直接购得。应该实际咨询相关的系统厂商或经销商获得必要的信息,避免直接从市场上购买号称兼容的产品,有些系统厂商可能会因为企业自行购买某些硬件之后可能造成的毁损而不负保修责任或必须收取较高的相关维护费用。
(注释6)如果企业的数据是非常重要的,磁盘阵列系统(RAID)的投资将会是非常值得的。目前Windows
NT 4.0及Windows
2000都支持软件的磁盘阵列,可以通过操作系统中的磁盘系统管理工具很方便设置。当然如果企业的系统构建经费足够,硬件的磁盘阵列卡加上高级的高速磁盘驱动器对于系统的高可用性和高反应速度会是极佳的选择。
(注释7)一般较好的系统磁盘规划方式都会建议操作系统跟数据文件最好放在不同的磁盘上,这样磁盘的容错能力及数据的读写效率才能比较好,当然更好的磁盘系统构建可能都会如此规划:操作系统所在的磁盘使用两块硬盘做成镜像(Mirror);数据文件则使用三块以上的硬盘做成RAID
5的磁盘阵列系统,使得数据的读取具备容错功能又能保有不错的读写性能。
(注释8)热插拔功能已经普遍成为较高级服务器必须具备的功能之一,这个功能可以让系统管理员在某些硬件毁损的状况之下可以直接将损坏的设备用好的设备替换(例如硬盘的热插拔功能是大家所普遍认识的一种),而不需将整台服务器电源关闭,所以在做系统维修维护时用户仍然可以继续使用系统的功能。
|