全部博文(465)
分类: IT业界
2011-09-05 17:48:56
IT项目管理之系统部署
对于小型系统而言,一台数据库服务器和几台Web服务器就是系统的全部了。Linux操作系统下的Oracle安装虽然有些困难,总归还是能够完成的,几台Web服务器的安装也不是太大问题。
可对于大中型系统而言,就完全不是一个概念了。要面对的不仅是技术问题,还包括系统整体架构、网络拓扑结构、数据库架构、容量规划、后续维护规划等问题。
首先,该系统包括11台数据库服务器和30台左右的应用服务器,需要进行机器的命名规划、操作系统和数据库安全密码规划、IP规划,这是一个逐步深化和调整的过程,以确保你的部署在真实环境的可用性和可维护性。
其次,Oracle数据库的RAC安装是一个纯技术工作,你需要了解EMC存储设备,需要了解Linux操作系统,需要了解Oracle的安装,需要了解RAC机制,还需要了解数据库的规划、设计和磁盘规划策略,我相信给我一周的学习时间,我能够搞定,但这是5组Oracle RAC+1台单机Oracle。此外,还有20台左右的Web服务器,也是Linux+Resin,还有其他几台服务器用于系统监控和接口服务。差不多用了一个月,在两名专业人员的支持下才完成机器的安装。
再次,是异地部署问题。异地部署的问题在于对可用性、可维护性要求更高。由于网络带宽的限制需要全量数据一次性到位,然后再进行异地的增量数据传输,这是无论采用Oracle何种同步技术都无法解决的,同样也是介于技术层面和业务层面的。为此我们必须在部署前准备几种解决方案,以确保异地部署工作的万无一失。
最后,经过一个多月的努力,终于把机器全部安装完毕,并且打上标签,标注了机器的名称、用途、IP地址,并将它们搬到了电信和网通的IDC机房。在IDC机房又进行了两次部署,而且需要根据机柜和交换机的情况来放置不同的服务器,并做了一个IDC机房部署图,以便在出现网络问题或远程不可控的问题时,通知管理人员使问题得到快速解决。
当然,在系统部署过程中,另外一个重要的环节是系统监控。在宁泰资讯管理平台系统中,我们采用Nagios的开源解决方案,同时运维人员编写了大量的脚本来对磁盘使用率、监控Resin进程、主机负载、监控Oracle、用户连接数和网络连接情况进行监控。后来又增加了预警方案,即当被监控的对象出现宕机时或者在对监控的项目中出现超过Nagios设定的阈值时,便会以短信的方式通知相关负责人以便及时处理。最后又要求运维人员编写《系统维护手册》,这不仅仅是重新梳理整个系统部署的过程,同样也是知识经验的一种总结,而且即使将来发生人员的调整,也可以确保运维工作顺利交接。
对于任何大中型项目而言,系统部署都是自始至终需要考虑的,系统架构决定了系统部署的顺利与否,而系统部署则决定了系统的性能、高可用性和可维护性。
本文选自《IT项目管理那些事》一书
图书详细信息:http://blog.chinaunix.net/space.php?uid=13164110&do=blog&id=2691389