一、建立运维规则,强化制度管理
据统计,IT运维中90%以上的工作都属于日常管理工作。应对这些工作的最好办法也就是设立有效的规章制度。尽可能地把日常的所有工作都纳入制度中,以制度去约束日常地运维行为。
二、培养运维人员的经验,应对突发事件
由于IT系统的日益复杂,运维中除了日常管理工作外,运维人员将不可避免地扮演“救火队员”的角色,处理系统的突发故障。此时工程师的运维经验就显得十分重要。因此,工作中除了要应对日常事件外,还需要工程师尽可能地拓宽技术视野,进行技术储备,达到增加运维经验的目的。
三、不断将经验转化为规则
由于“经验”更多地是建立在运维人员个人工作经历上的,并且鲜有文字的记录,因此,系统的稳定运行不可避免的对某些关键运维人员产生了强烈的依赖。如果一旦此人离开工作岗位,后果将不堪设想。最好的办法是把这些经验进行总结,逐渐归纳成文字保存,并在适当的时候加入到规则中,这样后人在学习规则的时候也就间接具有了这种经验。
对于IT运维而言,“规则”与“经验”均具有十分重要的意义。“规则”是我们系统得以“长治久安”的基础,而“经验”可以在应对突发事件中起到“奇兵”之效果。如果在实践中,我们能够不断将一些有益的“经验”融入到制度中,逐步转化为“规则”,那么就能更好地达到不断完善规则、强化管理的目的。