全部博文(287)
分类: 系统运维
2012-04-17 11:32:25
问:如何自动检测系统活动作业出错卡死(MSGW,LOCKW),并自动处理恢复正常?
答:用QAPI编程,把MSGW,LOCKW分别按msg类型写到一个pf的log中。
对MSGW,用qapi读出相应msg数据第四类msg结构信息,在绿屏上进行显示,或用报文交换至前端界面。
对LOCKW,用qapi读出相应的jobid和job number,并把锁表文件由下至上列写到pf的log中,以便快速查询。
对这个msg的解决办法,首先要有深度地掌握400平台os400运行机制和qapi编程,并且对os400系统管理有深度的认识,才能解决你的提问。我想了一下,这两个msg可以自动回答代替wait。当然,要用到pf的锁表60秒的时间,和表数据回滚,这样可以解决job间的相互锁表,以解决这两类msg的出现。当然,如果应用系统架构本身存在问题,即使用编程手段可以一时解决这两类问题,但是,在释放这两类msg信息后,运行环境中,在os400下还会频繁出现这两类msg信息。