最近有几个task产生report的时候会查询后端的Infobright ,但频繁出现Lost connection xxx ,这种,而且奇怪的是,只有query_time <3600s的SQL不会出现此类问题。于是查看:
1.Load balancer 的idel timeout 是28800s ,明显没问题。
2.firewall的调整,原来peers把firewall规则做了调整,没把对应的ib机器加到pool,导致此类问题。
infobright01 was not part of the rule below which allows for an idle timeout of 9 hours since the default for any tcp session with the firewall is 1 hour.
PS : query time 在1小时,有点可怕,但这个业务是纯BI相关的,在同类业务还属于小Case。
又一例:停电导致的xen的vm里面安装的infobright的brighthouse.seq死活不能写进去数据,但此时user对此文件还有读写权限,这样导致brighthouse引擎无法load,一怒之下,rm -f 该文件,直接重启,没想到好了。
感觉是断电导致该文件异常,四处搜未果,具体原因未知。
还有,dev导入1.3M的SQL到master库上,不知道是不是SQL写的效率有问题,还是database没做索引,导致Slave 大量的delay,因为该SQL主要是insert语句,我当时没关注此事,看来要注意mysql的相应参数调整,以及Insert
的时候用load替代也许更好?
阅读(2556) | 评论(0) | 转发(0) |