发布时间:2014-06-15 21:56:45
一般ops的团队都有数人,每人分工和工作侧重方向不同,可能出现某人改了线上应用的关键配置,但由于信息传递不对称,其他人不知道这个变化。这个情况很常见,即便有了wiki/jira来track,但由于人的疏忽没留意这个。万一某天该同事休假,而这个变动刚好导致了故障发生,其他人不了解变化,可能导致故障.........【阅读全文】
发布时间:2014-06-07 11:16:31
几年前也维护过squid, N久不接触东西都忘光了。翻了之前的东西,记录如下 squid自己维护的cache存放系统有aufs/coss等,这个有不同的适用场景。比如aufs把文件存放在随机字符串为名字的文件夹上/datadir/000/000/0001(类似)上,当cache object是大量小文件的时候,每次都要open/fstat.........【阅读全文】
发布时间:2014-06-07 10:58:40
看书看到的这个,随便记录一下,似乎gearman非常简单,当然从ops的视角来看,安装和调用都非常简单了。 client--->job -->worker.具体google看的更多,client发起请求,然后job做调度给worker来做处理。比如要实时统计access log,可以在每个web上统计,然后用gearman 汇总。比传统的awk 'xxx' ac.........【阅读全文】
发布时间:2014-06-07 10:51:47
当然OS和application的可以用rsyslog,但其缺点也不言而喻,UDP可能会导致丢数据,此外无法保留元数据信息,比如用户的ip/uid/fid等(后续还用这些做进一步处理等)。那么消息队列似乎更有优势,MemcacheQ,redis,qpid等。就ops来说redis应该是最简单的,publish/subsribe。一个发,一个订阅。 #redis-cli pub.........【阅读全文】
发布时间:2014-06-07 10:31:58
1. ifconifg 看丢包率,ethtool看是否是duplex 和speed(遇到过网线质量差和intel 网卡驱动导致丢包和半双工,100Mbps)2. w/uptime看load, 不要超过cpu cores。3. df -h 看inode,假如ext3这种非动态变化inode的文件系统,对于大量小文件的,要注意inode会塞满了,建议用resizefs。4. vmstat 里si/so不为0即可,就说.........【阅读全文】