java线上排查总结-yaofangzjl-ChinaUnix博客

技术小吧pythontb.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

yaofangzjl

博客访问： 465263
博文数量： 97
博客积分： 1552
博客等级：上尉
技术积分： 1091
用户组：普通用户
注册时间： 2012-05-17 17:05

个人简介

专注于大规模运维场景运维工具解决方案。欢迎有这方面兴趣的朋友跟我联系。

文章分类

全部博文（97）

Java领域（6）

新技术（0）

经验总结（2）

Java基础（4）

分布式Job（0）
操作系统（3）

linux（3）

win系统（0）
领域学习（5）

运维领域（2）

业界新闻（0）

实时分析（0）

NIO编程（0）

分布式编程（0）

算法（2）
编程（12）

QA（1）

bash（3）

js&nodejs（0）

erlang（1）

php（7）
工具（1）
笔记（6）

淘系技术（0）

读书笔记（1）
程序思想（5）
运维（16）

应用配置（0）

IDC（0）

负载均衡（1）

PE（2）

自动化（0）

运维平台（4）

安全（0）

SCM（0）

业务（0）

ops（5）

网络（0）

DBA（4）
架构（1）

服务框架（1）

调优（0）
Python探索（13）

整理（3）

研究领域：高性能（1）

编码技巧（1）

代码（0）

django（0）
未分配的博文（29）

文章存档

2014年（12）

2013年（25）

2012年（60）

我的朋友

相关博文

java线上排查总结

分类： Java

2013-05-14 21:58:23

线上有一个功能，只要用户一使用马上FGC飚的很高而且一直不能回收内存。
利用这个case来总结一下线上如何来排查问题找到代码BUG并修复的。

$获取java进程的id
Jboss 用 jps |awk '{if($2=="Main"){print $1}}'
Jetty 用 jps |awk '{if($2=="start.jar"){print $1}}'
也jps -l

$java heap dump日志分析：一般分析内存溢出分析哪些应用占用内存比较多情况有用
jmap -dump:format=b,file=path pid 默认将堆全部dump下来
jmap -dump:live,format=b,file=path pid 只dump还存活的没gc掉的对象
如果发现fgc不直不掉的话就需要用这个来dump一把,打开的软件Eclipse Mat

$jstat -gcutil pid 动态观察jvm内存使用情况
E eden区，所有新对象在这里面产生。这里面很快就被minor gc
S0 幸存者O区E区gc不掉的会被放进到这个区
S1 幸存者1区
S0区gc剩下的对象进入到这个区
这三个区合起来叫young 区。
O old区经过多次minor gc不掉的会放到这个区。只有fullgc才能回收
一般线上是92%开始full gc
P perm区方法区。如果用了AOP就会有变化一般不会有变化
YGC 从JVM启动到目前minor gc次数
YGCT minor gc所消耗的时间
FCG 如果0区一直gc不掉会不断做gc
FGCT full gc所消耗的时间

jstack 出来的日志分析
1,死锁 Deadlock(重要)
2,等待资源 Waiting on condition (重要)
3,等待获取监视器waiting on monitor entry
4,阻塞Blocked
5,执行中Runnable
6,暂停Suspended
7,对象等待中Object.wait()或TIMED_WAITING
8,停止Parked

"Xmemcached-Reactor-15" prio=10 tid=0x00002aaac15ad000 nid=0x2256 runnable [0x0000000043077000]
java.lang.Thread.State: RUNNABLE

"Xmemcached-Reactor-15" 线程名称。用户自己的程序最好是线程名称
prio=10 线程优先级默认是5
tid=0x00002aaac15ad000 唯一标识
0x2256 对应系统线程的id和top出来看到的pid是对应的（十进制转16进制）
RUNNABLE线程状态

介绍几个常用的命令

top -H -P $PID 动态的看到java线程的消耗情况
top -H -b -n 1 -p $PID 打印一次java线程情况
jstack $pid 打印当前运行的java线程栈信息（建议打印2，3次）
jmsp -dump:format=b,file=./heap.dump.bin $pid
dump java的堆栈信息，会影响线上的性能。最好是从VIP中摘除

---------------------------------------------------------------JVM crash-----------------------------------------------------
Jvm crash时会在工作目录下产生一个日志文件，也可以通过参数指定。如-XX:ErrorFile=/home/admin/hs_error_%p.log
导致crash的原因有多种：
1、Jvm本身的Bug
2、应用程序有bug
什么情况不会生成error文件？
linux内核在发生OOM的时候会强制kill一些进程，可以在/var/log/messages中查找，也可以在/var/log/kern中看到。

----线上堆栈dump(dump.sh)在故障发生时执行。

1. 看JVM内存使用情况
jstat -gcutil pid <毫秒数> 动态的观察jvm内存各区情况
主要看下FGC与YGC的使用情况!
jstack $pid > log

阅读(2539) | 评论(0) | 转发(0) |

上一篇：服务器TCP连接的状态与并发性的探究

下一篇：linux安装Python相关包汇总

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6