- 相關(guān)推薦
Linux系統(tǒng)監(jiān)控要用到哪些命令
Linux系統(tǒng)的命令有很多,今天小編主要大家介紹下Linux系統(tǒng)監(jiān)控命令,如果你對(duì)監(jiān)控命令感興趣或正在學(xué)習(xí)相關(guān)知識(shí)的話,不妨來(lái)了解下。
找到最耗CPU的java線程
ps命令
命令:ps -mp pid -o THREAD,tid,time 或者 ps -Lfp pid
結(jié)果展示:
這個(gè)命令的作用,主要是可以獲取到對(duì)應(yīng)一個(gè)進(jìn)程下的線程的一些信息。 比如你想分析一下一個(gè)java進(jìn)程的一些運(yùn)行瓶頸點(diǎn),可以通過(guò)該命令找到所有當(dāng)前Thread的占用CPU的時(shí)間,也就是這里的最后一列。
比如這里找到了一個(gè)TID : 30834 ,所占用的TIME時(shí)間最高。
通過(guò) printf “%x ” 30834 首先轉(zhuǎn)化成16進(jìn)制, 繼續(xù)通過(guò)jstack命令dump出當(dāng)前的jvm進(jìn)程的堆棧信息。 通過(guò)Grep命令即可以查到對(duì)應(yīng)16進(jìn)制的線程id信息,很快就可以找到對(duì)應(yīng)最耗CPU的代碼快在哪。
簡(jiǎn)單的解釋下,jstack下這一串線程信息內(nèi)容:
Java代碼
“DboServiceProcessor-4-thread-295” daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]
nid : 對(duì)應(yīng)的linux操作系統(tǒng)下的tid,就是前面轉(zhuǎn)化的16進(jìn)制數(shù)字
tid: 這個(gè)應(yīng)該是jvm的jmm內(nèi)存規(guī)范中的唯一地址定位,如果你詳細(xì)分析jvm的一些內(nèi)存數(shù)據(jù)時(shí)用得上,我自己還沒(méi)到那種程度,所以先放下
top命令
命令:top -Hp pid
結(jié)果顯示:
和前面的效果一下,你可以實(shí)時(shí)的跟蹤并獲取指定進(jìn)程中最耗cpu的線程。 再用前面的方法提取到對(duì)應(yīng)的線程堆棧信息。
判斷I/O瓶頸
mpstat命令
命令:mpstat -P ALL 1 1000
結(jié)果顯示:
注意一下這里面的%iowait列,CPU等待I/O操作所花費(fèi)的時(shí)間。這個(gè)值持續(xù)很高通?赡苁荌/O瓶頸所導(dǎo)致的。
通過(guò)這個(gè)參數(shù)可以比較直觀的看出當(dāng)前的I/O操作是否存在瓶頸
iostat命令
命令: iostat -m -x 1 1000
同樣你可以觀察對(duì)應(yīng)的CPU中的%iowait數(shù)據(jù),除此之外iostat還提供了一些更詳細(xì)的I/O狀態(tài)數(shù)據(jù),比如比較重要的有:
avgqu-sz : The average queue length of the requests that were issued to the device. (磁盤(pán)隊(duì)列的請(qǐng)求長(zhǎng)度,正常的話2,3比較好?梢院蚦pu的load一樣的理解)
await : The average time (in milliseconds) for I/O requests issued to the device to be served. (代表一個(gè)I/O操作從wait到完成的總時(shí)間)
svctm和%util都是代表處理該I/O請(qǐng)求花費(fèi)的時(shí)間和CPU的時(shí)間比例。 判斷是否瓶頸時(shí),這兩個(gè)參數(shù)不是主要的
r/s w/s 和 rMB/s wMB/s 都是代表當(dāng)前系統(tǒng)處理的I/O的一些狀態(tài),前者是我們常說(shuō)的tps,后者就是吞吐量。這也是評(píng)價(jià)一個(gè)系統(tǒng)的性能指標(biāo)
pid命令
命令: pidstat -p pid -u -d -t -w -h 1 1000
結(jié)果顯示:
相當(dāng)實(shí)用的一個(gè)命令,可以基于當(dāng)個(gè)進(jìn)程分析對(duì)應(yīng)的性能數(shù)據(jù),包括CPU,I/O,IR , CS等,可以方便開(kāi)發(fā)者更加精細(xì)化的觀察系統(tǒng)的運(yùn)行狀態(tài)。不過(guò)pidstat貌似是在2.6內(nèi)核的一些較新的版本才有,需要安裝sysstat包。
ubuntu下,可以通過(guò)sudo apt-get install sysstat進(jìn)行安裝。
sar命令
命令:sar -x pid 1 1000
sar也可以指定對(duì)應(yīng)的pid,關(guān)注固定的幾個(gè)參數(shù),沒(méi)有pidstat那么強(qiáng)大。 看不到對(duì)應(yīng)的I/O, IR等信息。
sar的功能可以覆蓋mpstat , iostat的相關(guān)功能。
dstat命令
命令:dstat -y --tcp 1 1000
通過(guò)dstat --tcp可以比較方便的看到當(dāng)前的tcp的各種狀態(tài),不需要每次netstat -nat去看
其他命令
netstat -natp : 查看對(duì)應(yīng)的網(wǎng)絡(luò)鏈接,關(guān)注下Recv-Q , Send-Q , State。
lsof -p pid : 查找對(duì)應(yīng)pid的文件句柄
lsof -i : 80 : 查找對(duì)應(yīng)端口被哪個(gè)進(jìn)程占用
lsof /tmp/1.txt :查找對(duì)應(yīng)文件被哪個(gè)進(jìn)程占用
tcpdump / wireshark :抓包分析工具
jstat / jmap / jstack / jps 等一系列的java監(jiān)控命令
最后
如果你想做一些性能調(diào)優(yōu)的工作,一定要善于利用一些工具進(jìn)行關(guān)注相應(yīng)的狀態(tài)。通過(guò)linux命令你可以比較方便的觀測(cè)到CPU , I/O , network等一些比較外圍的狀態(tài), 很多時(shí)候就已經(jīng)可以解決大部分的問(wèn)題。jvm內(nèi)部的一些運(yùn)行狀態(tài)監(jiān)控,得需要借助一些特有的工具進(jìn)行細(xì)粒度的觀測(cè)。
上面就是Linux系統(tǒng)監(jiān)控命令的介紹了,通過(guò)這些命令可以方便開(kāi)發(fā)者觀察系統(tǒng)的運(yùn)行狀態(tài),這些命令都是在系統(tǒng)監(jiān)控中會(huì)使用到了,最好記一下吧。
【Linux系統(tǒng)監(jiān)控要用到哪些命令】相關(guān)文章:
Linux系統(tǒng)監(jiān)控常用命令12-04
linux系統(tǒng)命令11-23
linux系統(tǒng)命令(經(jīng)典)01-25
Linux系統(tǒng)命令及使用技巧03-19
Linux系統(tǒng)的基本命令講解03-31
LINUX系統(tǒng)教程:passwd命令的用法03-28