監視Linux系統資源的使用情況
一、如何監視系統資源?
在Windows操作系統中,可以通過(guò)任務(wù)管理器來(lái)查詢(xún)各個(gè)進(jìn)程所占用的CPU與內存的比率。在Linux操作系統中沒(méi)有這種圖形化的管理。在命令行模式下,鍵入top命令,即可以看到各個(gè)進(jìn)程所占用的系統資源。
作為一個(gè)合格的系統管理員,出于系統性能優(yōu)化或者其他方面的考慮,往往需要掌握系統中最消耗CPU或者內存資源的程序。為了達到這個(gè)目的,系統管理員就需要借助系統提供的top命令。這個(gè)命令可以幫助管理員監控系統資源的使用情況,包括內存、CPU、交換文件分區的使用率等等。如上圖所示,就是這個(gè)命令的執行結果。系統管理員想要提升操作系統的性能,第一步就是需要讀懂上面這張表格。如果這種圖中的內容系統管理員無(wú)法看懂,那么他就想提升系統的性能根本無(wú)法入手。
Top命令的運行結果大致可以分為兩個(gè)部分。上半部是使一些統計的信息,包括內存和交換分區的使用情況、CPU的運行情況、進(jìn)程的總數等等。在這些統計信息中,系統管理員除了要關(guān)注這些重要資源的使用濾外,還需要注意進(jìn)程運行的狀態(tài)。如上圖所示,可見(jiàn)在Linux系統中進(jìn)程的狀態(tài)主要有四種,分別為running、sleeping、stopped和zombie。如果從系統維護與性能優(yōu)化考慮,則系統管理員需要關(guān)注那些狀態(tài)為zombie的進(jìn)程。若進(jìn)程處于這個(gè)狀態(tài),在Linux操作系統中叫做僵尸進(jìn)程。什么叫做僵尸進(jìn)程呢?就是那些父進(jìn)程還沒(méi)死、但是子進(jìn)程卻死了的進(jìn)程。在Linux操作系統中,進(jìn)程一般分為父進(jìn)程和子進(jìn)程。某個(gè)進(jìn)程A可能會(huì )調用另外一個(gè)進(jìn)程B。此時(shí)這個(gè)進(jìn)程A就叫做父進(jìn)程,而進(jìn)程B就叫做子進(jìn)程。由于一些意外的情況,子進(jìn)程運行已經(jīng)停止,但是父進(jìn)程卻還不知道子進(jìn)程早已停止運行,還在那邊傻傻的等待著(zhù)子進(jìn)程返回運行結果。由于子進(jìn)程沒(méi)有返回結果,則父進(jìn)程可能一直會(huì )在那邊等待。從而導致系統性能的下降。如果系統管理員發(fā)現有僵尸進(jìn)程的話(huà),首先要做的就是結束父進(jìn)程(有時(shí)候還需要查看這個(gè)父進(jìn)程打開(kāi)的其他子進(jìn)程運行情況),以釋放其占用的系統資源。其次如果這種情況發(fā)生的比較頻繁時(shí),則系統管理員就需要分析到底是什么原因導致這種情況發(fā)生的。找到原因后要采取積極的措施。通常情況下,如果子進(jìn)程的狀態(tài)為“僵尸”時(shí),父進(jìn)程就不會(huì )自動(dòng)結束,從而其占用的系統資源就不會(huì )自動(dòng)釋放,從而降低操作系統的性能。
二、Top命令的使用技巧。
1、 選擇合適的排序順序
在Windows操作系統的任務(wù)管理器中,管理員可以根據需要選擇合適的排序順序,如按CPU排序或者按內存的使用率進(jìn)行排序。而在top命令的顯示結果中,默認情況下是按照CPU的使用率來(lái)進(jìn)行排序的。如果現在系統管理員想按照內存使用率來(lái)排序,該如何處理呢?如果要想改變top命令結果的排序順序,則可以按m鍵來(lái)按內存進(jìn)行排序。注意這里的m是小寫(xiě),而不是大寫(xiě)的。在Linux操作系統中大部分命令與參數大小寫(xiě)都是敏感的。這跟微軟操作系統中的DOS命令不同。Dos命令是不區分大小寫(xiě)的。雖然這個(gè)排序沒(méi)有像微軟操作系統中的任務(wù)管理器那么方便,只需要點(diǎn)點(diǎn)鼠標就可以完成排序。但是只要熟悉相關(guān)的命令,在命令行中對其排序沒(méi)有大家想想的那么困難。
2、 監視特定用戶(hù)使用的資源情況。
在Windows操作系統中,如果想要查看特定帳戶(hù)所打開(kāi)的進(jìn)程以及所耗用的系統資源,操作非常簡(jiǎn)單。只需要打開(kāi)系統任務(wù)管理器,然后按照用戶(hù)來(lái)進(jìn)行排序。就可以知道某個(gè)用戶(hù)開(kāi)啟了哪些進(jìn)程以及所占用的比例。而在top命令中,沒(méi)有按帳戶(hù)進(jìn)行排序的功能。即在上面這個(gè)顯示結果中,只可以按照內存使用率或者CPU負載來(lái)進(jìn)行排序,而無(wú)法按照用戶(hù)來(lái)進(jìn)行排序。如上圖所示,在同一個(gè)結果中夾雜著(zhù)系統特權用戶(hù)root與普通用戶(hù)所打開(kāi)的進(jìn)程。這對于系統管理員查找問(wèn)題原因非常的不方便。有時(shí)候系統管理員往往需要只查看特定用戶(hù)的進(jìn)程,如只需要查看oracle帳戶(hù)所打開(kāi)的進(jìn)程以及所占用的系統資源。而忽略掉系統帳戶(hù)。因為特權帳戶(hù)其他用戶(hù)無(wú)權進(jìn)行登陸操作,而其運行的往往是一些系統級別的進(jìn)程,為此一般不會(huì )出現問(wèn)題。而普通用戶(hù)可以運行一些應用程序。有時(shí)候他們糊里糊涂可能會(huì )打開(kāi)一些非法程序,占用大量的系統資源,從而降低系統性能。廢話(huà)少說(shuō),如何才能夠查看特定帳戶(hù)所啟動(dòng)的進(jìn)程呢?其實(shí)很簡(jiǎn)單?,F運行top命令,讓系統統計所有帳戶(hù)的進(jìn)程。然后在需要查看特定帳戶(hù)的進(jìn)程使,只需要按u鍵(注意小寫(xiě)),然后輸入用戶(hù)名即可。此時(shí)系統會(huì )自動(dòng)把其他帳戶(hù)的進(jìn)程過(guò)濾掉,方便系統管理員查看。按用戶(hù)過(guò)濾后,仍然可以按m鍵來(lái)對現實(shí)的結果進(jìn)行過(guò)濾。如果在一開(kāi)始就需要查看某個(gè)特定用戶(hù)的進(jìn)程,那么只需要直接在top命令后面加入-u可選項然后帶上具體的用戶(hù)名即可。但是,此時(shí)如果再想查看全部用戶(hù)的話(huà),那么只有先推出top命令,然后再利用top命令不帶任何選項,來(lái)查看所有用戶(hù)的進(jìn)程?;蛘哒f(shuō),再在這個(gè)窗口中輸入字符u,然后直接按回車(chē)鍵,也可以顯示所用用戶(hù)的進(jìn)程信息。
3、動(dòng)態(tài)統計信息。
使用top命令來(lái)統計進(jìn)程的運行信息,跟微軟操作系統的任務(wù)管理器一樣,都是動(dòng)態(tài)調整的。也就是說(shuō),系統會(huì )每隔一段時(shí)間去統計這個(gè)信息,然后動(dòng)態(tài)的顯示在窗口中。不需要用戶(hù)手工去更新相關(guān)的信息。而且從上面的圖形中可以看出,top命令統計的信息要比微軟任務(wù)管理器統計的信息要多的多。所以對系統管理員來(lái)說(shuō),具有更大的參考價(jià)值。筆者以前也很喜歡采用微軟操作系統的任務(wù)管理器。而了解了top命令后,就對其鐘愛(ài)有加了。因為其不僅可以完成任務(wù)管理器中的所有功能。而且top命令中有的信息在微軟任務(wù)管理器中卻無(wú)法顯示。而這些信息往往對我們維護系統、提升性能具有很大的參考價(jià)值。
4、刪除有異常的進(jìn)程。
如果這個(gè)窗口中,發(fā)現某些進(jìn)程有異?;蛘哂脩?hù)執行了規定以外的應用程序,如占用了太多的系統資源或者有僵尸進(jìn)程的存在,則可以直接在這個(gè)窗口中講其刪除。操作的方法很簡(jiǎn)單,只需要在這個(gè)窗口內輸入字符p,然后系統會(huì )提示系統管理員輸入要關(guān)閉進(jìn)程的PID。管理員只需要鍵入這個(gè)值,然后按回車(chē)鍵就可以殺掉不需要的進(jìn)程。不過(guò)在關(guān)閉進(jìn)程的時(shí)候,有權限的限制。系統特權帳戶(hù)root可以關(guān)閉所有用戶(hù)的進(jìn)程。而普通帳戶(hù)則只能夠刪除自己打開(kāi)的程序,而無(wú)法關(guān)閉其他用戶(hù)的進(jìn)程。如現在系統管理員先以oracle用戶(hù)登錄,發(fā)現root帳戶(hù)下某個(gè)進(jìn)程異常,想要關(guān)閉時(shí),系統會(huì )提示無(wú)法關(guān)閉的錯誤信息。此時(shí)管理員必須先終止這個(gè)top進(jìn)程,然后利用su命令更改登陸的帳戶(hù)。然后再關(guān)閉這個(gè)異常的進(jìn)程。系統管理員可以同時(shí)關(guān)閉多個(gè)進(jìn)程。方法很簡(jiǎn)單,就是同時(shí)輸入多個(gè)需要關(guān)閉的進(jìn)程號。在各個(gè)進(jìn)程號之間需要利用逗號隔開(kāi)。
top在系統維護中是一個(gè)很有用的命令。除了可以實(shí)現如上的功能外,還可以設置其動(dòng)態(tài)更新的時(shí)間間隔等等。不過(guò)需要注意的是,在不同版本的Linux系統中其功能稍有差異,而且其顯示的布局與內容也有所不同。為此當系統管理員維護其不怎么熟悉的版本時(shí),有時(shí)候需要查看系統的幫助說(shuō)明。此時(shí)只需要在top命令后面加上?號就可以獲得相關(guān)的幫助。這個(gè)聯(lián)機幫助文檔根top命令一樣,都是系統管理員的好幫手。不過(guò)可惜的是,現在這些在線(xiàn)幫助文檔都是英文的。所以這對系統管理員的英文說(shuō)明要求比較高。
linux操作系統文章專(zhuān)題:linux操作系統詳解(linux不再難懂)
評論