電力信息化離不開(kāi)網(wǎng)絡(luò )監控
在當前電力事業(yè)信息化應用中,系統運行平臺的網(wǎng)絡(luò )環(huán)境日漸復雜,為了充分發(fā)揮IT環(huán)境內所有網(wǎng)元(網(wǎng)絡(luò ),設備,計算機系統,數據庫,中間件,存儲,企業(yè)核心應用等)的作用,企業(yè)需要有一個(gè)好的IT管理工具來(lái)對網(wǎng)絡(luò )和系統進(jìn)行有效的管理,同時(shí)為了形成一套集主機、網(wǎng)絡(luò )、服務(wù)器以及應用(含數據庫)運行監控和管理的、面向業(yè)務(wù)的綜合系統,就必須加強信息網(wǎng)絡(luò )管理監控系統的建設。
本文引用地址:http://dyxdggzs.com/article/201521.htm系統平臺及開(kāi)發(fā)技術(shù)
整體來(lái)看,管理系統所管理的對象主要包括:主機系統、網(wǎng)絡(luò )設備、數據庫、中間件、存儲設備、備份設備、企業(yè)核心應用系統等部分。
通過(guò)網(wǎng)絡(luò )監視管理系統對上述管理對象進(jìn)行集中維護、統一管理。實(shí)現對整個(gè)業(yè)務(wù)支撐系統的統一整體管理??梢酝ㄟ^(guò)監視屏幕及時(shí)了解整個(gè)業(yè)務(wù)系統、數據庫、主機系統、網(wǎng)絡(luò )設備的運行狀況包括各項功能指標、性能指標等。系統的整個(gè)體系由三大部分構成:數據和控制層、處理層、展現層。
數據和控制層由各個(gè)業(yè)務(wù)系統代理組成:代理層是數據采集和動(dòng)作執行的核心。Agent是運行在被監控目標計算機上的一些小程序,主要功能是負責采集該系統運行狀況、性能等數據,并發(fā)送到數據采集分發(fā)管理器。
處理層是整個(gè)管理系統的核心,包含了數據管理、核心監控、報警、數據存儲等部分:數據采集分發(fā)管理器的主要功能是從代理收集數據、更新和維護被管理對象狀態(tài)、命令代理程序層執行相關(guān)指令等。并確保把數據分發(fā)到數據存儲器;數據存儲器接收到數據采集分發(fā)管理器的數據并進(jìn)行分類(lèi),數據分割拆分存儲。核心監控對采集到的數據進(jìn)行分析處理,分析是否達到報警閥值,是否需要采取處理。
展現層是運維管理系統的用戶(hù)界面層,展示業(yè)務(wù)系統的功能指標、性能指標。用戶(hù)界面把網(wǎng)絡(luò )和系統中各種對象的關(guān)系、配置、狀態(tài)和故障情況,用圖示化的用戶(hù)接口展現出來(lái)。報警手段提供聲光、音樂(lè )、短信、Email等等多種有效的手段向用戶(hù)發(fā)出警示信息。統計分析是對業(yè)務(wù)系統進(jìn)行的業(yè)務(wù)指標、性能指標進(jìn)行分析,發(fā)現業(yè)務(wù)系統潛在的問(wèn)題,防范于未然。
系統主要功能
一般企業(yè)對軟件要求是具有國內先進(jìn)水平的系統管理軟件,對企業(yè)所有服務(wù)器操作系統、系統數據庫、網(wǎng)絡(luò )交換機、應用系統及應用進(jìn)程都能進(jìn)行監控。運行人員能夠隨時(shí)查看到服務(wù)器的CPU、內存、磁盤(pán)空間、數據庫、進(jìn)程等方面的詳細數據;還可以通過(guò)對網(wǎng)卡、交換機的監控,了解目前網(wǎng)絡(luò )的流量;可以實(shí)時(shí)掌握目前網(wǎng)絡(luò )運行的狀況。有全面的服務(wù)器監測器、網(wǎng)絡(luò )監測器、WEB應用監測器和企業(yè)應用監測,可以對企業(yè)信息網(wǎng)進(jìn)行全面的監測。主要分為幾個(gè)方面:跨操作系統,遠程監測管理;服務(wù)器、網(wǎng)絡(luò )設備監測;應用監測;方便實(shí)用;遠程報警、故障自動(dòng)恢復;豐富的報告以及方便實(shí)用的用戶(hù)管理功能。
然而,系統功能主要有幾個(gè)方面。首先是跨操作系統遠程監測管理。系統支持Windows、NT、Linux、SunSolaris、AIX、HpUnix、Cobalt、True64、OpenServer、Slackware、Digital等在內的所有主流操作系統,可以跨路由、跨網(wǎng)段對遠程或異地的服務(wù)器機群進(jìn)行集中監測管理。
其次,服務(wù)器、網(wǎng)絡(luò )設備監測:通過(guò)使用系統可以7X24監測服務(wù)器的各種性能參數(CPU、磁盤(pán)空間、內存、服務(wù)、進(jìn)程、網(wǎng)卡流量等)和網(wǎng)絡(luò )狀況(Ping、Port、網(wǎng)絡(luò )設備接口流量等),同時(shí)采用標準的SNMP協(xié)議對各種網(wǎng)絡(luò )設備進(jìn)行監測,包括網(wǎng)絡(luò )設備接口狀況、CiscoCPU、Cisco配置文件、F5、CheckPoint、Netscreen防火墻等。通過(guò)這些監測,用戶(hù)可以及時(shí)發(fā)現問(wèn)題,快速定位查找解決故障,區分故障發(fā)生的原因,給客戶(hù)抱怨一個(gè)合理的解釋?zhuān)煌瑫r(shí)系統可將客戶(hù)所要求的各種性能監測報告自動(dòng)發(fā)送至客戶(hù)指定郵箱。
然后是能對Web網(wǎng)站所有相關(guān)應用進(jìn)行監測。需要軟件內置各種Web應用監測器,如:WebServer、IIS、Apache、Iplanet、DNS、FTP、URL、URLTransaction、Websphere、Port、F5(LoadBalance)等,可以很好地對Web網(wǎng)站進(jìn)行監測。
同時(shí),實(shí)現遠程報警,具有自動(dòng)恢復功能。系統通過(guò)監測器在監測到故障或者故障隱患時(shí),會(huì )通過(guò)靈活多樣的報警方式(語(yǔ)音電話(huà)、手機短信、電子郵件、),將警報發(fā)送到相關(guān)責任人,實(shí)現運行維護責任的明確分工;同時(shí),還可以根據預先定義,對常見(jiàn)故障自動(dòng)進(jìn)行相應的故障恢復。
而且自動(dòng)統計報表。系統提供的強大的報表分析功能和靈活多樣的圖表報告功能,非常方便生成實(shí)時(shí)的和歷史的報告,并可以打印、導出,為網(wǎng)絡(luò )管理和規劃提供可靠的理論數據和依據,能夠自動(dòng)組合監測數據,生成針對監測對象實(shí)時(shí)的或歷史的報告和報表,幫助管理人員通過(guò)歷史數據分析設備的運行趨勢,為IT系統管理的長(cháng)期規劃提供依據。
還有就是方便實(shí)用的用戶(hù)管理功能。管理人員可以為每個(gè)用戶(hù)設立一個(gè)管理帳號,并設置許可規模、期限以及管理權限。這樣,用戶(hù)就如同自己?jiǎn)为毷褂迷撓到y,通過(guò)它來(lái)遠程管理自己的服務(wù)器及其應用。同時(shí)具備完備的安全設置:數據采集、傳輸支持HTTPS和SSH加密協(xié)議。用戶(hù)登錄系統除需輸入指定的用戶(hù)名和密碼外,還可設定只允許指定的IP地址進(jìn)行遠程登錄。
當然,軟件具有Web界面、遠程管理功能。要求能通過(guò)軟件,管理員可以在指定的一臺機器上瀏覽管理界面并進(jìn)行配置。管理員可以遠程瀏覽管理系統并進(jìn)行配置,掌握信息網(wǎng)運行情況。
另外,構建服務(wù)器、應用拓撲圖。系統能自動(dòng)生成拓樸圖,用戶(hù)可以調整定置圖,通過(guò)拓撲圖可以直觀(guān)看到整個(gè)信息網(wǎng)設備的運行情況,一旦系統或應用出現故障,故障設備立刻會(huì )變成紅色、發(fā)出報警,實(shí)時(shí)直觀(guān)地反映整個(gè)網(wǎng)絡(luò )設備的狀況,而且可以直觀(guān)地反映服務(wù)器、數據庫、應用進(jìn)程等各種應用的運行情況。
總之,系統特點(diǎn)包括,首先是采用集中非代理式的完全自動(dòng)化監測方式。從一臺監測主機可同時(shí)監測不限點(diǎn)數的服務(wù)器、網(wǎng)絡(luò )設備及其應用的各種關(guān)鍵參數,在被監測對象上無(wú)需安裝任何代理軟件,對被監測對象的性能影響甚微,系統的維護和升級都十分方便。通過(guò)模擬運行維護人員的日常操作行為,實(shí)現對網(wǎng)絡(luò )狀況的7*24小時(shí)不間斷實(shí)時(shí)監測。
其次方便實(shí)用的設計理念。系統被監測客戶(hù)端的安裝不到15分種即可使用,功能強大,操作卻十分方便。采用全中文的界面和幫助,提供本土化的技術(shù)支持和服務(wù),只要具備基本網(wǎng)管常識,無(wú)需任何專(zhuān)門(mén)培訓,就可輕松管理網(wǎng)絡(luò )。
還有就是開(kāi)放式的API接口。系統提供的開(kāi)放式的API接口,可以讓網(wǎng)絡(luò )管理人員十分方便的添加自身系統獨有的特殊監測器,從而滿(mǎn)足用戶(hù)特有的監測需求。
系統的實(shí)施效果
一般企業(yè)的技術(shù)人員可以通過(guò)三個(gè)月的時(shí)間開(kāi)發(fā)適合企業(yè)的網(wǎng)絡(luò )平臺監控系統,實(shí)現企業(yè)近200臺網(wǎng)絡(luò )設備、20臺小型機、70臺PC服務(wù)器及相關(guān)數據庫、中間件的自動(dòng)化監測管理。針對企業(yè)集中式系統運維的需求,系統可以提供具體的解決方案。通過(guò)自動(dòng)生成的拓樸圖全面掌握系統性能。
首先是服務(wù)器及相關(guān)數據庫管理。系統實(shí)時(shí)地對服務(wù)器進(jìn)行監測,定期對服務(wù)進(jìn)行分析,降低服務(wù)器故障,不斷提高服務(wù)器性能。支持對Windows、Unix、Solaris、AIX等相關(guān)操作系統的服務(wù)器的CPU使用率、內存使用率、磁盤(pán)利用率、服務(wù)、進(jìn)程運行狀況、目錄、文件、日志等進(jìn)行集中監測管理,同時(shí)也實(shí)時(shí)對ORACLE、SQL數據庫進(jìn)行運行監測。
其次是網(wǎng)絡(luò )設備管理。通過(guò)監測網(wǎng)絡(luò )設備是否可用、各端口流量、性能如何、CPU、內存使用情況、配置文件是否被修改、是否有異常日志及有沒(méi)有人非法登陸等,確保網(wǎng)絡(luò )系統的正常運行。
還有就是WWW服務(wù)管理。系統通過(guò)定期登錄指定的URL,驗證這個(gè)URL是否能被正常訪(fǎng)問(wèn),同時(shí)可以對該頁(yè)面的內容進(jìn)行校驗,防止頁(yè)面被人惡意修改,從而確保不同WWW服務(wù)的質(zhì)量。
通過(guò)系統的實(shí)施,不僅能進(jìn)一步提高企業(yè)各個(gè)業(yè)務(wù)信息系統的運行質(zhì)量,為企業(yè)日常管理工作能正常持續運行提供有力的保障,同時(shí)也大大降低了系統監控的運行維人力支持。技術(shù)支持人員有更多的時(shí)間提供應用支持,間接提高了各業(yè)務(wù)系統應用的滿(mǎn)意度。
隨著(zhù)電力信息化的發(fā)展和國網(wǎng)公司“SG186”工程的推進(jìn),電力系統的信息安全也日益被重視,一是信息安全,二是網(wǎng)絡(luò )安全,其中網(wǎng)絡(luò )安全主要從網(wǎng)絡(luò )層面考慮,指的是使信息的傳輸和網(wǎng)絡(luò )的運行能夠得到安全的保障,內部和外部的非法攻擊得到有效的防范和遏制。信息網(wǎng)絡(luò )和信息系統的硬件、軟件、設備、數據需要受到可靠的保護,通信和訪(fǎng)問(wèn)等操作要得到有效保障和合理的控制,不受偶然的或者惡意攻擊的原因而遭受到破壞、更改、泄漏,系統連續可靠正常的運行,網(wǎng)絡(luò )服務(wù)不被中斷。在信息系統安全中,人始終是一個(gè)重要的角色,由于信息管理部門(mén)的技術(shù)維護力量遠不如生產(chǎn)線(xiàn)上人員的配備充足,每個(gè)人維護的信息設備數和需要具備的維護知識的要求相對較高,在傳統模式下可能就會(huì )出現造成信息系統安全的問(wèn)題。通過(guò)網(wǎng)絡(luò )管理監控系統的建設,將每個(gè)人運行維護知識都在系統中得以體現與固化,并通過(guò)系統設置可以交流與確認。通過(guò)整合、完善、改建和新建的監控方法,統一并規范的實(shí)現各系統及設備監控的自動(dòng)化,也實(shí)現了監控數據共享與交流,也極大提高信息運維工作的質(zhì)量與效率。將使企業(yè)的信息管理水平在信息系統統一監控實(shí)現自動(dòng)化的推動(dòng)下上了一個(gè)新的臺階。
評論