監(jiān)控工程萬建電子介紹監(jiān)控知識
作者: 發(fā)布日期:2018-03-07 點擊次數(shù):798
監(jiān)控工程萬建電子介紹監(jiān)控知識:
1、監(jiān)控方法
1.了解監(jiān)控對象:我們要監(jiān)控的對象你是否了解呢?比如CPU到底是如何工作的?
2.性能基準指標:我們要監(jiān)控這個東西的什么屬性?比如CPU的使用率、負載、用戶態(tài)、內(nèi)核態(tài)、上下文切換。
3.報警閾值定義:怎么樣才算是故障,要報警呢?比如CPU的負載到底多少算高,用戶態(tài)、內(nèi)核態(tài)分別跑多少算高?
4.故障處理流程:收到了故障報警,那么我們怎么處理呢?有什么更高效的處理流程嗎?
2、監(jiān)控核心
1.發(fā)現(xiàn)問題:當系統(tǒng)發(fā)生故障報警,我們會收到故障報警的信息
2.定位問題:故障郵件一般都會寫某某主機故障、具體故障的內(nèi)容,我們需要對報警內(nèi)容進行分析,比如一臺服務器連不上:我們就需要考慮是網(wǎng)絡問題、還是負載太高導致長時間無法連接,又或者某開發(fā)觸發(fā)了防火墻禁止的相關(guān)策略等等,我們就需要去分析故障具體原因。
3.解決問題:當然我們了解到故障的原因后,就需要通過故障解決的優(yōu)先級去解決該故障。
4.總結(jié)問題:當我們解決完重大故障后,需要對故障原因以及防范進行總結(jié)歸納,避免以后重復出現(xiàn)。