


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、網(wǎng)管系統(tǒng)告警產(chǎn)生和處理機(jī)制1.1.1 告警來(lái)源和產(chǎn)生機(jī)制1、SYSLOG 日志(被動(dòng)接收方式) 通過采集服務(wù)器的 SYSLOG 服務(wù), 接收網(wǎng)元發(fā)送上來(lái)的 SYSLOG 日志記錄。 告警采集 程序通過 rules 將 SYSLOG 日志記錄解析為告警記錄。一條典型的華為端口 DOWN 告警解 析過程:Jul yaan-DC-R-N40 IFNET/5/UPDOWN:Interface Ethernet1/0/5 Turns into DOWN state針對(duì)上面的告警,通過 rules,主要解析出如下內(nèi)容 告警來(lái)源 IP: 告警類型: IFNET/5/UPDOWN 告警對(duì)象: Ethernet
2、1/0/5 告警原始級(jí)別: 5告警描述: Interface Ethernet1/0/5 Turns into DOWN state2、Snmp Trap 告警(被動(dòng)接收方式)告警采集在 162 端口監(jiān)聽并接收網(wǎng)元發(fā)送過來(lái)的 TRAP 通知,通過加載相應(yīng) MIB 里的 TRAP 定義或者廠家提供的 TRAP 告警翻譯規(guī)則,轉(zhuǎn)換為相應(yīng)的告警記錄。舉例說明: = 229 days, 12:07:02.00;根據(jù)中興提供的 TRAP 告警定義:(1)代表 zxAnEponOnuErroredSymbolPeriodEvent , 即 ONU 錯(cuò)誤符號(hào)間隔事件,級(jí)別是主要。(2)808584704 代
3、表索引信息,可進(jìn)一步定位到具體的ONU 設(shè)備,如 F820(0/4/4/5) 。解析翻譯后的告警如下:告警來(lái)源 IP: 告警類型: zxAnEponOnuErroredSymbolPeriodEvent告警對(duì)象: 告警級(jí)別: 4告警描述: F820(0/4/4/5) : ONU 錯(cuò)誤符號(hào)間隔事件3、網(wǎng)元狀態(tài) Polling 告警(主動(dòng)檢測(cè)方式)(1)告警產(chǎn)生 采用定期調(diào)度 (根據(jù)設(shè)備的重要程度可設(shè)定不同的策略) 對(duì)設(shè)備先進(jìn)行 SNMP 連接測(cè)試, 再進(jìn)行 ICMP PING 測(cè)試:如果只有 SNMP Pinga、如果 SNMP Ping 不通, ICMP Ping 也不通, 發(fā)送網(wǎng)元中斷告警;
4、不通,只發(fā)送網(wǎng)元不可管理告警b、如果 SNMP Ping 通,不管 ICMP Ping 通不通,都不發(fā)送任何告警c、如果原來(lái)只是 SNMP Ping 不通,但 ICMP Ping 也開始不通,再發(fā)送一條網(wǎng)元中斷告 警說明:網(wǎng)元不可管理和網(wǎng)元中斷告警, 默認(rèn)只發(fā)送一次, 不重復(fù)發(fā)送 (即發(fā)生次數(shù)為 1)。(2)告警恢復(fù)對(duì)于處于網(wǎng)元不可管理或網(wǎng)元中斷狀態(tài)的設(shè)備, 同時(shí)進(jìn)行 SNMP Ping 和 ICMP Ping 跟蹤:a、如果 SNMP Ping 通,根據(jù)設(shè)備的告警狀態(tài),發(fā)送相應(yīng)的恢復(fù)告警,分兩種情況: 設(shè)備只有網(wǎng)元不可管理告警:發(fā)送網(wǎng)元不可管理恢復(fù)告警 設(shè)備同時(shí)有兩種告警:同時(shí)發(fā)送網(wǎng)元不可管
5、理和網(wǎng)元中斷的恢復(fù)告警b、如果 SNMP Ping 仍不通,但 ICMP Ping 開始通(也就是說原來(lái)兩者都不通) ,發(fā)送一 條網(wǎng)元中斷恢復(fù)告警。4、端口狀態(tài) Polling 告警(主動(dòng)檢測(cè)方式)端口 Polling 在端口流量采集時(shí)進(jìn)行(檢測(cè)周期與性能采集周期相同, 5min 一次)。判 斷標(biāo)準(zhǔn): 本次端口流量采集采到的端口操作狀態(tài)跟上次采到的端口狀態(tài)做對(duì)比,如果發(fā)生了狀態(tài)變化則發(fā)送告警,即:如果是 up >down ,就發(fā)端口 DOWN 告警;如果是 down >up,就發(fā)恢復(fù)告警。告警 示例:告警類型:端口狀態(tài)告警描述:如: GigabitEthernet0/1/13( 端
6、口) 端口 down告警級(jí)別:嚴(yán)重 說明:端口狀態(tài)告警,只發(fā)送一次,不重復(fù)發(fā)送(即發(fā)生次數(shù)為1)。5、性能告警(主動(dòng)檢測(cè)方式)告警產(chǎn)生機(jī)制: 根據(jù)性能采集后的數(shù)據(jù)結(jié)果和性能告警設(shè)置進(jìn)行比較, 如果滿足性能告 警設(shè)置條件,發(fā)送相應(yīng)的性能告警?;謴?fù)告警:如果發(fā)生了“滿足性能告警設(shè)置條件”>“不滿足性能告警設(shè)置條件”的變化,則發(fā)送相應(yīng)的恢復(fù)告警。性能告警分類:(1)閾值性能告警:通過閾值設(shè)置產(chǎn)生的性能告警(2)基線性能告警:偏離基線時(shí)產(chǎn)生的性能告警(3)梯度性能告警:梯度變化滿足一定條件時(shí)產(chǎn)生的性能告警(4)高級(jí)性能告警:滿足給定的組合條件時(shí)產(chǎn)生的性能告警 說明:性能告警,如果滿足性能告警設(shè)置
7、條件,則每 5 分鐘發(fā)送一次,直到告警恢復(fù)為至。6、其它告警:翻轉(zhuǎn)告警、資源預(yù)警、進(jìn)程告警等(主動(dòng)檢測(cè)方式)(1)翻轉(zhuǎn)告警: 根據(jù)翻轉(zhuǎn)設(shè)置條件, 產(chǎn)生的告警, 不能自動(dòng)恢復(fù)。 告警類型為 “翻轉(zhuǎn)告警” 。(2)資源預(yù)警:根據(jù)資源預(yù)警設(shè)置條件,判斷設(shè)備的槽位占有或端口利用率是否超過給定 閾值,如果超過,則發(fā)送相應(yīng)的資源預(yù)警告警。告警類型為“資源預(yù)警” 。(3)采集進(jìn)程告警:采集進(jìn)程正常時(shí),能夠定時(shí)主動(dòng)發(fā)送心跳信息給應(yīng)用服務(wù)器,系統(tǒng)每3 分鐘檢測(cè)一次,根據(jù)采集進(jìn)程的心跳信息是否及時(shí)更新來(lái)判斷采集進(jìn)程是否正常,如果超 過設(shè)定時(shí)間,心跳信息沒有更新,則認(rèn)為進(jìn)程down ,進(jìn)而產(chǎn)生相應(yīng)的告警(重復(fù)發(fā)送)
8、 。如果進(jìn)程啟動(dòng),心跳信息恢復(fù),則發(fā)送恢復(fù)告警。告警類型為“網(wǎng)管服務(wù)進(jìn)程”1.1.2 告警數(shù)據(jù)處理流程告警從采集, 到入活動(dòng)庫(kù), 最后進(jìn)入歷史庫(kù), 這個(gè)過程稱為告警的生命周期。 采集為始, 入歷史庫(kù)為終。從始到終,其數(shù)據(jù)流程如下圖所示:2、只有 SYSLOG 和 TRAP 告警需要經(jīng)過 RULES 解析和翻譯環(huán)節(jié), 其它告警來(lái)源無(wú)此過程。3、被 RULES 過濾掉的 SYSLOG 和 TRAP 告警直接丟棄,而非進(jìn)入歷史庫(kù), SYSLOG 和 TRAP 告警在原始庫(kù)中可以找到( TRAP 原始報(bào)文默認(rèn)不入庫(kù),如果要入庫(kù),需要打開 進(jìn)程參數(shù))。4、告警先進(jìn)行重定義, 在進(jìn)行預(yù)處理規(guī)則過濾, 被預(yù)
9、處理過濾的告警, 直接進(jìn)入歷史庫(kù) (也 可以選擇直接丟棄) ,對(duì)應(yīng)的刪除類型為“預(yù)處理刪除” ;沒有過濾的告警入活動(dòng)庫(kù),同 時(shí)發(fā)布 JMS 消息。5、告警是排隊(duì)入庫(kù)的,每次從入庫(kù)隊(duì)列中取一定數(shù)量的告警依次入庫(kù)。分為三種情況: ( 1) 如果活動(dòng)庫(kù)中存在相同的告警事件 (告警源和事件相同) ,則進(jìn)行告警更新 (更 新發(fā)生次數(shù)和發(fā)生時(shí)間) ;( 2) 如果活動(dòng)庫(kù)中不存在相同的告警事件,則插入一條新的活動(dòng)告警記錄; ( 3) 如果告警為恢復(fù)告警,則將活動(dòng)庫(kù)中對(duì)應(yīng)的告警事件清除,進(jìn)入歷史庫(kù)。6、活動(dòng)庫(kù)的告警被刪除后,進(jìn)入歷史庫(kù)。這里的刪除有以下幾種情況( 1) 界面手工刪除對(duì)應(yīng)的刪除類型為“用戶手工刪
10、除” 。( 2) 自動(dòng)恢復(fù)刪除收到恢復(fù)告警后, 自動(dòng)與對(duì)應(yīng)的活動(dòng)告警結(jié)對(duì)合并, 合并后的告警入歷史庫(kù)。 合并后的 告警,清除時(shí)間為恢復(fù)告警的發(fā)生時(shí)間,清除類型為“自動(dòng)恢復(fù)刪除” ,其余字段保留原告 警信息。也就是說,恢復(fù)告警是與成對(duì)的活動(dòng)告警合并成一條告警后入歷史庫(kù)。( 3) 告警條件刪除 根據(jù)在告警設(shè)置里設(shè)置的定時(shí)刪除規(guī)則, 定時(shí)刪除符合條件的活動(dòng)告警。 對(duì)應(yīng)的刪除類 型為“告警條件刪除” 。( 4) 告警過多刪除低級(jí)告警 當(dāng)活動(dòng)庫(kù)的告警超過設(shè)置的容量時(shí), 系統(tǒng)自動(dòng)啟動(dòng)的刪除低級(jí)別 (未定和警告) 告警的 策略。刪除的告警的級(jí)別為未定和警告。對(duì)應(yīng)的刪除類型為“告警過多刪除低級(jí)告警” 。( 5
11、) 成對(duì)合并直接入歷史庫(kù)如果收到的某個(gè)告警發(fā)生和恢復(fù)時(shí)間非常接近( 1 秒左右),入庫(kù)線程從告警隊(duì)列里取 告警后, 發(fā)現(xiàn)有這種成對(duì)的情況, 就不再走活動(dòng)庫(kù)而是直接合并入歷史庫(kù), 這種情況下告警 刪除類型為“成對(duì)合并直接入歷史庫(kù)” 。( 6) 等價(jià)告警剔重目前僅適用于端口 down 告警。當(dāng)上來(lái)某條端口 down 告警時(shí),但活動(dòng)庫(kù)中已經(jīng)存在該 端口的其它 PORT_DOWN 告警,則該端口 down 告警直接入歷史庫(kù),刪除類型為“等價(jià)告 警剔重”。1.1.3 告警關(guān)聯(lián)機(jī)制告警關(guān)聯(lián)機(jī)制包括:(1) 告警結(jié)對(duì)清除 收到恢復(fù)告警后, 自動(dòng)與對(duì)應(yīng)的活動(dòng)告警結(jié)對(duì)合并成一條告警, 合并后的告警從活動(dòng)庫(kù) 轉(zhuǎn)入
12、歷史庫(kù),這種情況下告警刪除類型為“自動(dòng)恢復(fù)刪除” ;(2) 告警壓縮合并 收到告警時(shí),自動(dòng)與活動(dòng)庫(kù)中存在的相同告警事件 (告警源和事件相同)進(jìn)行合并,同 時(shí)更新告警的發(fā)生次數(shù)和發(fā)生時(shí)間;(3)告警合并直接入歷史庫(kù) 如果收到的某個(gè)告警發(fā)生和恢復(fù)時(shí)間非常接近( 1 秒左右),入庫(kù)線程從告警隊(duì)列里取 告警后, 發(fā)現(xiàn)有這種成對(duì)的情況, 就不再走活動(dòng)庫(kù)而是直接合并入歷史庫(kù), 這種情況下告警 刪除類型為“成對(duì)合并直接入歷史庫(kù)” ;(4)告警同源處理 目前主要用于端口 DOWN 告警。端口 DOWN 告警的來(lái)源主要有 SYSLOG 和端口狀態(tài)Polling 兩種,盡管告警類型在不同的廠商定義中不盡相同,但反
13、映的是同一告警事件,系 統(tǒng)把這些告警類型歸屬到同一個(gè)告警類型組 “ PORT_DOWN ”,同一個(gè)告警類型組下的告警, 認(rèn)為是等價(jià)的。為避免由于 SYSLOG 日志缺失或解析規(guī)則不完整造成的端口 DOWN 告警不準(zhǔn)確, 系統(tǒng) 采用了端口狀態(tài) Polling 作為輔助手段,對(duì)端口狀態(tài)事件進(jìn)行監(jiān)控, 但與 SYSLOG 告警進(jìn)行 了關(guān)聯(lián)處理。具體策略:a、 PORT_DOWN 告警類型組下的所有告警類型,可以互相清除,即對(duì)于同一個(gè)端口, 某個(gè)告警類型的恢復(fù)告警,可以清除其它 PORT_DOWN 告警。b、上來(lái)某條端口 down 告警時(shí),但活動(dòng)庫(kù)中已經(jīng)存在該端口的其它PORT_DOWN 告警則該端口 down 告警直接入歷史庫(kù),刪除類型為“等價(jià)告警剔重” 。Polling 檢測(cè)到該端口PORT_DOWN 告c、當(dāng)活動(dòng)庫(kù)中存在某個(gè)端口的 PORT_DOWN 告警,而端口狀態(tài) 的操作狀態(tài)為 up 時(shí),則發(fā)送端口狀態(tài)恢復(fù)告警,用于清除該端口的所有 警。目前 PORT DOWN 告警類型組包括的告警類型:告警類型來(lái)源說明端口狀態(tài)端口狀態(tài) PollingLINK-3-UPDOWNSYSLOGLINEPROTO-5-UPDOWNSYSLOGLINK DOWNSYSLOGL
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 不過退款協(xié)議合同范本
- 2025年遼寧貨運(yùn)從業(yè)資格證考試技巧和方法
- 化工師徒合同范本
- 出讓合同范本
- 買木頭合同范本
- 作為甲方合同范本
- 制氫設(shè)備銷售合同范本
- 農(nóng)業(yè)項(xiàng)目施工合同范本
- 冰糖橙水果合同范本
- 上海別墅合同范本
- 2024-2025年中國(guó)鋰電池隔膜行業(yè)未來(lái)發(fā)展趨勢(shì)分析及投資規(guī)劃建議研究報(bào)告
- 軟件系統(tǒng)項(xiàng)目實(shí)施方案(共3篇)
- 2025年山東藥品食品職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年恩施市福牛物業(yè)有限公司招聘筆試參考題庫(kù)含答案解析
- 《滾動(dòng)軸承-》課件
- 2025年中國(guó)CAR-T免疫細(xì)胞治療行業(yè)市場(chǎng)發(fā)展前景研究報(bào)告-智研咨詢發(fā)布
- 《化妝品包裝材料相容性試驗(yàn)評(píng)估指南》
- 中華人民共和國(guó)保守國(guó)家秘密法實(shí)施條例
- 《環(huán)境影響評(píng)價(jià)》全套教學(xué)課件
- XX小學(xué)法治副校長(zhǎng)(派出所民警)法制教育課講稿
- (2024年)肺栓塞的護(hù)理課件
評(píng)論
0/150
提交評(píng)論