本發明涉及通信網絡,具體為一種dci告警處理方法、裝置、計算機設備和存儲介質。
背景技術:
1、?隨著云計算、大數據與分布式網絡技術的規?;瘧茫瑪祿行幕ヂ摚╠ci)網絡已成為支撐跨區域數據交互、業務協同的核心基礎設施,網絡節點數量、鏈路規模與業務流量呈指數級增長,隨之產生的告警數據呈現海量性、突發性、關聯性特征,對告警處理的實時性、準確性與智能化提出極高要求。當前行業內?dci?告警處理普遍采用三類傳統技術方案:第一類為靜態閾值觸發告警,通過預設固定閾值觸發告警提示,無法適配網絡動態變化,告警適應性極差;第二類為專家規則匹配告警,依賴人工梳理并維護大量關聯規則,規則更新滯后、維護成本極高,且無法覆蓋未知故障場景;第三類為傳統機器學習告警分類,特征提取完全依賴人工經驗定義,僅能實現單告警簡單分類,無法挖掘告警間的深層關聯關系。
技術實現思路
1、?本發明的目的在于提供一種dci?告警處理方法,以解決上述背景技術中提出的問題。
2、本發明的第一方面提供一種dci告警處理方法,包括:
3、實時采集數據中心互聯網絡中的原始告警數據;
4、對所述原始告警數據進行語義解析與特征編碼,得到告警特征向量;
5、基于所述告警特征向量構建告警關聯圖譜,通過圖學習模型對所述告警關聯圖譜進行關聯推理,確定告警間的關聯關系并定位根因告警;
6、根據網絡拓撲狀態、業務優先級配置及實時流量狀態,通過智能決策算法生成與所述根因告警匹配的告警處理策略;
7、將所述告警處理策略下發至對應網絡設備,完成告警自動化處置。
8、在一種可能的實施方式中,所述對所述原始告警數據進行語義解析與特征編碼,得到告警特征向量,包括:
9、提取原始告警數據中的時序特征與空間特征,對所述時序特征與空間特征執行聯合編碼處理,通過自注意力機制計算不同維度特征間的關聯權重,生成融合時序、空間與語義信息的告警特征向量。
10、在一種可能的實施方式中,所述對所述原始告警數據進行語義解析,包括:
11、提取原始告警數據中的非結構化告警文本,通過預訓練語言模型對所述非結構化告警文本執行語義向量化表示處理,生成作為聯合編碼基礎的基礎語義特征。
12、在一種可能的實施方式中,所述基于所述告警特征向量構建告警關聯圖譜,包括:
13、將每一告警事件采用對應的告警特征向量進行表征,將表征后的告警事件映射為圖譜節點,將各個告警事件之間的時間接近性、因果關聯性、系統層級依賴性構建為告警關聯圖譜的邊,根據告警關聯強度計算邊權重,形成加權有向的告警關聯圖譜。
14、在一種可能的實施方式中,所述通過圖學習模型對所述告警關聯圖譜進行關聯推理包括:將圖譜節點對應的告警特征向量與邊權重輸入圖學習模型,通過圖學習模型對告警關聯關系進行推理計算,得到各個告警之間的關聯置信度,生成告警關聯矩陣并基于關聯矩陣完成根因告警定位。
15、在一種可能的實施方式中,所述根據網絡拓撲狀態、業務優先級配置及實時流量狀態,通過智能決策算法生成與所述根因告警匹配的告警處理策略,包括:
16、獲取網絡拓撲結構、業務服務等級配置及實時流量分布數據,將上述數據構建為強化學習的狀態空間;根據網絡運行指標構建獎勵函數,通過多頭注意力機制計算網絡節點間的關聯強度,動態聚合鄰居節點信息并生成節點嵌入,基于節點嵌入預測各傳輸路徑的業務質量滿足概率,生成滿足業務質量要求的最優告警處理策略。
17、在一種可能的實施方式中,根據網絡吞吐量、數據傳輸延遲、數據丟包率以及系統資源消耗率構建獎勵函數,通過熵權法對獎勵函數中各指標的權重執行動態分配與歸一化計算,基于優化后的獎勵函數對告警處理策略進行迭代優選,生成最終的最優告警處理策略。
18、本發明的第二方面提供一種dci?告警處理方法及裝置系統,包括依次通信連接的告警采集模塊、特征提取模塊、關聯分析模塊、處理決策模塊及執行模塊;
19、所述告警采集模塊用于實時采集dci網絡設備產生的原始告警數據,并將原始告警數據傳輸至特征提取模塊;
20、所述特征提取模塊用于對原始告警數據進行語義解析、時序與空間特征提取及聯合編碼,生成告警特征向量并傳輸至關聯分析模塊;
21、所述關聯分析模塊用于根據告警特征向量構建告警關聯圖譜,執行關聯推理計算,識別告警關聯關系并定位根因告警,將根因告警信息傳輸至處理決策模塊;
22、所述處理決策模塊用于獲取網絡拓撲狀態、業務優先級配置及實時流量分布數據,生成與根因告警匹配的告警處理策略并傳輸至執行模塊;
23、所述執行模塊用于接收告警處理策略,并將告警處理策略下發至對應網絡設備,完成告警自動化處置。
24、本發明第三方面提供一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如本發明第一方面所述的dci?告警處理方法。
25、本發明第四方面提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現如本發明第一方面所述的dci?告警處理方法。
26、與現有技術相比,本發明的有益效果是:
27、1.通過對原始告警數據進行特征提取、構建告警關聯圖譜并執行關聯推理,能夠自動識別告警之間的內在關聯關系,精準定位故障根因告警,有效降低告警誤報率,剔除冗余衍生告警,大幅提升告警識別與故障定位的準確性。
28、2.通過網絡拓撲、業務優先級、實時流量多維狀態生成匹配的告警處理策略,無需人工分析決策,同時將策略自動下發至網絡設備完成全流程自動化處置,顯著提升告警處理實時性,大幅減少人工干預需求。
1.一種dci告警處理方法,其特征在于,包括:
2.根據權利要求1所述的dci告警處理方法,其特征在于,所述對所述原始告警數據進行語義解析與特征編碼,得到告警特征向量,包括:
3.根據權利要求2所述的dci告警處理方法,其特征在于,所述對所述原始告警數據進行語義解析,包括:
4.根據權利要求1所述的dci告警處理方法,其特征在于,所述基于所述告警特征向量構建告警關聯圖譜,包括:
5.根據權利要求4所述的dci告警處理方法,其特征在于,所述通過圖學習模型對所述告警關聯圖譜進行關聯推理包括:將圖譜節點對應的告警特征向量與邊權重輸入圖學習模型,通過圖學習模型對告警關聯關系進行推理計算,得到各個告警之間的關聯置信度,生成告警關聯矩陣并基于關聯矩陣完成根因告警定位。
6.根據權利要求1所述的dci告警處理方法,其特征在于,所述根據網絡拓撲狀態、業務優先級配置及實時流量狀態,通過智能決策算法生成與所述根因告警匹配的告警處理策略,包括:
7.根據權利要求6所述的dci告警處理方法,其特征在于,根據網絡吞吐量、數據傳輸延遲、數據丟包率以及系統資源消耗率構建獎勵函數,通過熵權法對獎勵函數中各指標的權重執行動態分配與歸一化計算,基于優化后的獎勵函數對告警處理策略進行迭代優選,生成最終的最優告警處理策略。
8.一種dci告警處理裝置,其特征在于,包括依次通信連接的告警采集模塊、特征提取模塊、關聯分析模塊、處理決策模塊及執行模塊;
9.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1-7任一項所述的dci告警處理方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-7任一項所述的dci告警處理方法。