本發明涉及人工智能及計算機信息,尤其涉及一種基于圖神經網絡(gnn)的改進型圖數據處理方法。
背景技術:
1、圖結構數據廣泛存在于現實世界中,如社交網絡、推薦系統、分子化學、知識圖譜等。圖神經網絡是處理這類數據的強大工具,它通過鄰居節點間的消息傳遞來學習節點和圖的表征。
2、然而,現有的典型圖神經網絡模型存在幾個固有缺陷:第一,過平滑問題:當網絡層數加深時,所有節點的表征會趨于相同,導致模型無法區分不同節點;第二,難以捕捉長程依賴:節點難以有效獲取遠離其多跳之外的關鍵鄰居信息;第三,對原始圖結構噪聲敏感:模型性能過于依賴初始輸入的圖結構質量,若圖結構存在缺失或錯誤連接,性能會顯著下降。
3、因此,迫切需要一種新的圖數據處理方法,能夠更有效、更魯棒地學習圖數據的深層表征。
技術實現思路
1、(一)要解決的技術問題
2、鑒于上述技術問題,本發明提供了一種基于圖神經網絡的圖數據處理方法。
3、(二)技術方案
4、本發明提供了一種基于圖神經網絡的圖數據處理方法,包括以下步驟:
5、步驟一:獲取原始圖數據,并對所述原始圖數據進行預處理與多模態特征融合,得到每個節點的增強初始特征表示;
6、步驟二:構建圖神經網絡模型,所述模型依次包括雙向信息傳播層、層級注意力融合層和自適應圖結構學習層;
7、步驟三:將所述增強初始特征表示輸入至所述圖神經網絡模型中進行處理;
8、所述雙向信息傳播層用于進行兩個方向的消息傳遞計算,第一個方向是節點向其鄰居節點傳遞自身狀態,第二個方向是鄰居節點向中心節點匯聚信息,從而生成包含雙向上下文的節點初步嵌入表示;
9、所述層級注意力融合層用于接收并整合所述雙向信息傳播層中每一層的節點輸出表示,通過一個注意力機制為每一層的表示分配不同的重要性權重,并將所有層的表示按權重進行加權融合,形成每個節點的最終融合表示;
10、所述自適應圖結構學習層用于根據所述最終融合表示,動態地計算節點間的新關聯強度,并生成一個任務驅動的、優化后的新鄰接矩陣;
11、步驟四:根據下游任務的目標,利用所述圖神經網絡模型的輸出結果計算損失,并通過多任務聯合學習框架對模型參數進行訓練與優化。
12、在本發明的一些實施例中,步驟一中所述預處理與多模態特征融合,包括:對節點自身的原始特征進行編碼和標準化處理;提取邊的類型和權重特征;生成描述整個圖統計特性的全局特征;最后通過拼接或基于注意力的機制將節點特征、邊特征及全局特征融合為一個統一的節點特征向量。
13、在本發明的一些實施例中,所述雙向信息傳播層中的消息函數和聚合函數可采用但不限于均值池化、最大池化、基于注意力的加權和或門控機制。
14、在本發明的一些實施例中,所述層級注意力融合層中的注意力權重由每個節點的層表示和一個全局上下文向量共同決定,通過可學習的參數矩陣和非線性激活函數動態計算得出,確保融合過程依賴于具體節點和任務上下文。
15、在本發明的一些實施例中,所述自適應圖結構學習層通過計算兩兩節點經過非線性變換后的特征表示的余弦相似度或點積,再經過一個激活函數來生成節點間的新連接權重,并將此學習到的新鄰接矩陣與原始鄰接矩陣以可學習的方式結合。
16、在本發明的一些實施例中,步驟四中所述多任務聯合學習框架,其總損失函數由主任務損失、基于圖結構重構的自監督損失以及對新生成鄰接矩陣的稀疏性約束損失三部分以加權和的方式組成
17、(三)有益效果
18、從上述技術方案可以看出,本發明具有以下有益效果:
19、本發明通過層級注意力機制融合淺層與深層特征,避免了僅使用最深層特征導致的過度平滑問題,雙向傳播機制和深層網絡結構有助于信息在圖中更遠距離的流動和交互。自適應圖結構學習層能夠動態地學習和優化拓撲結構,降低模型對原始輸入圖中噪聲和缺失連接的敏感性,提升模型的魯棒性和泛化能力。通過上述創新模塊的協同工作,本發明方法在各類圖學習任務上預計能取得更高準確率和穩定性。
1.一種基于圖神經網絡的圖數據處理方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,步驟一中所述預處理與多模態特征融合,包括:對節點自身的原始特征進行編碼和標準化處理;提取邊的類型和權重特征;生成描述整個圖統計特性的全局特征;最后通過拼接或基于注意力的機制將節點特征、邊特征及全局特征融合為一個統一的節點特征向量。
3.根據權利要求1所述的方法,其特征在于,所述雙向信息傳播層中的消息函數和聚合函數可采用但不限于均值池化、最大池化、基于注意力的加權和或門控機制。
4.根據權利要求1所述的方法,其特征在于,所述層級注意力融合層中的注意力權重由每個節點的層表示和一個全局上下文向量共同決定,通過可學習的參數矩陣和非線性激活函數動態計算得出,確保融合過程依賴于具體節點和任務上下文。
5.根據權利要求1所述的方法,其特征在于,所述自適應圖結構學習層通過計算兩兩節點經過非線性變換后的特征表示的余弦相似度或點積,再經過一個激活函數來生成節點間的新連接權重,并將此學習到的新鄰接矩陣與原始鄰接矩陣以可學習的方式結合。
6.根據權利要求1所述的方法,其特征在于,步驟四中所述多任務聯合學習框架,其總損失函數由主任務損失、基于圖結構重構的自監督損失以及對新生成鄰接矩陣的稀疏性約束損失三部分以加權和的方式組成。