1. <rt id="e600n"></rt>
      1. <pre id="e600n"><strong id="e600n"><pre id="e600n"></pre></strong></pre>
      2. 岛国免费AV,无码人妻精品一区二区三区夜夜嗨,又大又粗又硬又爽黄毛少妇,精品国产AV二区,91视频最新网址,久操无码,久久无码人妻一区二区三区午夜,国产精品视频中文字幕

        一種融合深度學習與知識圖譜的數據語義增強生成方法與流程

        文檔序號:45271003發布日期:2026-04-17 20:09閱讀:3來源:國知局

        本發明涉及人工智能與數據處理,尤其涉及一種融合深度學習與知識圖譜的數據語義增強生成方法。


        背景技術:

        1、隨著大模型驅動的人工智能生成技術和語義增強建模需求的不斷增長,針對多源異構數據中的語義信息提取、結構一致性約束與高質量生成的融合處理方法受到廣泛關注。現有的基于深度學習的生成方法多依賴統一嵌入模型或單一語義編碼結構對原始數據進行處理,在實際應用中仍存在以下問題:

        2、原始數據來源復雜且結構多元化,包含文本數據、結構化表格數據與半結構化數據,不同數據格式下語義信息分布形式差異顯著,傳統嵌入模型難以統一編碼,導致模型訓練效率低和語義對齊性能差;大多數深度學習模型僅基于語料內部上下文關系進行建模,缺乏對實體語義關系與結構路徑的顯式建模機制,容易出現語義漂移、生成幻覺與邏輯沖突等問題;知識圖譜雖具備結構約束能力,但與深度模型融合方式有限,現有圖神經網絡對多關系建模能力弱,難以有效表達圖譜中復雜的實體關系與路徑語義特征;生成階段缺乏對結構控制與實體一致性的約束,容易導致輸出內容與領域知識不符,影響生成結果的可用性與可信度。

        3、因此,如何提供一種融合深度學習與知識圖譜的數據語義增強生成方法是本領域技術人員亟需解決的問題。


        技術實現思路

        1、本發明的一個目的在于提出一種融合深度學習與知識圖譜的數據語義增強生成方法,本發明綜合利用語義嵌入建模、圖神經網絡結構建模和生成網絡技術,詳細描述了從原始多源數據中提取語義單元、構建結構約束張量并通過改進型compgcn網絡與改進型bart網絡進行語義增強建模與控制生成,具備結構建模精度高、語義一致性強與生成結果可信度高的優點。

        2、根據本發明實施例的一種融合深度學習與知識圖譜的數據語義增強生成方法,包括如下步驟:

        3、步驟一:獲取待語義增強的原始數據樣本;

        4、步驟二:對原始數據樣本進行數據預處理,生成標準化數據樣本;

        5、步驟三:將標準化數據樣本進行語義嵌入建模,生成語義嵌入向量序列;

        6、步驟四:基于語義嵌入向量序列,進行實體對齊與路徑結構建模,獲得結構約束張量;

        7、步驟五:將語義嵌入向量序列與結構約束張量輸入至改進型compgcn網絡,執行語義增強建模操作,輸出增強語義特征向量序列;所述改進型compgcn網絡包括跨關系注意力聚合模塊、路徑感知殘差門控模塊和語義調制邊更新模塊;

        8、步驟六:將增強語義特征向量序列輸入至改進型bart網絡,執行語義增強數據生成任務,輸出預測token序列;所述改進型bart網絡引入結構引導注意力和實體控制門控;

        9、步驟七:將預測token序列進行實體一致性驗證和關系判斷,篩選生成語義增強token序列。

        10、可選的,所述原始數據樣本包括文本數據、結構化表格數據或半結構化數據。

        11、可選的,所述步驟二具體包括:

        12、所述數據預處理包括數據清洗和格式標準化;

        13、所述數據清洗具體為:去除原始數據樣本中的缺失字段、非法字符和格式錯誤項;

        14、所述格式標準化具體為:將文本數據按照預設關鍵詞模板進行分塊與映射,提取字段標簽和字段內容,生成字段對集合;將結構化表格數據中的列標題作為字段標簽,列值作為字段內容,獲得字段對集合;將半結構化數據解析為包含字段標簽與字段內容的字段對集合;

        15、將字段對集合的字段標簽與字段內容按照字段順序組合,并進行結構封裝,生成標準數據樣本。

        16、可選的,所述步驟三具體包括:

        17、對標準數據樣本進行分詞處理,獲得對應的token序列;

        18、基于分詞規則識別token序列中的語義單元,所述語義單元包括詞元、字段標簽、實體名稱和語義片段;

        19、將每個語義單元通過預訓練的word2vec嵌入模型進行向量化編碼,生成語義嵌入向量;

        20、將每個語義嵌入向量按照token序列中的順序排列成語義嵌入向量序列。

        21、可選的,所述步驟四具體包括:

        22、加載預定義的知識圖譜,所述預定義的知識圖譜包括實體節點集合和關系邊集合,所述實體節點集合中每個實體節點通過預訓練的transe模型進行向量化編碼,生成實體節點嵌入向量;

        23、將每個語義單元的語義嵌入向量與每個實體節點的節點嵌入向量通過余弦相似度方法計算語義相似度,并將語義單元映射到語義相似度最大的實體節點,形成映射實體節點集合;

        24、基于映射實體節點集合,從知識圖譜中提取映射實體節點之間的關系邊,構建關系鄰接矩陣,若映射實體節點i與映射實體節點j之間存在關系邊,則關系鄰接矩陣的第i行第j列元素值設置為1,否則,設置為0;

        25、設定最大跳數,并基于關系鄰接矩陣,通過廣度優先搜索提取映射實體節點之間不超過最大跳數的實體連接路徑,獲得實體連接路徑集合;

        26、基于每條實體連接路徑,構造路徑結構特征向量,所述路徑結構特征向量由路徑長度特征、路徑關系類型特征與路徑方向性特征組成;

        27、其中,路徑長度特征表示實體連接路徑中關系邊數量與最大跳數的比值,路徑關系類型特征表示實體連接路徑中所有關系邊在關系鄰接矩陣中對應元素值的拼接,路徑方向性特征表示實體連接路徑中關系邊的連接方向的獨熱編碼;

        28、將實體路徑集合按照映射實體節點維度×映射實體節點維度×路徑結構特征向量維度的結構組成結構約束張量。

        29、可選的,所述步驟五具體包括:

        30、基于映射實體節點集合,構建每個映射實體節點的節點特征向量,其中,每個映射實體節點的初始節點特征向量為對應的語義嵌入向量;

        31、在跨關系注意力聚合模塊,將映射實體節點之間的關系邊按照關系類型進行劃分,并為每種關系類型構建對應的類型鄰接矩陣,若映射實體節點i與映射實體節點j之間存在當前關系類型的關系邊,則設置類型鄰接矩陣的第i行第j列元素值為1,否則設置為0;

        32、通過可訓練的嵌入映射方式構建每個類型鄰接矩陣的特征映射矩陣;

        33、對于映射實體節點i,按照關系類型聚合映射實體節點i的鄰居節點,獲得類型鄰居節點集合;

        34、基于類型鄰居節點集合和特征映射矩陣,通過共享前饋注意力機制對每種關系類型進行加權打分,獲得映射實體節點i在每種關系類型下的注意力權重;

        35、將類型鄰居節點集合中每個鄰居節點的節點特征向量通過特征映射矩陣進行線性變換,獲得每種關系類型的變換特征向量;將映射實體節點i的所有變換特征向量與對應的注意力權重進行加權聚合,獲得映射實體節點i的中間節點特征向量;

        36、在路徑感知殘差門控模塊,基于結構約束張量,獲取與映射實體節點i存在路徑連接的所有映射實體節點j,并提取映射實體節點i與映射實體節點j之間的路徑結構特征向量;

        37、設定結構權重系數,將映射實體節點i的所有路徑結構特征向量進行加權聚合,獲得映射實體節點i的的路徑結構聚合向量;

        38、將路徑結構聚合向量通過線性映射生成路徑特征向量;

        39、將映射實體節點i的中間節點特征向量與路徑特征向量相加,獲得路徑感知融合向量;

        40、將映射實體節點i的節點特征向量與路徑感知融合向量通過gru門控循環單元進行殘差融合,獲得更新節點特征向量;

        41、在語義調制邊更新模塊,將存在關系邊連接的映射實體節點對的語義嵌入向量進行拼接,并通過多層感知機進行映射變換,獲得語義調制矩陣;

        42、設定語義調制系數,對語義調制矩陣進行逐元素相乘調制,獲得調制權重矩陣,將當前映射實體節點對所對應的特征映射矩陣與調制權重矩陣進行逐元素相加,獲得調制映射矩陣;

        43、將調制映射矩陣與更新節點特征向量通過矩陣乘法進行線性變換,獲得增強語義特征向量;

        44、輸出所有映射實體節點的增強語義特征向量,獲得增強語義特征向量序列。

        45、可選的,所述步驟六具體包括:

        46、所述改進型bart網絡包括編碼器與解碼器;

        47、構建結構引導矩陣,具體為:將結構約束張量中第i個映射實體節點與第j個映射實體節點之間的路徑結構特征向量通過可訓練的結構權重向量映射為結構路徑得分,并通過sigmoid激活函數進行歸一化,獲得結構引導矩陣的第i行第j列元素值;

        48、在編碼器中,引入結構引導矩陣,對增強語義特征向量序列執行結構引導注意力運算,獲得隱藏狀態向量序列;

        49、基于映射實體節點集合和預定義的輸出目標結構,提取與各時間步語義匹配的目標實體節點嵌入向量,并將目標實體節點嵌入向量通過線性映射進行維度對齊與特征重構,轉化為實體控制向量集合;

        50、在解碼器中,初始化輸入token序列;將當前時間步之前的輸入token序列通過自注意力運算生成中間解碼特征向量,并將中間解碼特征向量和隱藏狀態向量序列通過交叉注意力運算和前饋網絡處理生成當前時間步的解碼狀態向量;

        51、將當前時間步的解碼狀態向量與實體控制向量通過可訓練的線性變換矩陣進行線性融合,并通過gelu激活函數進行門控調節,獲得門控狀態向量;

        52、將門控狀態向量通過線性映射和softmax函數生成當前時間步的預測token;

        53、通過自回歸方式重復執行生成解碼狀態向量和預測token,直至當前時間步生成的預測token為終止標記,或達到設定的最大時間步數,或滿足置信度收斂條件,輸出預測token序列。

        54、可選的,所述步驟七具體包括:

        55、將預測token序列進行解析與實體關系提取,構建生成實體集合和生成關系集合;所述生成實體集合中每個生成實體通過預訓練的transe模型進行向量化編碼,獲得生成實體嵌入向量;

        56、通過余弦相似度計算每個生成實體的生成實體嵌入向量與預定義的知識圖譜中對應的實體節點嵌入向量之間的語義相似度;

        57、設定實體一致性閾值,若語義相似度大于或等于實體一致性閾值,表示生成實體和預定義的知識圖譜中對應的實體節點匹配,否則將生成實體標記為實體不一致;

        58、將通過實體一致性驗證的生成實體進行關系判斷:若生成實體之間的生成關系存在于預定義的知識圖譜中,則表示生成關系一致,否則標記為關系沖突;

        59、提取通過實體一致性驗證和關系判斷的預測token序列,獲得語義增強token序列。

        60、本發明的有益效果是:

        61、本發明提供了一種融合深度學習與知識圖譜的數據語義增強生成方法,克服了現有技術中深度學習模型與結構先驗融合能力弱、生成內容語義一致性差和缺乏生成結果可信性驗證的問題。

        62、首先,針對原始數據樣本格式異構和語義結構復雜的問題,本發明通過構建涵蓋文本數據、結構化表格數據與半結構化數據的預處理流程,完成數據清洗、字段提取與格式標準化操作,有效提升了原始樣本向標準數據樣本轉化的適應性與穩定性。

        63、其次,本發明在語義建模階段引入語義單元識別和預訓練嵌入模型,構建出用于語義對齊與實體映射的語義嵌入向量序列;在結構建模階段,結合預定義的知識圖譜,利用實體節點嵌入與余弦相似度計算實現語義單元的實體對齊,并基于關系鄰接矩陣與廣度優先搜索提取結構路徑信息,構造路徑結構特征向量并組織為結構約束張量,從而為語義增強提供明確的實體結構先驗。

        64、此外,在語義增強建模階段,本發明采用改進型compgcn網絡對語義嵌入向量與結構約束張量進行聯合建模,引入跨關系注意力聚合模塊、路徑感知殘差門控模塊與語義調制邊更新模塊,增強了實體節點在多關系、多路徑語義關聯下的表達能力,有效提高了模型對知識圖譜中復雜結構關系的建模精度。在生成階段,本發明引入改進型bart網絡作為語義增強數據生成模型,其中編碼器引入結構引導注意力,實現對路徑結構引導的上下文建模,解碼器引入實體控制門控,通過實體控制向量參與token生成過程,提升了生成內容與知識圖譜實體語義的對應性與控制性。

        65、最后,通過對預測token序列進行實體一致性驗證與關系判斷,對生成結果進行合法性篩選,確保輸出的語義增強token序列在結構、語義與邏輯層面與知識圖譜保持一致。

        66、綜上所述,本發明提升了生成語義準確性、結構一致性和輸出可信度,能夠廣泛應用于知識增強生成、結構化數據合成與語義控制文本生成等智能任務。

        當前第1頁1 2 
        網友詢問留言 留言:0條
        • 還沒有人留言評論。精彩留言會獲得點贊!
        主站蜘蛛池模板: 91大神国内在线麻豆| 国产3P成人在线视频| 午夜精品伦理视频自拍| 国产91麻豆免费观看| 国产不卡av一区二区| 亚洲性网| 久热这里只有精品12| 国产av一区二区三区日韩| 精品久久欧美熟妇www| 无码人妻一区二区三区线花季传件| 海淀区| 成人无码h真人在线网站| 国产系列丝袜熟女精品视频| 中文字幕色av一区二区三区| 国产精品亚洲综合第一页| 久久精品国产亚洲AV麻豆甜| 成人av手机在线观看| 久久99国内精品自在现线| 在线a亚洲老鸭窝天堂| 亚洲图欧美色图另类色妞在线| 精品国产电影久久九九| 久久99精品久久久久久9| 四虎永久免费高清视频| 福利视频一区二区在线| 免费专区丝袜调教视频| 国产精品成人无码久久久久久| 国产成人国产在线观看| 久久天天躁狠狠躁夜夜2020老熟妇| 大地资源中文第二页日本| 暖暖视频日本在线观看| 在线观看亚洲不卡视频| 香蕉视频在线观看免费国产婷婷 | 亚洲国产成人麻豆精品| 九九综合九色综合网站| 国产午夜在线观看视频播放| www.yw尤物| AVwww.333.rain.无码一区二区| 中文字幕有码在线观看| 国产tsAV| 97成人精品视频在线播放 | 国产对白老熟女正在播放|