一種基于多層級語音表征的跨場景偽造語音檢測方法

文檔序號：45270944發布日期：2026-04-17 20:09閱讀：6來源：國知局

技術特征：

1.一種基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述方法包括：

2.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述偽造語音檢測模型的訓練方法包括如下步驟：

3.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述預訓練自監督學習語音表征模塊包括卷積特征提取器、維度投影單元和上下文編碼器；

4.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述層級時間注意力網絡包括高效層級注意力單元、層級求和單元、批歸一化單元、激活單元、層級維度壓縮單元、高效時間注意力單元以及統計注意力池化單元；

5.根據權利要求4所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述高效層級注意力單元包括層級權重建模子單元和層級表征重加權子單元；

6.根據權利要求4所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述高效時間注意力單元包括時間維度投影子單元、時間權重建模子單元以及時間表征重加權子單元；

7.根據權利要求4所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述統計注意力池化單元包括注意力加權子單元和統計特征提取子單元；

8.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述將預處理后的語音樣本輸入經端到端聯合訓練好的偽造語音檢測模型中，偽造語音檢測模型輸出所述語音樣本的對應的檢測結果，包括：

9.根據權利要求2所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述損失函數為：

10.根據權利要求2所述的基于多層級語音表征的跨場景偽造語音檢測方法，其特征在于，所述通過梯度下降法聯合更新自監督學習語音表征模塊、層級時間注意力網絡及輕量化分類器的參數，同時在驗證集上評估模型性能，包括：

技術總結
本發明公開了一種基于多層級語音表征的跨場景偽造語音檢測方法。該方法從待測語音源獲取語音樣本，并將其輸入經端到端聯合訓練的偽造語音檢測模型進行檢測，所述模型包括自監督學習語音表征模塊、層級時間注意力網絡和輕量化分類器。自監督學習語音表征模塊用于提取語音樣本的多層級語音表征，層級時間注意力網絡對多層級語音表征進行融合以獲得判別特征，輕量化分類器基于所述判別特征輸出真實性得分和偽造性得分，并根據得分結果確定語音樣本的檢測結論。本發明通過多層級語音表征的分層融合及端到端聯合訓練，提高了跨場景條件下偽造語音檢測的穩定性和泛化能力，有效提升了檢測準確性與可靠性。

技術研發人員：楊磊,徐小龍,段衛華,吳曉詩,羅衛蘭,王波
受保護的技術使用者：南京郵電大學
技術研發日：
技術公布日：2026/4/16

完整全部詳細技術資料下載

當前第2頁1 2

網友詢問留言留言:0條

還沒有人留言評論。精彩留言會獲得點贊！

文明留言，給您點贊！

同類技術