1.一種基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述偽造語音檢測模型的訓練方法包括如下步驟:
3.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述預訓練自監督學習語音表征模塊包括卷積特征提取器、維度投影單元和上下文編碼器;
4.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述層級時間注意力網絡包括高效層級注意力單元、層級求和單元、批歸一化單元、激活單元、層級維度壓縮單元、高效時間注意力單元以及統計注意力池化單元;
5.根據權利要求4所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述高效層級注意力單元包括層級權重建模子單元和層級表征重加權子單元;
6.根據權利要求4所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述高效時間注意力單元包括時間維度投影子單元、時間權重建模子單元以及時間表征重加權子單元;
7.根據權利要求4所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述統計注意力池化單元包括注意力加權子單元和統計特征提取子單元;
8.根據權利要求1所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述將預處理后的語音樣本輸入經端到端聯合訓練好的偽造語音檢測模型中,偽造語音檢測模型輸出所述語音樣本的對應的檢測結果,包括:
9.根據權利要求2所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述損失函數為:
10.根據權利要求2所述的基于多層級語音表征的跨場景偽造語音檢測方法,其特征在于,所述通過梯度下降法聯合更新自監督學習語音表征模塊、層級時間注意力網絡及輕量化分類器的參數,同時在驗證集上評估模型性能,包括: