確定音頻樣本的變速比的制作方法

文檔序號：45067488發布日期：2026-03-31 22:11閱讀：8來源：國知局

技術簡介：
現有音樂識別技術難以準確識別經變速處理的音頻樣本，導致視頻平臺無法有效關聯相同曲目。本專利通過提取音頻特征構建相似度矩陣，識別峰值點與峰值線，基于峰值線斜率計算變速比，從而提升變速音頻的識別精度。
關鍵詞：音頻變速比識別,音樂特征分析

背景技術：

1、在視頻共享平臺上，許多視頻包括用戶修改的音樂。該音樂可以以多種方式修改，諸如通過改變歌手或樂器演奏者、重新混合音樂、修改節奏或修改節拍。上傳到視頻共享平臺的一些修改的音樂同時地或在視頻的不同部分利用多種此類技術。

2、有時對上傳到視頻共享平臺的視頻執行音樂標識。例如，音樂標識可用于標識具有相同音樂曲目的視頻。附加地或備選地，可以執行音樂標識以生成諸如在視頻描述標頭或頁腳中或在播放列表的概述中顯示給用戶的曲目標簽。然而，如下所述，音樂標識技術通常不能正確地確定兩個音頻樣本是同一歌曲，并且因此存在改進當前音樂標識技術的機會。

技術實現思路

1、根據本公開的一個方面，提供了一種計算系統，包括被配置為接收第一音頻樣本和第二音頻樣本的一個或多個處理設備。一個或多個處理設備還被配置為至少部分地通過從第一音頻樣本中提取第一音頻特征集以及從第二音頻樣本中提取第二音頻特征集來確定第一音頻樣本和第二音頻樣本之間的變速比。確定變速比還包括計算包括第一音頻特征集和第二音頻特征集之間的多個相似度值的相似度矩陣。確定變速比還包括標識相似度矩陣中的多個峰值點。確定變速比還包括標識一個或多個峰值線，各自包括峰值點中的兩個或更多個峰值點。確定變速比還包括至少部分地基于一個或多個峰值線的一個或多個相應斜率來計算變速比。一個或多個處理設備還被配置為輸出變速比。

2、提供本
技術實現要素：
來以簡化的形式介紹以下在具體實施方式中進一步描述的一些概念。本發明內容不旨在標識所要求保護的主題的關鍵特征或必要特征，也不旨在用于限制所要求保護的主題的范圍。此外，所要求保護的主題不限于解決本公開的任何部分中指出的任何或所有缺點的實施方式。

技術特征：

1.一種計算系統，包括：

2.根據權利要求1所述的計算系統，其中所述一個或多個處理設備被配置為，在特征提取神經網絡處提取所述第一音頻特征集和所述第二音頻特征集。

3.根據權利要求1所述的計算系統，其中所述一個或多個處理設備被配置為，將所述多個峰值點標識為所述相似度矩陣中所包括的k個最高相似度值，其中k是預定義的峰值計數。

4.根據權利要求1所述的計算系統，其中所述一個或多個處理設備被配置為：

5.?根據權利要求4所述的計算系統，其中：

6.根據權利要求5所述的計算系統，其中，在所述多個過濾階段中的第二過濾階段，計算所述過濾列表還包括：針對所述第一階段過濾列表中所包括的所述候選峰值集中的每個候選峰值，

7.根據權利要求6所述的計算系統，其中，在所述多個過濾階段中的第三過濾階段，計算所述過濾列表還包括：

8.?根據權利要求1所述的計算系統，其中所述一個或多個處理設備被配置為，至少部分地通過以下來標識所述一個或多個峰值線：針對包括在所述多個峰值點的子集中的每個峰值點，

9.根據權利要求8所述的計算系統，其中標識所述一個或多個峰值線還包括：針對所述候選線圖中的每個候選線圖，針對多個其他候選端點中的每個其他候選端點，

10.根據權利要求9所述的計算系統，其中，在針對所述候選線圖中的每個候選線圖迭代遍歷所述多個候選端點之后，標識所述一個或多個峰值線還包括：

11.一種用于計算系統使用的方法，所述方法包括：

12.根據權利要求11所述的方法，其中所述第一音頻特征集和所述第二音頻特征集在特征提取神經網絡處從所述第一音頻樣本和所述第二音頻樣本中被提取。

13.根據權利要求11所述的方法，其中：

14.?根據權利要求13所述的方法，其中：

15.根據權利要求14所述的方法，其中，在所述多個過濾階段中的第二過濾階段，計算所述過濾列表還包括：針對所述第一階段過濾列表中所包括的所述候選峰值集中的每個候選峰值集，

16.根據權利要求15所述的方法，其中，在所述多個過濾階段中的第三過濾階段，計算所述過濾列表還包括：

17.?根據權利要求11所述的方法，其中標識所述一個或多個峰值線包括：針對包括在所述多個峰值點的子集中的每個峰值點，

18.根據權利要求17所述的方法，其中標識所述一個或多個峰值線還包括：針對所述候選線圖中的每個候選線圖，針對多個其他候選端點中的每個其他候選端點，

19.根據權利要求18所述的方法，其中，在針對所述候選線圖中的每個候選線圖迭代遍歷所述多個候選端點之后，標識所述一個或多個峰值線還包括：

20.一種計算系統，包括：

技術總結
計算系統包括被配置為接收第一音頻樣本和第二音頻樣本的一個或多個處理設備。一個或多個處理設備至少部分地通過從第一音頻樣本中提取第一音頻特征以及從第二音頻樣本中提取第二音頻特征來確定第一音頻樣本和第二音頻樣本之間的變速比。確定變速比還包括計算第一音頻特征集和第二音頻特征集之間的相似度矩陣。確定變速比還包括標識相似度矩陣中的峰值點和標識一個或多個峰值線。確定變速比還包括至少部分地基于一個或多個峰值線的相應斜率來計算變速比。一個或多個處理設備輸出變速比。

技術研發人員：蔣敬,劉榮榮
受保護的技術使用者：北京字跳網絡技術有限公司
技術研發日：
技術公布日：2026/3/30

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：蔣敬,劉榮榮
技術所有人：北京字跳網絡技術有限公司
我是此專利的發明人

相關技術

一種音頻分析處理系統的制作方法

一種音樂版權識別方法、系統、設備及存儲介質與流程

本技術針對現有音樂版權識別中人工審核效率低、音頻指紋技術對改編音樂識別能力不足、缺乏綜合分析等問題，提出基于CNN和注意力機制的多維音頻特征分析方法。通過提取頻譜、節奏、旋律等多維度特征，結合動態權...

一種音樂監測分析方法、服務器及存儲介質與流程

一種用于差異定位的音頻分析方法及系統

針對傳統音頻差異分析方法存在的計算負擔重、分析速度慢及抗噪性差問題，提出三級分層分析方案：通過物理特征比對定位無差異時刻，結合語義偏差與音程偏差分析逐步精確定位差異，減少冗余數據處理，提升定位...

一種音樂作品自動分類方法及系統

針對現有音樂分類技術依賴靜態特征、忽略動態變化導致的分類不準確問題，提出基于音樂流派層級結構與和弦動態特征的分類方法。通過分析流派層級權重、提取和弦頻率與時長變化規律，構建動態匹配規則，實現對...

音頻數據的音律解析播放方法、設備及存儲介質與流程

音頻指紋提取方法、服務器、存儲介質與流程

內容處理設備和用于發送可變大小的片段的方法

針對傳統音頻處理中音樂識別效率低、片段劃分不精準的問題，提出通過分析音頻信號中音樂信息與噪聲/語音等的比率，確定特征片段并動態調整片段大小，結合分組發送和優先級排序策略，提升識別準確性和處理效...

一種音頻類別的實時識別方法及裝置的制作方法

針對傳統音頻分類方法在實時性與準確性上的不足，提出基于實倒譜分析的多特征閾值識別方案。通過計算音頻信號的短時能量均方根判斷靜音狀態，利用實倒譜提取LPH/PCT、APD、TNR、RNT等特征參...

網友詢問留言留言:0條

還沒有人留言評論。精彩留言會獲得點贊！

文明留言，給您點贊！

同類技術

相關技術