背景技術:
1、在視頻共享平臺上,許多視頻包括用戶修改的音樂。該音樂可以以多種方式修改,諸如通過改變歌手或樂器演奏者、重新混合音樂、修改節奏或修改節拍。上傳到視頻共享平臺的一些修改的音樂同時地或在視頻的不同部分利用多種此類技術。
2、有時對上傳到視頻共享平臺的視頻執行音樂標識。例如,音樂標識可用于標識具有相同音樂曲目的視頻。附加地或備選地,可以執行音樂標識以生成諸如在視頻描述標頭或頁腳中或在播放列表的概述中顯示給用戶的曲目標簽。然而,如下所述,音樂標識技術通常不能正確地確定兩個音頻樣本是同一歌曲,并且因此存在改進當前音樂標識技術的機會。
技術實現思路
1、根據本公開的一個方面,提供了一種計算系統,包括被配置為接收第一音頻樣本和第二音頻樣本的一個或多個處理設備。一個或多個處理設備還被配置為至少部分地通過從第一音頻樣本中提取第一音頻特征集以及從第二音頻樣本中提取第二音頻特征集來確定第一音頻樣本和第二音頻樣本之間的變速比。確定變速比還包括計算包括第一音頻特征集和第二音頻特征集之間的多個相似度值的相似度矩陣。確定變速比還包括標識相似度矩陣中的多個峰值點。確定變速比還包括標識一個或多個峰值線,各自包括峰值點中的兩個或更多個峰值點。確定變速比還包括至少部分地基于一個或多個峰值線的一個或多個相應斜率來計算變速比。一個或多個處理設備還被配置為輸出變速比。
2、提供本
技術實現要素:
來以簡化的形式介紹以下在具體實施方式中進一步描述的一些概念。本發明內容不旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在用于限制所要求保護的主題的范圍。此外,所要求保護的主題不限于解決本公開的任何部分中指出的任何或所有缺點的實施方式。
1.一種計算系統,包括:
2.根據權利要求1所述的計算系統,其中所述一個或多個處理設備被配置為,在特征提取神經網絡處提取所述第一音頻特征集和所述第二音頻特征集。
3.根據權利要求1所述的計算系統,其中所述一個或多個處理設備被配置為,將所述多個峰值點標識為所述相似度矩陣中所包括的k個最高相似度值,其中k是預定義的峰值計數。
4.根據權利要求1所述的計算系統,其中所述一個或多個處理設備被配置為:
5.?根據權利要求4所述的計算系統,其中:
6.根據權利要求5所述的計算系統,其中,在所述多個過濾階段中的第二過濾階段,計算所述過濾列表還包括:針對所述第一階段過濾列表中所包括的所述候選峰值集中的每個候選峰值,
7.根據權利要求6所述的計算系統,其中,在所述多個過濾階段中的第三過濾階段,計算所述過濾列表還包括:
8.?根據權利要求1所述的計算系統,其中所述一個或多個處理設備被配置為,至少部分地通過以下來標識所述一個或多個峰值線:針對包括在所述多個峰值點的子集中的每個峰值點,
9.根據權利要求8所述的計算系統,其中標識所述一個或多個峰值線還包括:針對所述候選線圖中的每個候選線圖,針對多個其他候選端點中的每個其他候選端點,
10.根據權利要求9所述的計算系統,其中,在針對所述候選線圖中的每個候選線圖迭代遍歷所述多個候選端點之后,標識所述一個或多個峰值線還包括:
11.一種用于計算系統使用的方法,所述方法包括:
12.根據權利要求11所述的方法,其中所述第一音頻特征集和所述第二音頻特征集在特征提取神經網絡處從所述第一音頻樣本和所述第二音頻樣本中被提取。
13.根據權利要求11所述的方法,其中:
14.?根據權利要求13所述的方法,其中:
15.根據權利要求14所述的方法,其中,在所述多個過濾階段中的第二過濾階段,計算所述過濾列表還包括:針對所述第一階段過濾列表中所包括的所述候選峰值集中的每個候選峰值集,
16.根據權利要求15所述的方法,其中,在所述多個過濾階段中的第三過濾階段,計算所述過濾列表還包括:
17.?根據權利要求11所述的方法,其中標識所述一個或多個峰值線包括:針對包括在所述多個峰值點的子集中的每個峰值點,
18.根據權利要求17所述的方法,其中標識所述一個或多個峰值線還包括:針對所述候選線圖中的每個候選線圖,針對多個其他候選端點中的每個其他候選端點,
19.根據權利要求18所述的方法,其中,在針對所述候選線圖中的每個候選線圖迭代遍歷所述多個候選端點之后,標識所述一個或多個峰值線還包括:
20.一種計算系統,包括: