1. <rt id="e600n"></rt>
      1. <pre id="e600n"><strong id="e600n"><pre id="e600n"></pre></strong></pre>
      2. 岛国免费AV,无码人妻精品一区二区三区夜夜嗨,又大又粗又硬又爽黄毛少妇,精品国产AV二区,91视频最新网址,久操无码,久久无码人妻一区二区三区午夜,国产精品视频中文字幕

        免注冊聲紋通話降噪方法、電子設備和存儲介質與流程

        文檔序號:40839969發布日期:2025-02-06 17:15閱讀:213來源:國知局
        技術簡介:
        本發明針對現有聲紋降噪技術在嘈雜環境和多人會議中聚類注冊不準確、干擾人聲誤入主講人信息導致降噪效果差的問題,提出免注冊聲紋降噪方法。通過實時通話音頻聚類獲取主講人樣本,基于樣本數據最多類別的音頻進行聲紋注冊,輔助降噪神經網絡學習聲紋特征差異,實現動態抑制干擾人聲和非平穩噪聲,提升通話清晰度。
        關鍵詞:免注冊聲紋降噪,實時聚類

        本發明屬于通話降噪,尤其涉及免注冊聲紋通話降噪方法、電子設備和存儲介質。


        背景技術:

        1、相關產品:聯想pc個性化通話降噪、華為pc靜謐空間、榮耀magicpad2?ai聲紋降噪等。相關技術:deep?attractor?network(danet)深度吸引子網絡、dual-path?rnn?(dprnn)雙路徑循環神經網絡、speakerbeam說話人提取算法、voicefilter語音分離模型、audio-visual?speech?enhancement?(avse)音頻-視覺語音增強。

        2、對于現有的技術或產品在通話過程中進行聚類注冊,在環境比較嘈雜的場景、多人參與的會議場景很難通過聲紋聚類得到比較純凈的主講人語音,聚類出信噪比較低的音頻、有干擾的主講人音頻、其他干擾人音頻。會對主講人會有抑制。現階段實時聲紋降噪對同行干擾,多人同時講話時性能不理想。基于神經網路的算法存在噪聲無法消除現象,無法準確和及時地估得突變的非平穩噪聲,無法準確的消除訓練集中未見過的噪聲,如貓狗叫、蟬鳴噪聲等等。

        3、發明人發現,上述技術聚類不準確,導致其他干擾人聲誤闖到主講人的注冊信息中,這樣注冊好聲紋后就會包含多個說話人信息。對主講人通話可能有影響、此外對抑制干擾人性能降低。聲紋降噪本身難度較大、流式聲紋降噪對時延要求嚴格、尤其是同行干擾人影響時,性能一般較差。非平穩噪聲無法及時去除。


        技術實現思路

        1、本發明實施例提供一種免注冊聲紋降噪方法、電子設備和存儲介質,用于至少解決上述技術問題之一。

        2、第一方面,本發明實施例提供一種免注冊聲紋降噪方法,包括:獲取實時通話過程中滿足總時長閾值的有效音頻,對所述有效音頻進行聚類,得到至少一類樣本點;獲取所述至少一類樣本點中樣本數據最多的一類樣本點,并將所述樣本數據最多的一類樣本點的有效音頻拼接進行聲紋注冊,得到聲紋信息,其中,所述樣本數據最多的一類樣本點的有效音頻為通話主講人的音頻;基于所述聲紋信息對訓練完成的降噪神經網絡進行輔助,使所述降噪神經網絡學習所述聲紋信息中每幀的聲紋特征的差異,得到降噪后的主講人音頻。

        3、第二方面,本發明實施例還提供一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行第一方面所述方法的步驟。

        4、第三方面,本發明實施例還提供一種存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現第一方面所述方法的步驟。

        5、在本申請實施例的方法中,免注冊聲紋降噪,即在實時語音傳播的過程中,無需提前注冊說話人的聲紋信息,就可以只保留該說話人的音頻,過濾掉其他說話人的語音。在語音交互的過程中,通過無感注冊主講人聲紋即可更好的抑制干擾人聲和噪聲。在通話過程中,免注冊說話人身份,另一端依然可以清晰的聽到注冊說話人的聲音,不受其他人的人聲干擾。可以很好的保留注冊說話人的音頻有效的抑制其他說話人的干擾。



        技術特征:

        1.一種免注冊聲紋通話降噪方法,包括:

        2.根據權利要求1所述的方法,其中,所述對所述有效音頻進行聚類,包括:

        3.根據權利要求2所述的方法,其中,對所述有效音頻進行聚類,還包括:

        4.根據權利要求3所述的方法,其中,在所述對分幀處理后保留的音頻進行特征提取之后,包括:

        5.根據權利要求1所述的方法,其中,所述降噪神經網絡包括編碼器、即插即用單元和解碼器,所述降噪神經網絡訓練時用到的損失函數包括預測出的音頻和干凈音頻的尺度不變信噪比。

        6.根據權利要求1所述的方法,其中,所述降噪神經網絡的訓練方法包括:

        7.根據權利要求6所述的方法,其中,所述將預設數據轉換成帶噪音頻,包括:

        8.根據權利要求1所述的方法,其中,所述基于所述聲紋信息對訓練完成的降噪神經網絡進行輔助,使所述降噪神經網絡學習所述聲紋信息中每幀的聲紋特征的差異,包括:

        9.一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求2至8任一項所述方法的步驟。

        10.一種存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現權利要求2至8任一項所述方法的步驟。


        技術總結
        本申請實施例公開免注冊聲紋通話降噪方法、電子設備和存儲介質,包括:獲取實時通話過程中滿足總時長閾值的有效音頻,對所述有效音頻進行聚類,得到至少一類樣本點;獲取所述至少一類樣本點中樣本數據最多的一類樣本點,并將所述樣本數據最多的一類樣本點的有效音頻拼接進行聲紋注冊,得到聲紋信息,其中,所述樣本數據最多的一類樣本點的有效音頻為通話主講人的音頻;基于所述聲紋信息對訓練完成的降噪神經網絡進行輔助,使所述降噪神經網絡學習所述聲紋信息中每幀的聲紋特征的差異,得到降噪后的主講人音頻。

        技術研發人員:趙飛,周強,薛峰
        受保護的技術使用者:思必馳科技股份有限公司
        技術研發日:
        技術公布日:2025/2/5
        網友詢問留言 留言:0條
        • 還沒有人留言評論。精彩留言會獲得點贊!
        主站蜘蛛池模板: 日韩欧美一级特黄大片| 日本久久久久亚洲中字幕| 91黄视频在线观看| 尤物视频免费在线观看 | 欧美日韩亚洲TV不卡久久| 日韩91| 欧美精品中文字幕一区| AV区无码字幕中文色| 国产精品美女久久久久久麻豆| 国产亚洲精品成人a| 成人瑟瑟| 精品国产国语对白久久免费| 福利视频一区二区在线| 永久免费看mv网站入口| 无码专区视频精品老司机| 久久99久久99精品免视看动漫| av高清| 久久精品国产高潮国产夫妻| 91精品国产成人观看| 69午夜福利| 欧美日韩亚洲国产一区二区综合| 998av资源影音先锋| 国产黄色一区二区三区四区| 麻豆熟妇乱妇熟色A片在线看| 九九国产在线| 国产哺乳奶水91在线播放| 亚洲av永久无码精品水牛影视| 日韩高清福利视频在线观看| 老熟妇一区二区三区啪啪| 亚洲精品乱码久久久久久按摩高清| 国产嫖妓一区二区三区无码| 男人又大又硬又粗视频| 老色批国产在线观看精品| 国产美女久久久久久| 香蕉人人超人人超碰超国产| 99精品无码一区二区| 久青草免费在线视频| 欧美不卡无线在线一二三区观| 中文字幕乱码一区二区免费| 96视频亚洲| 韩国精品一区二区三区|