語音處理方法、裝置、電子設備及計算機可讀存儲介質與流程

文檔序號：45268941發布日期：2026-04-17 20:02閱讀：5來源：國知局

本申請實施例涉及但不限于語音處理，尤其涉及一種語音處理方法、裝置、電子設備及計算機可讀存儲介質。

背景技術：

1、在當前大模型應用時代，知識庫作為能夠彌補大模型在垂直域語料缺失或者更新不及時的問題。由于大模型的存在，對文檔問答應用的需求量也呈現出指數級增長，例如，在金融行業中，已經越來越多地利用智能機器人對用戶所咨詢的與金融相關的問題進行回答處理；又或者，在智慧醫療行業中，智能問診也得到了一定的推廣以及應用。為了滿足智能問答的需求，如何精準解析不同格式的文檔，并作精細化還原、切片，就成為了大模型時代知識庫建設的關鍵要素。為了解決上述問題，目前一般都是通過文檔上傳管理、文檔解析還原和語義切片等手段來建設一個完整的知識庫；然而，這種方式并不適用于企業的智能化落地，因為企業的業務場景是更多和更復雜的，并且企業不只是新場景需要進行智能化，還有大量的存量場景亟待升級；由于這樣的問題存在，也致使業務存量場景沉淀的能力無法復用，增加了新邏輯的開發工作量。

技術實現思路

1、以下是對本文詳細描述的主題的概述。本概述并非是為了限制權利要求的保護范圍。

2、為了解決上述背景技術中提到的問題，本申請實施例提供了一種語音處理方法、裝置、電子設備及計算機可讀存儲介質，能夠復用歷史數據，減輕開發的工作量。

3、第一方面，本申請實施例提供了一種語音處理方法，所述語音處理方法包括：

4、獲取用戶語音信號；

5、對所述用戶語音信號進行文本識別處理，得到語音識別文本；

6、對所述語音識別文本進行擴充改寫處理，得到語音修正文本；

7、對所述語音修正文本進行增強檢索生成處理，得到文本檢索關鍵信息，并且對所述文本檢索關鍵信息進行向量化處理，得到文本檢索關鍵向量；

8、根據所述文本檢索關鍵向量與預設的數據庫進行匹配召回處理，得到多個召回片段信息，其中，所述數據庫與預設的若干個歷史數據解析模型外接；

9、對多個所述召回片段信息進行重排序處理，得到調整召回信息；

10、將所述調整召回信息輸入至預設的大模型進行優化整合處理，得到智能回答結果。

11、第二方面，本申請實施例還提供了一種語音處理裝置，所述負語音處理裝置包括：

12、獲取單元，用于獲取用戶語音信號；

13、識別單元，用于對所述用戶語音信號進行文本識別處理，得到語音識別文本；

14、修正單元，用于對所述語音識別文本進行擴充改寫處理，得到語音修正文本；

15、執行單元，用于對所述語音修正文本進行增強檢索生成處理，得到文本檢索關鍵信息，并且對所述文本檢索關鍵信息進行向量化處理，得到文本檢索關鍵向量；

16、匹配單元，用于根據所述文本檢索關鍵向量與預設的數據庫進行匹配召回處理，得到多個召回片段信息，其中，所述數據庫與預設的若干個歷史數據解析模型外接；

17、排序單元，用于對多個所述召回片段信息進行重排序處理，得到調整召回信息；

18、整合單元，用于將所述調整召回信息輸入至預設的大模型進行優化整合處理，得到智能回答結果。

19、第三方面，本申請實施例還提供了一種電子設備，包括：存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，所述處理器執行所述計算機程序時實現如上第一方面所述的語音處理方法。

20、第四方面，本申請實施例還提供了一種計算機可讀存儲介質，存儲有計算機可執行指令，所述計算機可執行指令用于執行如上第一方面所述的語音處理方法。

21、根據本申請提供的實施例的語音處理方法，至少具有如下有益效果：在進行語音處理的過程中，首先獲取用戶語音信號；接著對用戶語音信號進行文本識別處理以得到語音識別文本；接著對語音識別文本進行擴充改寫處理以得到語音修正文本；接著對語音修正文本進行增強檢索生成處理，從而得到文本檢索關鍵信息，并且對文本檢索關鍵信息進行向量化處理得到文本檢索關鍵向量；接著根據文本檢索關鍵向量與預設的數據庫進行匹配召回處理，得到多個召回片段信息，其中，數據庫與預設的若干個歷史數據解析模型外接；接著對多個召回片段信息進行重新排序處理，從而得到調整召回信息；最后將調整召回信息輸入到預設的大模型進行優化整合處理就可以得到智能回答結果。通過上述技術方案，能夠在語音處理的過程中復用歷史數據，從而可以很好地減輕開發的工作量。

技術特征：

1.一種語音處理方法，其特征在于，所述語音處理方法包括：

2.根據權利要求1所述的語音處理方法，其特征在于，所述對所述用戶語音信號進行文本識別處理，得到語音識別文本，包括：

3.根據權利要求1所述的語音處理方法，其特征在于，所述對所述語音識別文本進行擴充改寫處理，得到語音修正文本，包括：

4.根據權利要求1所述的語音處理方法，其特征在于，所述對所述語音修正文本進行增強檢索生成處理，得到文本檢索關鍵信息，包括：

5.根據權利要求1所述的語音處理方法，其特征在于，所述根據所述文本檢索關鍵向量與預設的數據庫進行匹配召回處理，得到多個召回片段信息，包括：

6.根據權利要求1所述的語音處理方法，其特征在于，所述對多個所述召回片段信息進行重排序處理，得到調整召回信息，包括：

7.根據權利要求1所述的語音處理方法，其特征在于，所述將所述調整召回信息輸入至預設的大模型進行優化整合處理，得到智能回答結果，包括：

8.一種語音處理裝置，其特征在于，所述負語音處理裝置包括：

9.一種電子設備，包括：存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，其特征在于，所述處理器執行所述計算機程序時實現如權利要求1至7中任意一項所述的語音處理方法。

10.一種計算機可讀存儲介質，存儲有計算機可執行指令，其特征在于，所述計算機可執行指令用于執行權利要求1至7中任意一項所述的語音處理方法。

技術總結
本申請涉及語音處理技術領域及智慧醫療和金融科技領域，提供了一種語音處理方法、裝置、電子設備及計算機可讀存儲介質，方法包括：獲取用戶語音信號；對語音修正文本進行增強檢索生成處理，得到文本檢索關鍵信息，并且對文本檢索關鍵信息進行向量化處理，得到文本檢索關鍵向量；根據文本檢索關鍵向量與預設的數據庫進行匹配召回處理，得到多個召回片段信息，其中，數據庫與預設的若干個歷史數據解析模型外接；對多個召回片段信息進行重排序處理，得到調整召回信息；將調整召回信息輸入至預設的大模型進行優化整合處理，得到智能回答結果。通過上述技術方案，能夠復用歷史數據，減輕開發的工作量。

技術研發人員：趙思思,朱明,孔祥成,陳又新
受保護的技術使用者：平安科技（深圳）有限公司
技術研發日：
技術公布日：2026/4/16

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：趙思思,朱明,孔祥成,陳又新
技術所有人：平安科技（深圳）有限公司
我是此專利的發明人

網友詢問留言留言:0條

還沒有人留言評論。精彩留言會獲得點贊！

文明留言，給您點贊！

同類技術