車輛及其語音控制方法、裝置及存儲介質與流程

文檔序號：45269231發布日期：2026-04-17 20:03閱讀：8來源：國知局

本申請涉及車輛，尤其涉及一種車輛的語音控制方法、一種車輛的語音控制裝置、一種計算機可讀存儲介質和一種車輛。
背景技術：
4隨著智能汽車的快速發展，車載語音助手已成為人車交互的重要方式。目前主流系統通常采用asr模塊（automatic?speech?recognition，自動語音識別）、nlu模塊（natural?language?understanding，自然語言理解）與任務調度模塊串行處理的傳統架構。然而，該傳統架構在實際應用中存在明顯局限性：首先，各模塊獨立運行導致語音識別誤差在后續環節累積傳播，在車內噪聲等復雜場景下交互準確性難以保障；其次，串行處理鏈路長，系統響應延遲高，影響交互實時性；再次，各模塊耦合緊密，導致系統部署、維護及升級成本高昂，且在技術迭代或進行a/b測試時難以實現不同模塊方案的高效切換與靈活對接。因此，傳統架構難以滿足智能汽車對高效、精準、敏捷語音交互的日益增長需求。

背景技術

技術實現思路

1、本申請旨在至少在一定程度上解決相關技術中的技術問題之一。為此，本申請的第一個目的在于提出一種車輛的語音控制方法，采集用戶的語音指令；對語音指令進行初步語義識別得到初步識別結果，并根據初步識別結果確定目標解析主體；通過目標解析主體對語音指令進行語義解析，得到語音指令的指令內容與指令類型；響應于指令類型為第一預設指令類型，獲取車輛應用的狀態信息和車內場景信息，并基于狀態信息、或者狀態信息和車內場景信息確定目標車輛應用；根據指令內容向目標車輛應用發送控制指令，以控制目標車輛應用執行對應操作。本申請通過在指令解析前進行初步語義識別并據此智能分配解析執行主體，既降低了傳統asr+nlu串行架構下的誤差累積與傳播風險，顯著優化了響應時延與解析準確性；進一步地，針對車輛應用控制等復雜場景，通過實時獲取并分析車輛應用狀態，實現了在多重應用運行環境下對用戶指令的精準意圖消歧與目標應用鎖定，解決了傳統方法因缺乏上下文感知而導致的誤觸發與響應不準問題，還大幅提升了語音交互的自然度與一次成功率，從而滿足了車輛座艙對實時、準確、流暢語音交互的迫切需求。

2、本申請的第二個目的在于提出一種車輛的語音控制裝置。

3、本申請的第三個目的在于提出一種計算機可讀存儲介質。

4、本申請的第四個目的在于提出一種車輛。

5、為達到上述目的，本申請第一方面實施例提出了一種車輛的語音控制方法，采集用戶的語音指令；對語音指令進行初步語義識別得到初步識別結果，并根據初步識別結果確定目標解析主體；通過目標解析主體對語音指令進行語義解析，得到語音指令的指令內容與指令類型；響應于指令類型為第一預設指令類型，獲取車輛應用的狀態信息，并基于狀態信息、或者狀態信息和車內場景信息確定目標車輛應用；根據指令內容向目標車輛應用發送控制指令，以控制目標車輛應用執行對應操作。

6、根據本申請的一個實施例，基于狀態信息、或者狀態信息和車內場景信息確定目標車輛應用，包括：在根據狀態信息確定存在持有音頻焦點的車輛應用的情況下，將持有音頻焦點的車輛應用確定為目標車輛應用。

7、根據本申請的一個實施例，還包括：在根據狀態信息確定不存在持有音頻焦點的車輛應用的情況下，若根據狀態信息確定存在處于前臺且滿足續播條件的車輛應用，則將處于前臺且滿足續播條件的車輛應用確定為目標車輛應用。

8、根據本申請的一個實施例，基于狀態信息和車內場景信息確定目標車輛應用，包括：根據狀態信息確定不存在處于前臺的車輛應用的情況下，若根據車內場景信息確定車內存在目標乘客，則將預設車輛應用確定為目標車輛應用；若根據車內場景信息確定車內不存在目標乘客則將最后一次上報播放狀態的車輛應用確定為目標車輛應用。根據本申請的一個實施例，根據初步識別結果確定目標解析主體，包括：響應于初步識別結果指示語音指令屬于第一語義類型，將預設車端規則引擎確定為目標解析主體；響應于初步識別結果指示語音指令屬于第二語義類型，將預設云端模型引擎確定為目標解析主體。

9、根據本申請的一個實施例，對語音指令進行初步語義識別得到初步識別結果，包括：提取語音指令的語義關鍵詞特征；在語義關鍵詞特征不包含預設觸發詞的情況下，則確定初步識別結果指示語音指令屬于第一語義類型；在語義關鍵詞特征包含預設觸發詞的情況下，則確定初步識別結果指示語音指令屬于第二語義類型。

10、根據本申請的一個實施例，還包括：響應于指令類型為第二預設指令類型，確定目標車輛應用；根據指令內容向目標車輛應用發送控制指令，以控制目標車輛應用執行對應操作。

11、為達到上述目的，本申請第二方面實施例提出了一種車輛的語音控制裝置，包括：采集模塊，用于采集用戶的語音指令；第一確定模塊，用于對語音指令進行初步語義識別得到初步識別結果，并根據初步識別結果確定目標解析主體；解析模塊，用于通過目標解析主體對語音指令進行語義解析，得到語音指令的指令內容與指令類型；第二確定模塊，用于響應于指令類型為第一預設指令類型，獲取車輛應用的狀態信息和車內場景信息，并基于狀態信息、或者狀態信息和車內場景信息確定目標車輛應用；操作模塊，用于根據指令內容向目標車輛應用發送控制指令，以控制目標車輛應用執行對應操作。

12、為達到上述目的，本申請第三方面實施例提出了一種計算機可讀存儲介質，其上存儲有車輛的語音控制程序，該車輛的語音控制程序被處理器執行時實現前述的車輛的語音控制方法。

13、為達到上述目的，本申請第四方面實施例提出了一種車輛，包括存儲器、處理器及存儲在存儲器上并能夠在處理器上運行的車輛的語音控制程序，處理器執行車輛的語音控制程序時，實現前述的車輛的語音控制方法。

14、根據本申請實施例的車輛及其語音控制方法、裝置及存儲介質，采集用戶的語音指令；對語音指令進行初步語義識別得到初步識別結果，并根據初步識別結果確定目標解析主體；通過目標解析主體對語音指令進行語義解析，得到語音指令的指令內容與指令類型；響應于指令類型為第一預設指令類型，獲取車輛應用的狀態信息和車內場景信息，并基于狀態信息、或者狀態信息和車內場景信息確定目標車輛應用；根據指令內容向目標車輛應用發送控制指令，以控制目標車輛應用執行對應操作。本申請通過在指令解析前進行初步語義識別并據此智能分配解析執行主體，既降低了傳統asr+nlu串行架構下的誤差累積與傳播風險，顯著優化了響應時延與解析準確性；進一步地，針對車輛應用控制等復雜場景，通過實時獲取并分析車輛應用狀態，實現了在多重應用運行環境下對用戶指令的精準意圖消歧與目標應用鎖定，解決了傳統方法因缺乏上下文感知而導致的誤觸發與響應不準問題，還大幅提升了語音交互的自然度與一次成功率，從而滿足了車輛座艙對實時、準確、流暢語音交互的迫切需求。

技術特征：

1.一種車輛的語音控制方法，其特征在于，包括：

2.根據權利要求1所述的車輛的語音控制方法，其特征在于，基于所述狀態信息和車內場景信息確定目標車輛應用，包括：

3.根據權利要求2所述的車輛的語音控制方法，其特征在于，還包括：

4.根據權利要求3所述的車輛的語音控制方法，其特征在于，基于所述狀態信息和所述車內場景信息確定目標車輛應用，包括：

5.根據權利要求1所述的車輛的語音控制方法，其特征在于，所述根據所述初步識別結果確定目標解析主體，包括：

6.根據權利要求5所述的車輛的語音控制方法，其特征在于，所述對所述語音指令進行初步語義識別得到初步識別結果，包括：

7.根據權利要求1所述的車輛的語音控制方法，其特征在于，還包括：

8.一種車輛的語音控制裝置，其特征在于，包括：

9.一種計算機可讀存儲介質，其特征在于，其上存儲有車輛的語音控制程序，該車輛的語音控制程序被處理器執行時實現根據權利要求1-7中任一項所述的車輛的語音控制方法。

10.一種車輛，其特征在于，包括存儲器、處理器及存儲在存儲器上并能夠在處理器上運行的車輛的語音控制程序，所述處理器執行所述車輛的語音控制程序時，實現根據權利要求1-7中任一項所述的車輛的語音控制方法。

技術總結
本申請公開了一種車輛及其語音控制方法、裝置及存儲介質。采集用戶的語音指令；對語音指令進行初步語義識別得到初步識別結果，并根據初步識別結果確定目標解析主體；通過目標解析主體對語音指令進行語義解析，得到語音指令的指令內容與指令類型；響應于指令類型為第一預設指令類型，獲取車輛應用的狀態信息和車內場景信息，并基于狀態信息、或者狀態信息和車內場景信息確定目標車輛應用；根據指令內容向目標車輛應用發送控制指令，以控制目標車輛應用執行對應操作。如此，解決了傳統方法因缺乏上下文感知而導致的誤觸發與響應不準問題，還大幅提升了語音交互的自然度與一次成功率，從而滿足了車輛座艙對實時、準確、流暢語音交互的迫切需求。

技術研發人員：高德松
受保護的技術使用者：奇瑞汽車股份有限公司
技術研發日：
技術公布日：2026/4/16

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：高德松
技術所有人：奇瑞汽車股份有限公司
我是此專利的發明人

上一篇：一種車輛控制方法、裝置、電子設備及存儲介質與流程
下一篇：電子設備的制作方法

網友詢問留言留言:0條

還沒有人留言評論。精彩留言會獲得點贊！

文明留言，給您點贊！

同類技術