本發明涉及語音,尤其涉及一種語音喚醒方法及裝置。
背景技術:
1、隨著物聯網技術的飛速發展,智能家居及智能設備已逐漸融入人們的日常生活,其中,語音喚醒技術作為人機交互的重要手段,極大地提升了用戶操作的便捷性。然而,現有技術中的語音喚醒功能在實際應用中仍面臨諸多挑戰與不足。
2、現有技術中,針對多設備共存的環境,如現代家庭中常配置有多臺支持語音交互的智能設備,當用戶在同一空間內對特定設備進行語音指令時,由于語音信號的廣泛傳播特性,往往導致非目標設備也接收到指令并產生響應,或者在非人為直接交互的場景下,如家庭環境中播放的音樂或電視內容中包含智能設備的啟動關鍵詞時,智能設備可能會被異常喚醒,語音喚醒準確性和智能性較差,給用戶體驗或使用造成不便。因此,提出一種能夠提高用戶和設備之間的語音交互性能的技術方案顯得尤為重要。
技術實現思路
1、本發明提供了一種語音喚醒方法及裝置,能夠有利于提高用戶和設備之間的語音交互性能。
2、為了解決上述技術問題,本發明第一方面公開了一種語音喚醒方法,所述方法包括:
3、當檢測到目標用戶在至少一臺語音交互設備所處的目標空間中發出語音指令時,對于每臺所述語音交互設備,獲取該語音交互設備檢測到的所述目標用戶相對于該語音交互設備的目標信息,所述目標信息包括該語音交互設備檢測到的所述目標用戶的活體指示信息以及所述目標用戶相對于該語音交互設備的空間信息;
4、根據所述目標用戶相對于每臺所述語音交互設備的所述目標信息,在每臺所述語音交互設備中確定至少一臺目標激活設備,并控制每臺所述目標激活設備響應所述目標用戶發出的所述語音指令。
5、作為一種可選的實施方式,在本發明第一方面中,所述根據所述目標用戶相對于每臺所述語音交互設備的所述目標信息,在每臺所述語音交互設備中確定至少一臺目標激活設備,包括:
6、對于每臺所述語音交互設備,判斷該語音交互設備檢測到的所述目標用戶的活體指示信息是否滿足預設的活體檢測要求,當所述活體指示信息滿足所述活體檢測要求時,確定該語音交互設備為備選語音交互設備;
7、根據每臺所述備選語音交互設備對應的所述空間信息,在每臺所述備選語音交互設備中確定至少一臺目標激活設備。
8、作為一種可選的實施方式,在本發明第一方面中,每臺所述備選語音交互設備對應的所述空間信息包括所述目標用戶相對于該備選語音交互設備的方向夾角信息以及聲源距離信息;
9、所述根據每臺所述備選語音交互設備對應的所述空間信息,在每臺所述備選語音交互設備中確定至少一臺目標激活設備,包括:
10、對于每臺所述備選語音交互設備,根據該備選語音交互設備對應的所述方向夾角信息和所述聲源距離信息,確定該備選語音交互設備的激活優先級;
11、對于每臺所述備選語音交互設備,判斷該備選語音交互設備的激活優先級是否滿足預設的激活條件,當該備選語音交互設備的激活優先級滿足所述激活條件時,確定該備選語音交互設備為目標激活設備。
12、作為一種可選的實施方式,在本發明第一方面中,所述對于每臺所述語音交互設備,獲取該語音交互設備檢測到的所述目標用戶相對于該語音交互設備的目標信息,包括:
13、對于每臺所述語音交互設備,基于該語音交互設備中預設的傳感器單元檢測所述目標用戶的用戶運動信息,并基于該語音交互設備中預設的麥克風單元檢測所述目標用戶的用戶語音信息,所述用戶運動信息包括用戶軌跡信息和用戶連續微動信息;
14、對于每臺所述語音交互設備,根據所述用戶運動信息確定所述目標用戶的活體指示信息,并根據所述用戶運動信息或所述用戶語音信息確定所述目標用戶相對于該語音交互設備的空間信息。
15、作為一種可選的實施方式,在本發明第一方面中,所述對于每臺所述備選語音交互設備,判斷該備選語音交互設備的激活優先級是否滿足預設的激活條件,當該備選語音交互設備的激活優先級滿足所述激活條件時,確定該備選語音交互設備為目標激活設備,包括:
16、確定所述目標空間的網絡實現類型,所述網絡實現類型包括云端網絡類型和本地網絡類型;
17、當所述網絡實現類型包括所述云端網絡類型時,在云端網絡中確定滿足第一子激活條件的第一目標激活優先級對應的所述備選語音交互設備為目標激活設備;
18、在所述云端網絡中確定針對每個所述目標激活設備的激活指令,并基于所述云端網絡向每個所述目標激活設備發送所述激活指令;
19、當所述網絡實現類型包括所述本地網絡類型時,在本地網絡中廣播每臺所述備選語音交互設備的激活優先級,并確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備。
20、作為一種可選的實施方式,在本發明第一方面中,所述當所述網絡實現類型包括所述本地網絡類型時,在本地網絡中廣播每臺所述備選語音交互設備的激活優先級,并確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備,包括:
21、當所述網絡實現類型包括所述本地網絡類型時,對于每臺所述備選語音交互設備,賦予該備選語音交互設備在本地網絡中的廣播令牌,并判斷該備選語音交互設備的激活優先級是否大于所述本地網絡中的其他備選語音交互設備的激活優先級;
22、對于每臺所述備選語音交互設備,當該備選語音交互設備的激活優先級大于所述本地網絡中的其他備選語音交互設備的激活優先級時,根據該備選語音交互設備的激活優先級和所述目標用戶相對于該語音交互設備的空間信息,生成該語音交互設備的廣播信息,并根據所述廣播令牌向所述本地網絡中廣播該備選語音交互設備的廣播信息;
23、在所述本地網絡中確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備。
24、作為一種可選的實施方式,在本發明第一方面中,每個所述備選語音交互設備的廣播信息包括該備選語音交互設備的激活優先級,還包括該備選語音交互設備的方向夾角信息和/或聲源距離信息;
25、所述在所述本地網絡中確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備,包括:
26、在所述本地網絡中確定每個所述備選語音交互設備的廣播信息,并根據每個所述備選語音交互設備的廣播信息,確定每個所述備選語音交互設備的加權權重;
27、對于每個所述備選語音交互設備,根據該備選語音交互設備的激活優先級和加權權重,判斷該備選語音交互設備的激活優先級是否滿足第二子激活條件,當該備選語音交互設備的激活優先級滿足第二子激活條件時,確定該備選語音交互設備為目標激活設備。
28、本發明第二方面公開了一種語音喚醒裝置,所述裝置包括:
29、獲取模塊,用于當檢測到目標用戶在至少一臺語音交互設備所處的目標空間中發出語音指令時,對于每臺所述語音交互設備,獲取該語音交互設備檢測到的所述目標用戶相對于該語音交互設備的目標信息,所述目標信息包括該語音交互設備檢測到的所述目標用戶的活體指示信息以及所述目標用戶相對于該語音交互設備的空間信息;
30、確定模塊,用于根據所述目標用戶相對于每臺所述語音交互設備的所述目標信息,在每臺所述語音交互設備中確定至少一臺目標激活設備,并控制每臺所述目標激活設備響應所述目標用戶發出的所述語音指令。
31、作為一種可選的實施方式,在本發明第二方面中,所述確定模塊根據所述目標用戶相對于每臺所述語音交互設備的所述目標信息,在每臺所述語音交互設備中確定至少一臺目標激活設備的方式具體包括:
32、對于每臺所述語音交互設備,判斷該語音交互設備檢測到的所述目標用戶的活體指示信息是否滿足預設的活體檢測要求,當所述活體指示信息滿足所述活體檢測要求時,確定該語音交互設備為備選語音交互設備;
33、根據每臺所述備選語音交互設備對應的所述空間信息,在每臺所述備選語音交互設備中確定至少一臺目標激活設備。
34、作為一種可選的實施方式,在本發明第二方面中,每臺所述備選語音交互設備對應的所述空間信息包括所述目標用戶相對于該備選語音交互設備的方向夾角信息以及聲源距離信息;
35、所述確定模塊根據每臺所述備選語音交互設備對應的所述空間信息,在每臺所述備選語音交互設備中確定至少一臺目標激活設備的方式具體包括:
36、對于每臺所述備選語音交互設備,根據該備選語音交互設備對應的所述方向夾角信息和所述聲源距離信息,確定該備選語音交互設備的激活優先級;
37、對于每臺所述備選語音交互設備,判斷該備選語音交互設備的激活優先級是否滿足預設的激活條件,當該備選語音交互設備的激活優先級滿足所述激活條件時,確定該備選語音交互設備為目標激活設備。
38、作為一種可選的實施方式,在本發明第二方面中,所述獲取模塊對于每臺所述語音交互設備,獲取該語音交互設備檢測到的所述目標用戶相對于該語音交互設備的目標信息的方式具體包括:
39、對于每臺所述語音交互設備,基于該語音交互設備中預設的傳感器單元檢測所述目標用戶的用戶運動信息,并基于該語音交互設備中預設的麥克風單元檢測所述目標用戶的用戶語音信息,所述用戶運動信息包括用戶軌跡信息和用戶連續微動信息;
40、對于每臺所述語音交互設備,根據所述用戶運動信息確定所述目標用戶的活體指示信息,并根據所述用戶運動信息或所述用戶語音信息確定所述目標用戶相對于該語音交互設備的空間信息。
41、作為一種可選的實施方式,在本發明第二方面中,所述確定模塊對于每臺所述備選語音交互設備,判斷該備選語音交互設備的激活優先級是否滿足預設的激活條件,當該備選語音交互設備的激活優先級滿足所述激活條件時,確定該備選語音交互設備為目標激活設備的方式具體包括:
42、確定所述目標空間的網絡實現類型,所述網絡實現類型包括云端網絡類型和本地網絡類型;
43、當所述網絡實現類型包括所述云端網絡類型時,在云端網絡中確定滿足第一子激活條件的第一目標激活優先級對應的所述備選語音交互設備為目標激活設備;
44、在所述云端網絡中確定針對每個所述目標激活設備的激活指令,并基于所述云端網絡向每個所述目標激活設備發送所述激活指令;
45、當所述網絡實現類型包括所述本地網絡類型時,在本地網絡中廣播每臺所述備選語音交互設備的激活優先級,并確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備。
46、作為一種可選的實施方式,在本發明第二方面中,所述確定模塊當所述網絡實現類型包括所述本地網絡類型時,在本地網絡中廣播每臺所述備選語音交互設備的激活優先級,并確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備的方式具體包括:
47、當所述網絡實現類型包括所述本地網絡類型時,對于每臺所述備選語音交互設備,賦予該備選語音交互設備在本地網絡中的廣播令牌,并判斷該備選語音交互設備的激活優先級是否大于所述本地網絡中的其他備選語音交互設備的激活優先級;
48、對于每臺所述備選語音交互設備,當該備選語音交互設備的激活優先級大于所述本地網絡中的其他備選語音交互設備的激活優先級時,根據該備選語音交互設備的激活優先級和所述目標用戶相對于該語音交互設備的空間信息,生成該語音交互設備的廣播信息,并根據所述廣播令牌向所述本地網絡中廣播該備選語音交互設備的廣播信息;
49、在所述本地網絡中確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備。
50、作為一種可選的實施方式,在本發明第二方面中,每個所述備選語音交互設備的廣播信息包括該備選語音交互設備的激活優先級,還包括該備選語音交互設備的方向夾角信息和/或聲源距離信息;
51、所述確定模塊在所述本地網絡中確定滿足第二子激活條件的第二目標激活優先級對應的所述備選語音交互設備為目標激活設備的方式具體包括:
52、在所述本地網絡中確定每個所述備選語音交互設備的廣播信息,并根據每個所述備選語音交互設備的廣播信息,確定每個所述備選語音交互設備的加權權重;
53、對于每個所述備選語音交互設備,根據該備選語音交互設備的激活優先級和加權權重,判斷該備選語音交互設備的激活優先級是否滿足第二子激活條件,當該備選語音交互設備的激活優先級滿足第二子激活條件時,確定該備選語音交互設備為目標激活設備。
54、本發明第三方面公開了另一種語音喚醒裝置,所述裝置包括:
55、存儲有可執行程序代碼的存儲器;
56、與所述存儲器耦合的處理器;
57、所述處理器調用所述存儲器中存儲的所述可執行程序代碼,執行本發明第一方面公開的語音喚醒方法。
58、本發明第四方面公開了一種計算機存儲介質,所述計算機存儲介質存儲有計算機指令,所述計算機指令被調用時,用于執行本發明第一方面公開的語音喚醒方法。
59、與現有技術相比,本發明實施例具有以下有益效果:
60、本發明實施例中,獲取語音交互設備基于目標感知檢測到的目標用戶相對于該語音交互設備的活體指示信息和空間信息,根據目標用戶相對于每臺語音交互設備的目標信息,在每臺語音交互設備中確定至少一臺目標激活設備,并控制每臺目標激活設備響應目標用戶發出的語音指令。可見,實施本發明能夠降低語音交互設備被環境聲音等非用戶聲源喚醒的概率,提高語音交互設備的就近喚醒和就近交互的性能和對用戶響應準確性,提高用戶和設備之間的語音交互性能以及用戶對語音交互設備的使用體驗。