1.基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,由通過通信橋接器實時連接的語音智能體和瀏覽器智能體協同執行,包括:
2.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,還包括會話持久化操作,具體過程為:
3.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,得到用戶指令文本的具體過程包括:
4.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,語音智能體通過大語言模型對用戶指令文本進行解析,生成結構化任務,并通過通信橋接器將結構化任務分發至瀏覽器智能體,具體過程包括:
5.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,瀏覽器智能體接收結構化任務,并根據結構化任務驅動瀏覽器執行相應的自動化操作,包括用戶詢問操作,具體過程為:
6.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,瀏覽器智能體接收結構化任務,并根據結構化任務驅動瀏覽器執行相應的自動化操作,還包括用戶回答和結果反饋,具體過程為:
7.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,在語音智能體進行語音播報或瀏覽器智能體執行結構化任務的過程中,若檢測到新的用戶語音輸入,則觸發打斷機制,具體過程包括:
8.如權利要求1所述的基于雙智能體實時通信的語音控制瀏覽器操作方法,其特征在于,通信橋接器采用異步消息隊列機制實現瀏覽器智能體和語音智能體之間的雙向異步通信,消息隊列用于管理任務請求、狀態反饋、詢問與回答以及打斷信號的傳遞,并為每一條消息分配唯一標識以支持任務狀態跟蹤、執行進度監控、錯誤處理及重試機制。
9.基于雙智能體實時通信的語音控制瀏覽器操作系統,其特征在于,包括:
10.如權利要求9所述的基于雙智能體實時通信的語音控制瀏覽器操作系統,其特征在于,還包括會話持久管理模塊,用于在瀏覽器智能體執行結構化任務的過程中,持續監控瀏覽器會話的狀態變化;將瀏覽器會話的狀態進行序列化并持久化保存;當會話中斷后需要恢復時,加載保存的已序列化的狀態數據,并根據已序列化的狀態數據重建瀏覽器會話;通過通信橋接器通知語音智能體恢復對話。