本申請涉及信息處理,尤其涉及一種信息處理方法和電子設備。
背景技術:
1、為了提高模型推理準確性,在模型生成回答結果之前,可以利用檢索增強生成模型從數據庫中檢索出與提問問題相關的信息,然后再基于檢索到的信息來指導模型生成回答結果。
2、但是,目前模型基于檢索到的多條信息生成回答結果的過程中,經常會出現無法有效利用檢索出的多條信息而導致推理出的回答結果的準確性較低。
技術實現思路
1、一方面,本申請提供了一種信息處理方法,包括:
2、獲得輸入信息;
3、基于所述輸入信息獲得第一數據;所述第一數據包括多個文本塊;
4、確定第一提示詞,所述第一提示詞用于反映所述多個文本塊的排序,引導模型生成的多個步驟的先后順序與用于生成所述步驟的所述文本塊在所述排序中的先后順序保持一致;
5、將所述輸入信息、所述第一數據及所述第一提示詞輸入模型,獲得輸出信息;所述輸出信息至少包括所述多個步驟。
6、在一種可能的實現方式中,該信息處理方法還包括:
7、獲得所述文本塊綁定的圖標識;
8、確定第二提示詞,所述第二提示詞用于指示所述文本塊綁定的圖標識,所述圖標識用于標識圖像;
9、所述將所述輸入信息、所述第一數據及所述第一提示詞輸入模型,包括:
10、將所述輸入信息、所述第一數據、所述第一提示詞以及所述第二提示詞輸入模型;
11、其中,所述輸出信息還包括:所述步驟綁定的圖標識,所述步驟綁定的圖標識用于表征所述步驟內待插入的圖像。
12、在又一種可能的實現方式中,所述獲得所述文本塊綁定的圖標識,包括:
13、獲得第二數據,所述第二數據包括:所述多個文本塊各自關聯的候選圖標識;
14、如果所述多個文本塊關聯的候選圖標識的總數量超過設定數量,基于所述設定數量,從所述文本塊關聯的候選圖標識中篩選出所述文本塊所需綁定的圖標識;
15、如果所述多個文本塊關聯的候選圖標識的總數量未超過所述設定數量,將所述文本塊關聯的候選圖標識確定為所述文本塊綁定的圖標識。
16、在又一種可能的實現方式中,所述基于所述設定數量,從所述文本塊關聯的至少一個候選圖標識中篩選出所述文本塊所需綁定的圖標識,包括:
17、確定所述候選圖標識關聯的文本塊的作用類型、所述候選圖標識表示的圖像對應的圖像功能類別以及所述候選圖標識與所述輸入信息的相關程度,其中,所述作用類型用于表征所述文本塊是否屬于步驟內容;
18、基于所述候選圖標識對應的所述作用類型、所述圖像功能類別以及所述相關程度,確定所述候選圖標識的重要性評分;
19、基于所述候選圖標識的重要性評分,篩選出所述設定數量個候選圖標識;
20、將篩選出的候選圖標識確定為所述候選圖標識關聯的文本塊綁定的圖標識。
21、在又一種可能的實現方式中,所述確定第一提示詞包括:
22、獲得所述文本塊的作用類型和源位置信息,所述作用類型用于表征所述文本塊是否屬于步驟內容,所述源位置信息用于表征所述文本塊在其所屬的源文檔中的位置;
23、基于所述文本塊的源位置信息和所述文本塊的作用類型,確定所述多個文本塊中屬于步驟內容的至少一個目標文本塊的排序;
24、生成第一提示詞,所述第一提示詞用于表征所述至少一個目標文本塊的排序。
25、在又一種可能的實現方式中,所述文本塊關聯的候選圖標識通過如下方式得到:
26、獲得所述文本塊的文本元數據、多個候選圖像的候選圖標識以及所述候選圖像的圖像元數據,所述文本元數據包括:所述文本塊在源文檔中的頁面位置、所述文本塊在所述源文檔的頁面中的版面坐標、所述文本塊引用的圖序號、所述文本塊的作用類型以及所述文本塊的語義特征中的至少一種;所述圖像元數據包括:所述候選圖像在源文檔中的頁面位置、所述候選圖像在所述源文檔的頁面中的版面坐標、所述候選圖像對應的圖序號以及所述候選圖像的語義特征中的至少一種;
27、確定所述候選圖像與所述文本塊的關聯程度;
28、將關聯程度滿足要求的候選圖像的候選圖標識確定為所述文本塊關聯的候選圖標識;
29、其中,所述關聯程度基于如下至少一項確定:
30、所述候選圖像的頁面位置與所述文本塊的頁面位置之間的位置差距;
31、所述候選圖像的版面坐標與所述文本塊的版面坐標之間的坐標差距;
32、所述候選圖像的圖序號是否屬于所述文本塊中引用的圖序號;
33、所述文本塊的作用類型是否表征所述文本塊屬于步驟內容;
34、所述候選圖像的語義特征與所述文本塊的語義特征之間的相似度。
35、在又一種可能的實現方式中,所述候選圖像的語義特征為基于所述候選圖像的向量編碼、所述候選圖像關聯的標題內容以及從所述候選圖像中識別出的文本中的至少一種生成的。
36、在又一種可能的實現方式中,該信息處理方法還包括:
37、基于所述步驟綁定的圖標識,獲得所述步驟中需要插入的目標圖像;
38、向所述輸出信息的所述步驟中插入所述目標圖像。
39、又一方面,本申請還提供了一種電子設備,包括:輸入單元、處理器和顯示單元;
40、其中,所述輸入單元,用于獲得輸入信息;
41、所述處理器,用于基于所述輸入信息獲得第一數據;所述第一數據包括多個文本塊;確定第一提示詞,所述第一提示詞用于反映所述多個文本塊的排序,引導模型生成的多個步驟的先后順序與用于生成所述步驟的所述文本塊在所述排序中的先后順序保持一致;將所述輸入信息、所述第一數據及所述第一提示詞輸入模型,獲得輸出信息;所述輸出信息至少包括所述多個步驟;
42、所述顯示單元,用于顯示所述輸出信息。
43、在一種可能的實現方式中,所述處理器還用于,獲得所述文本塊綁定的圖標識;確定第二提示詞,所述第二提示詞用于指示所述文本塊綁定的圖標識,所述圖標識用于標識圖像;
44、所述處理器在將所述輸入信息、所述第一數據及所述第一提示詞輸入模型時,具體用于:將所述輸入信息、所述第一數據、所述第一提示詞以及所述第二提示詞輸入模型;
45、其中,所述輸出信息還包括:所述步驟綁定的圖標識,所述步驟綁定的圖標識用于表征所述步驟內待插入的圖像。
1.一種信息處理方法,包括:
2.根據權利要求1所述的信息處理方法,還包括:
3.根據權利要求2所述的信息處理方法,所述獲得所述文本塊綁定的圖標識,包括:
4.根據權利要求3所述的信息處理方法,所述基于所述設定數量,從所述文本塊關聯的至少一個候選圖標識中篩選出所述文本塊所需綁定的圖標識,包括:
5.根據權利要求1所述的信息處理方法,所述確定第一提示詞包括:
6.根據權利要求3所述的信息處理方法,所述文本塊關聯的候選圖標識通過如下方式得到:
7.根據權利要求6所述的信息處理方法,所述候選圖像的語義特征為基于所述候選圖像的向量編碼、所述候選圖像關聯的標題內容以及從所述候選圖像中識別出的文本中的至少一種生成的。
8.根據權利要求2所述的信息處理方法,還包括:
9.一種電子設備,包括:輸入單元、處理器和顯示單元;
10.根據權利要求9所述的電子設備,所述處理器還用于,獲得所述文本塊綁定的圖標識;確定第二提示詞,所述第二提示詞用于指示所述文本塊綁定的圖標識,所述圖標識用于標識圖像;