本發明涉及數據查詢,尤其涉及一種數據查詢方法、裝置、電子設備及存儲介質。
背景技術:
1、隨著數據庫技術在各行業的深度應用,用戶對數據庫查詢的智能化、高效化需求日益迫切。相關技術中的大模型輔助數據庫查詢方案多依賴單一匹配機制或固定提示詞模板,存在表關聯匹配準確率低、sql(structured?query?language,結構化查詢語言)生成精準度不足、查詢錯誤重試效率低等問題。并且,還需人工維護表結構信息、匹配規則及示例庫,難以適配數據庫表結構動態變化與業務查詢需求迭代的場景,且缺乏自動優化機制,查詢性能無法隨使用過程持續提升,導致人工維護成本高、查詢可靠性與適配性受限。
技術實現思路
1、本發明提供一種數據查詢方法、裝置、電子設備及存儲介質,以解決結構化查詢語言生成方案中存在的人工維護成本高、查詢錯誤無法自動優化的技術問題。
2、本發明提供的一種數據查詢方法,所述方法包括:獲取待查詢的自然語言;識別所述自然語言的待查詢語義,并將所述待查詢語義和預設參考數據進行匹配,得到目標表結構和待查詢語句;對所述待查詢語句進行查詢仿真,得到仿真結果;若所述仿真結果中不存在查詢風險,則執行所述待查詢語句,得到所述目標表結構的查詢結果;若所述仿真結果中存在查詢風險,和/或,所述查詢結果不滿足預設查詢條件,則基于所述待查詢語義和所述目標表結構生成用于優化語義優先級的優化提示詞,以使大模型根據所述優化提示詞優化所述待查詢語句,并根據優化后的待查詢語句進行查詢重試,所述查詢重試包括在對優化后的待查詢語句進行查詢仿真,且無新的查詢風險后,執行優化后的待查詢語句。
3、于本發明一實施例中,基于所述待查詢語義和所述目標表結構生成用于優化語義優先級的優化提示詞,包括:若存在所述查詢結果不滿足預設查詢條件,則基于所述待查詢語義對所述待查詢語句和所述目標表結構進行錯誤分析,得到錯誤歸因;將所述錯誤歸因或所述查詢風險確定為優化原因信息;基于預設的表結構知識圖譜、所述優化原因信息、所述待查詢語義、所述目標表結構和對應的字段動態權重,拼接生成用于優化語義優先級的優化提示詞,在所述優化提示詞生成中基于所述字段動態權重排序對應的字段語義描述;其中,所述字段動態權重基于對應字段的調用頻次、關聯準確率和查詢貢獻度中至少一個確定,所述表結構知識圖譜中包括所述字段的變更信息。
4、于本發明一實施例中,所述字段動態權重基于對應字段的調用頻次、關聯準確率和查詢貢獻度中至少一個確定,包括:根據所述字段的調用頻次的歸一化值和對應的頻次權重系數確定頻次項;基于所述字段的關聯準確率和對應的準確率權重系數確定準確率項;根據所述字段的查詢貢獻度和對應的貢獻度權重系數確定貢獻度項;基于所述頻次項、所述準確率項和所述貢獻度項確定字段動態權重;其中,所述調用頻次、所述關聯準確率和所述查詢貢獻度基于歷史查詢數據統計得到,不同的所述權重系數基于所述歷史查詢數據迭代優化得到。
5、于本發明一實施例中,對所述待查詢語句進行查詢仿真,得到仿真結果,包括:校驗所述待查詢語句的語法合法性;校驗通過后,監測模擬執行所述待查詢語句時的性能占用,和/或,驗證所述待查詢語句與所述待查詢語義之間的意圖關聯性;根據所述性能占用和/或所述意圖關聯性確定所述仿真結果;其中,所述性能占用包括輸入、輸出、中央處理單元和內存中至少一個的資源占用率。
6、于本發明一實施例中,將所述待查詢語義和預設參考數據進行匹配,得到目標表結構和待查詢語句,包括:將所述待查詢語義與多個查詢案例進行混合檢索,得到目標表結構和參考查詢語句,并基于所述待查詢語義、所述目標表結構和預設提示詞修改所述參考查詢語句的查詢條件,得到待查詢語句,所述查詢案例中包括歷史查詢語義和對應的歷史表結構、歷史查詢語句;或,分別基于所述待查詢語義與多個表結構語義向量中的表結構字段之間的語義關聯度,確定目標表結構,并根據所述待查詢語義和所述目標表結構生成待查詢語句;其中,所述預設參考數據包括各所述查詢案例或各所述表結構語義向量。
7、于本發明一實施例中,將所述待查詢語義和預設參考數據進行匹配,得到目標表結構和待查詢語句,還包括:若混合檢索對應的語義相似度小于預設相似度閾值,或,若檢測到所述混合檢索失敗,則通過所述待查詢語義和各所述表結構語義向量確定待查詢語句。
8、于本發明一實施例中,得到所述目標表結構的查詢結果之后,還包括:將所述待查詢語句、所述查詢結果對應的結果特征、性能占用特征輸入評分模型,得到查詢評分;若所述查詢評分大于預設第一評分閾值,則將所述待查詢語義、所述待查詢語句和所述目標表結構確定為查詢案例,并存儲,以及基于所述查詢評分對應的存儲權重,對存儲的查詢案例進行更新;若所述查詢評分小于或等于預設第二評分閾值,則基于錯誤歸因和對應的優化提示詞確定優化案例,以指導新的優化提示詞生成,所述錯誤歸因基于所述待查詢語義對所述待查詢語句和所述目標表結構進行錯誤分析得到;其中,所述評分模型基于歷史查詢數據和對應的歷史用戶反饋訓練得到。
9、本發明提供一種數據查詢裝置,所述裝置包括:獲取模塊,用于獲取待查詢的自然語言;查詢語句生成模塊,用于識別所述自然語言的待查詢語義,并將所述待查詢語義和預設參考數據進行匹配,得到目標表結構和待查詢語句;查詢仿真模塊,用于對所述待查詢語句進行查詢仿真,得到仿真結果;查詢執行模塊,用于若所述仿真結果中不存在查詢風險,則執行所述待查詢語句,得到所述目標表結構的查詢結果;查詢語句優化模塊,用于若所述仿真結果中存在查詢風險,和/或,所述查詢結果不滿足預設查詢條件,則基于所述待查詢語義和所述目標表結構生成用于優化語義優先級的優化提示詞,以使大模型根據所述優化提示詞優化所述待查詢語句,并根據優化后的待查詢語句進行查詢重試,所述查詢重試包括在對優化后的待查詢語句進行查詢仿真,且無新的查詢風險后,執行優化后的待查詢語句。
10、本發明提供一種電子設備,所述電子設備包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行時,使得所述電子設備實現如上述實施例中任一項所述的數據查詢方法。
11、本發明還提供一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序被計算機的處理器執行時,使計算機執行上述各實施例任一項所述的數據查詢方法。
12、本發明的有益效果:本發明提出的一種數據查詢方法、裝置、電子設備及存儲介質,通過在執行前對待查詢語句進行查詢仿真,并在待查詢語句的查詢結果不滿足預設查詢條件時,生成優化提示詞進行重試,從而顯著提升查詢準確性、穩定性與魯棒性。
1.一種數據查詢方法,其特征在于,所述方法包括:
2.根據權利要求1所述的數據查詢方法,其特征在于,基于所述待查詢語義和所述目標表結構生成用于優化語義優先級的優化提示詞,包括:
3.根據權利要求2所述的數據查詢方法,其特征在于,所述字段動態權重基于對應字段的調用頻次、關聯準確率和查詢貢獻度中至少一個確定,包括:
4.根據權利要求1所述的數據查詢方法,其特征在于,對所述待查詢語句進行查詢仿真,得到仿真結果,包括:
5.根據權利要求1-4任一項所述的數據查詢方法,其特征在于,將所述待查詢語義和預設參考數據進行匹配,得到目標表結構和待查詢語句,包括:
6.根據權利要求5所述的數據查詢方法,其特征在于,將所述待查詢語義和預設參考數據進行匹配,得到目標表結構和待查詢語句,還包括:
7.根據權利要求1-4任一項所述的數據查詢方法,其特征在于,得到所述目標表結構的查詢結果之后,還包括:
8.一種數據查詢裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,所述電子設備包括:
10.一種計算機可讀存儲介質,其特征在于,其上存儲有計算機程序,當所述計算機程序被計算機的處理器執行時,使計算機執行權利要求1至7中任一項所述的數據查詢方法。