本技術屬于人工智能,涉及一種基于大模型的多法域薪資計算標準生成與驗證方法、系統。
背景技術:
1、隨著跨境用工和多法域用工模式的發展,企業在多個國家或地區開展雇傭、發薪、納稅和社保繳納活動已成為常見經營需求。由于不同法域之間在個稅稅率結構、社保基數、雇主繳納比例、稅前扣減項目、支付頻率、法定福利以及生效日期規則等方面均存在顯著差異,多法域薪資計算規則生成與驗證長期依賴當地薪資專家或外部服務商對法規文本進行人工解讀和規則維護。
2、現有技術中,常見方案包括:由運營人員根據政府公告手工更新薪資規則;通過靜態模板維護稅務和社保參數;使用通用大語言模型對法規文本進行摘要、問答或說明性生成;或者通過通用規則引擎將部分業務規則轉譯為代碼。這些方案通常存在如下問題:
3、第一,法規解讀和規則轉譯高度依賴分布式專家經驗,不同國家、不同團隊和不同服務商之間的轉譯標準難以保持一致。
4、第二,法規發布、生效、規則錄入和規則上線之間存在明顯時滯,容易出現新舊規則重疊、規則遺漏和生效時間設置錯誤。
5、第三,通用大語言模型雖然能夠從法規文本中生成候選內容,但輸出結構不穩定、字段缺失概率較高,難以直接形成可執行薪資規則。
6、第四,僅從文本理解層面對候選規則進行人工審查,難以發現稅額階梯錯誤、社保封頂邊界錯誤、幣種換算錯誤或年初至今累計值異常等執行層面的偏差。
7、第五,已上線規則缺少與實際薪資執行結果聯動的反饋回路,出現偏差后通常依賴人工復核和人工回滾,效率低且審計追蹤不完整。
技術實現思路
1、本技術提供一種基于大模型的多法域薪資計算標準生成與驗證方法、系統,用于解決現有技術中多法域薪資計算過多依賴人工導致薪資計算效率低下的問題。
2、第一方面,本技術提供一種基于大模型的多法域薪資計算標準生成與驗證方法,所述方法包括:獲取目標法域的薪資法規數據;所述薪資法規數據包括法規文本數據、法規來源數據、生效日期數據和/或版本標識數據;基于所述薪資法規數據進行預處理,獲取統一結構化薪資法規數據;所述統一結構化薪資法規數據為統一薪資標準模式的條款結構化數據;基于所述統一結構化薪資法規數據和預設輸出約束利用大模型生成符合所述統一薪資標準模式的候選薪資標準對象;所述預設輸出約束能夠約束所述候選薪資標準對象追溯至原始來源條款;基于所述候選薪資標準對象進行確定性校驗,獲取確定性校驗結果;所述確定性校驗包括模式完整性校驗、來源索引校驗、生效區間重疊校驗、沖突矩陣校驗和/或歷史版本差異校驗;基于預設樣例工資對所述候選薪資標準對象進行試算,獲取試算結果,所述試算結果包括探針通過率和阻斷性失敗數量;基于所述確定性校驗結果、所述探針通過率以及歷史發布薪資標準對象的實際執行偏差和修正記錄生成反饋數據,并將所述反饋數據返回候選薪資標準對象生成步驟用于后續候選薪資標準對象生成;基于所述確定性校驗結果、所述試算結果和所述反饋數據進行置信度計算,獲取所述候選薪資標準對象的置信度分值,并根據所述置信度分值、所述探針通過率和所述阻斷性失敗數量對所述候選薪資標準對象進行狀態判斷,獲取通過驗證的候選薪資標準對象;基于所述通過驗證的候選薪資標準對象調用對應的薪資計算標準執行薪資計算;在執行薪資計算時,實時采集實際執行偏差和修正記錄,當所述實際執行偏差滿足預設觸發回退條件時,則回退至上一已發布版本薪資標準對象,記錄回退結果并作為反饋數據用于下一輪候選薪資標準對象的生成;所述回退結果包括回退原因、回退時間、影響范圍和相關薪資單標識。
3、在第一方面的一種實現方式中,基于所述薪資法規數據進行預處理,獲取統一結構化薪資法規數據包括:基于所述薪資法規數據進行條款切分、字段抽取和語義歸一化處理,生成對應于統一薪資標準模式的條款結構化數據;其中,所述統一結構化薪資法規數據至少包括條款編號、條款類別、變量名稱、適用范圍、生效條件、來源索引、原文片段和語義標簽;所述統一薪資標準模式至少包括法域標識、規則類別、適用對象、收入項、扣減項、稅率項、社保項、生效起止時間、計算基數、幣種、舍入方式和優先級字段。
4、在第一方面的一種實現方式中,所述預設輸出約束包括固定字段模板、字段類型約束、字段必填約束、字段間依賴關系約束、來源引用約束和數值范圍約束。
5、在第一方面的一種實現方式中,所述模式完整性校驗用于校驗所述候選薪資標準對象是否符合所述統一薪資標準模式所定義的字段完整性、字段類型合規性及字段間邏輯約束;所述來源索引校驗用于校驗通過所述模式完整性校驗的所述候選薪資標準對象的來源引用是否能夠回溯至原始法規條款;其中通過所述模式完整性校驗的所述候選薪資標準對象中的來源引用字段已通過字段存在性和格式正確性驗證;所述生效區間重疊校驗用于基于通過所述模式完整性校驗的所述候選薪資標準對象,對具有相同法域標識、規則類別和適用對象的多個所述候選薪資標準對象之間的生效起止時間進行重疊檢測;其中通過所述模式完整性校驗的所述候選薪資標準對象中的法域標識、規則類別、適用對象和生效起止時間字段已通過格式驗證;所述沖突矩陣校驗用于基于所述生效區間重疊校驗輸出的重疊規則對,進一步比較同組內各候選薪資標準對象的參數區間和優先級,以識別互斥規則、重復規則和覆蓋規則;所述歷史版本差異校驗用于基于通過所述模式完整性校驗的所述候選薪資標準對象,校驗所述候選薪資標準對象與上一已發布候選薪資標準對象的關鍵字段差異,判斷所述差異是否符合來源條款所表述的變化范圍。其中,所述互斥規則指在相同生效區間和參數區間內優先級相同但規則邏輯相沖突的候選薪資標準對象,所述重復規則指生效區間、參數區間和優先級完全相同的候選薪資標準對象,所述覆蓋規則指生效區間存在包含關系且優先級存在差異的候選薪資標準對象。
6、在第一方面的一種實現方式中,所述預設樣例工資至少包括基礎工資、津貼、獎金、稅前扣減項、社保基數、幣種、支付頻率和身份參數,基于預設樣例工資對所述候選薪資標準對象進行試算,獲取探針通過率和阻斷性失敗數量包括:基于所述預設樣例工資對所述候選薪資標準對象進行試算,獲取試算結果;基于所述試算結果和預設結果逐項進行比較并計算獲取探針通過率和阻斷性失敗數量;其中,所述探針通過率為所述預設樣例工資中試算通過的樣例工資數量與總樣例工資數量的比值,所述阻斷性失敗數量為導致計算過程終止的失敗樣例工資數量。
7、在第一方面的一種實現方式中,基于所述確定性校驗結果、所述試算結果和所述反饋數據進行置信度計算,獲取所述候選薪資標準對象的置信度分值包括:基于所述確定性校驗結果中各校驗項的權重分值、所述試算結果中的回歸探針權重分值和所述反饋數據中的歷史運行穩定性權重分值進行置信度計算,獲取所述候選薪資標準對象的置信度分值,所述置信度分值的計算公式為:c?=?w1×ssource?+?w2×sschema?+?w3×sconflict?+w4×sprobe?+?w5×sdiff?+?w6×sruntime;其中,c表示為置信度分值,ssource表示為來源可信度得分,sschema表示為模式完整性得分,sconflict表示為沖突校驗得分,sprobe表示為回歸探針得分,sdiff表示為版本差異合理性得分,sruntime表示為歷史運行穩定性得分,w1-w6分別表示為對應權重,且w1至w6之和為1或經歸一化處理。
8、在第一方面的一種實現方式中,根據所述置信度分值、所述探針通過率和所述阻斷性失敗數量對所述候選薪資標準對象進行狀態判斷,獲取通過驗證的候選薪資標準對象包括:若所述阻斷性失敗數量大于0時,則將所述候選薪資標準對象標記為驗證失敗狀態;若所述置信度分值大于等于第一置信度閾值且所述探針通過率大于等于預設發布通過率閾值時,則將所述候選薪資標準對象標記為發布狀態;若所述置信度分值小于所述第一置信度閾值且大于等于第二置信度閾值時,則將所述候選薪資標準對象標記為測試狀態;若所述置信度分值小于所述第二置信度閾值時,則將所述候選薪資標準對象標記為草稿狀態;將所述發布狀態的候選薪資標準對象作為通過驗證的候選薪資標準對象。
9、在第一方面的一種實現方式中,基于所述通過驗證的候選薪資標準對象調用對應的薪資計算標準執行薪資計算包括:基于所述通過驗證的候選薪資標準對象調用對應的薪資計算標準;基于所述薪資計算標準對待處理薪資計算數據進行薪資計算,獲取實際薪資數據;所述實際薪資數據至少包括稅前工資、應稅工資、個稅、員工社保、雇主社保、稅后工資和/或年初至今累計值;基于所述通過驗證的候選薪資標準對象進行哈希處理生成對應的規則快照哈希,將通過驗證的候選薪資標準對象、所述規則快照哈希和所述實際薪資數據進行保存。
10、在第一方面的一種實現方式中,所述預設觸發回退條件包括:deviationrate>d_max或criticalslipmismatchcount?≥?n_max,其中,deviationrate表示為實際執行偏差率;d_max表示為允許的最大偏差閾值;criticalslipmismatchcount表示為關鍵薪資單不匹配數量;n_max表示為關鍵薪資單不匹配數量閾值。
11、第二方面,本技術提供一種基于大模型的多法域薪資計算標準生成與驗證系統,所述系統包括:法規數據獲取模塊,被配置為獲取目標法域的薪資法規數據;所述薪資法規數據包括法規文本數據、法規來源數據、生效日期數據和/或版本標識數據;預處理模塊,被配置為基于所述薪資法規數據進行預處理,獲取統一結構化薪資法規數據;所述統一結構化薪資法規數據為統一薪資標準模式的條款結構化數據;候選規則生成模塊,被配置為基于所述統一結構化薪資法規數據和預設輸出約束利用大模型生成符合所述統一薪資標準模式的候選薪資標準對象;所述預設輸出約束能夠約束所述候選薪資標準對象追溯至原始來源條款;確定性校驗模塊,被配置為基于所述候選薪資標準對象進行確定性校驗,獲取確定性校驗結果;所述確定性校驗包括模式完整性校驗、來源索引校驗、生效區間重疊校驗、沖突矩陣校驗和/或歷史版本差異校驗;試算模塊,被配置為基于預設樣例工資對所述候選薪資標準對象進行試算,獲取探針通過率和阻斷性失敗數量;反饋優化模塊,被配置為基于所述確定性校驗結果、所述探針通過率以及歷史發布薪資標準對象的實際執行偏差和修正記錄生成反饋數據,并將所述反饋數據返回候選薪資標準對象生成步驟用于后續候選薪資標準對象生成;置信度計算和狀態判斷模塊,被配置為基于所述確定性校驗結果、所述試算結果和所述反饋數據進行置信度計算,獲取所述候選薪資標準對象的置信度分值,并根據所述置信度分值、所述探針通過率和所述阻斷性失敗數量對所述候選薪資標準對象進行狀態判斷,獲取通過驗證的候選薪資標準對象;確定性執行模塊,被配置為基于所述通過驗證的候選薪資標準對象調用對應的薪資計算標準執行薪資計算;自動回退模塊,被配置為在執行薪資計算時,實時采集實際執行偏差和修正記錄,當所述實際執行偏差滿足預設觸發回退條件時,則回退至上一已發布版本薪資標準對象,記錄回退結果并作為反饋數據用于下一輪候選薪資標準對象的生成;所述回退結果包括回退原因、回退時間、影響范圍和相關薪資單標識。
12、第三方面,本技術提供一種電子設備,所述電子設備包括:存儲器,存儲有一計算機程序;處理器,與所述存儲器通信相連,調用所述計算機程序時執行上述所述的基于大模型的多法域薪資計算標準生成與驗證方法。
13、第四方面,本技術提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述所述的基于大模型的多法域薪資計算標準生成與驗證方法。
14、如上所述,本技術所述的一種基于大模型的多法域薪資計算標準生成與驗證方法、系統,具有以下有益效果:
15、本技術通過對目標法域的薪資法規數據進行預處理獲取統一結構化薪資法規數據,并結合預設輸出約束和大模型對統一結構化薪資法規數據進行約束處理,能夠將原始法規文本穩定轉換為符合統一模式的候選薪資標準對象,使得所述候選薪資標準對象能夠追溯至原始來源條款,減少對單一專家經驗的依賴,尤其適用于多法域、多幣種、多支付頻率和法規更新頻繁的薪資規則處理場景,能夠緩解多法域薪資專家能力分布不均帶來的低效問題;本技術通過對生效區間、規則沖突和歷史版本差異進行自動校驗,能夠在規則上線前發現潛在沖突和結構異常;本技術通過對候選規則執行樣例工資試算,能夠在實際發薪前發現文本層面無法發現的薪資計算偏差;本技術通過對候選規則進行分級發布,避免未通過驗證的規則直接進入實際執行流程;本技術通過對執行偏差進行采集和自動回退,能夠形成規則生成、驗證、執行和回退的閉環反饋機制;本技術通過規則版本、規則快照哈希、輸入摘要、輸出摘要和年初至今累計值的保存,能夠提高系統的審計可追溯性。