1.一種面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟s1包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟s2包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟s2.2中,基于低秩自適應(yīng)lora算法對通用大模型m進(jìn)行微調(diào),其優(yōu)化目標(biāo)為最小化損失函數(shù)?l:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟s2.4中的映射通過一個(gè)確定的映射函數(shù)g實(shí)現(xiàn),所述映射函數(shù)將所述答案空間q映射至所述標(biāo)簽空間y:所述映射函數(shù)g確保所述領(lǐng)域大模型選出的得分最高的答案q,通過映射后與所需業(yè)務(wù)標(biāo)簽y嚴(yán)格對應(yīng)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟s3包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述步驟s3.1中,通過最小化所述領(lǐng)域大模型m1與各輔助小模型輸出分布之間的kl散度進(jìn)行知識(shí)蒸餾,其蒸餾過程的優(yōu)化目標(biāo)為:
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述步驟3.2中,所述多模型融合打分模型的加權(quán)融合方式為:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟s4包括:
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟s5中的迭代執(zhí)行機(jī)制通過遞進(jìn)式推理鏈實(shí)現(xiàn)任務(wù)的動(dòng)態(tài)收斂,包括: