一種面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法與流程

文檔序號：45269634發(fā)布日期：2026-04-17 20:05閱讀：22來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法與流程

技術(shù)特征：

1.一種面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟s1包括：

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟s2包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述步驟s2.2中，基于低秩自適應(yīng)lora算法對通用大模型m進(jìn)行微調(diào)，其優(yōu)化目標(biāo)為最小化損失函數(shù)?l：

5.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述步驟s2.4中的映射通過一個(gè)確定的映射函數(shù)g實(shí)現(xiàn)，所述映射函數(shù)將所述答案空間q映射至所述標(biāo)簽空間y：所述映射函數(shù)g確保所述領(lǐng)域大模型選出的得分最高的答案q，通過映射后與所需業(yè)務(wù)標(biāo)簽y嚴(yán)格對應(yīng)。

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟s3包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述步驟s3.1中，通過最小化所述領(lǐng)域大模型m1與各輔助小模型輸出分布之間的kl散度進(jìn)行知識(shí)蒸餾，其蒸餾過程的優(yōu)化目標(biāo)為：

8.根據(jù)權(quán)利要求6所述的方法，其特征在于，在所述步驟3.2中，所述多模型融合打分模型的加權(quán)融合方式為：

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟s4包括：

10.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟s5中的迭代執(zhí)行機(jī)制通過遞進(jìn)式推理鏈實(shí)現(xiàn)任務(wù)的動(dòng)態(tài)收斂，包括：

技術(shù)總結(jié)
本發(fā)明公開了一種面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法，包括通過提示策略對通用大模型進(jìn)行零樣本冷啟動(dòng)；利用小樣本數(shù)據(jù)微調(diào)通用大模型，形成領(lǐng)域大模型，并通過持續(xù)學(xué)習(xí)更新領(lǐng)域知識(shí)；將領(lǐng)域大模型知識(shí)蒸餾遷移至多個(gè)輔助小模型，基于評分機(jī)制融合各小模型輸出，完成協(xié)同訓(xùn)練；根據(jù)用戶輸入加載業(yè)務(wù)流程與約束提示詞，引導(dǎo)領(lǐng)域大模型判斷是否調(diào)用外部工具并返回結(jié)果；建立迭代執(zhí)行機(jī)制，若結(jié)果不滿足終止條件，則將其轉(zhuǎn)化為中間提示詞循環(huán)執(zhí)行，直至任務(wù)完成；本發(fā)明結(jié)合了大模型的泛化能力與小模型的輕量化推理優(yōu)勢，在保證任務(wù)適應(yīng)性的同時(shí)降低了部署與推理成本。

技術(shù)研發(fā)人員：朱偉,李圣龍,張豹,黨敏俠,臧飛,黃穎,潘仁前,婁行威,曹兆元,張釗暘,何揚(yáng)
受保護(hù)的技術(shù)使用者：中國電子科技集團(tuán)公司第二十八研究所
技術(shù)研發(fā)日：
技術(shù)公布日：2026/4/16

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

網(wǎng)友詢問留言留言:0條

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

文明留言，給您點(diǎn)贊！

同類技術(shù)