本發(fā)明屬于人工智能及其應(yīng)用,尤其涉及一種面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法。
背景技術(shù):
1、近年來(lái),人工智能技術(shù)快速發(fā)展,大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型(large?languagemodel,?llm)在文本生成、問(wèn)答、知識(shí)推理等通用任務(wù)中展現(xiàn)出強(qiáng)大能力,推動(dòng)了智能對(duì)話、內(nèi)容創(chuàng)作、自動(dòng)化服務(wù)等應(yīng)用的廣泛落地。各行業(yè)積極嘗試引入大模型技術(shù)以提升業(yè)務(wù)智能化水平,尤其在金融、醫(yī)療、法律、教育等垂直領(lǐng)域,對(duì)高效、精準(zhǔn)的ai解決方案需求日益增長(zhǎng)。
2、現(xiàn)有技術(shù)中,垂直領(lǐng)域任務(wù)通常采用兩種主流實(shí)現(xiàn)方式:一是直接利用通用大模型進(jìn)行零樣本或少量樣本提示,依賴其強(qiáng)大的泛化能力處理領(lǐng)域問(wèn)題;二是針對(duì)特定任務(wù)收集標(biāo)注數(shù)據(jù),對(duì)專用小模型進(jìn)行監(jiān)督訓(xùn)練或?qū)νㄓ么竽P瓦M(jìn)行全參數(shù)微調(diào),以提升在垂直場(chǎng)景中的準(zhǔn)確性。此外,部分方案通過(guò)設(shè)計(jì)提示工程或外部工具調(diào)用機(jī)制,引導(dǎo)大模型完成復(fù)雜任務(wù)。
3、然而,現(xiàn)有技術(shù)存在明顯缺點(diǎn):通用大模型雖具備廣泛知識(shí),但在垂直領(lǐng)域任務(wù)中常因?qū)I(yè)性不足導(dǎo)致準(zhǔn)確性不夠,且資源消耗大、部署成本高;而專用小模型或微調(diào)模型雖效率較高,但依賴大量標(biāo)注數(shù)據(jù),面臨冷啟動(dòng)慢、場(chǎng)景適應(yīng)性弱的問(wèn)題。尤其在任務(wù)執(zhí)行過(guò)程中,現(xiàn)有方法多依賴單一模型自主決策,缺乏大模型與小模型之間的協(xié)同機(jī)制,導(dǎo)致任務(wù)執(zhí)行的效率與可控性不足,難以在資源受限場(chǎng)景下實(shí)現(xiàn)準(zhǔn)確性、輕量化與快速適配的平衡。
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明目的:本發(fā)明的目的是提供一種結(jié)合大模型的泛化能力與小模型的輕量化推理能力,解決大模型在資源消耗高、適應(yīng)性弱、冷啟動(dòng)困難及任務(wù)不可控等問(wèn)題的面向垂直領(lǐng)域任務(wù)的大小模型協(xié)同智能體優(yōu)化方法。
2、技術(shù)方案:本發(fā)明所述的大小模型協(xié)同智能體優(yōu)化方法,包括以下步驟:
3、s1、基于通用大模型的語(yǔ)言理解與預(yù)訓(xùn)練優(yōu)勢(shì),設(shè)計(jì)提示策略,對(duì)所述通用大模型進(jìn)行零樣本冷啟動(dòng),以執(zhí)行垂直領(lǐng)域相關(guān)任務(wù);
4、s2、根據(jù)垂直領(lǐng)域的任務(wù)場(chǎng)景需求,利用垂直領(lǐng)域的小樣本標(biāo)注數(shù)據(jù)對(duì)所述通用大模型進(jìn)行微調(diào),構(gòu)建領(lǐng)域大模型,并通過(guò)持續(xù)學(xué)習(xí)優(yōu)化與知識(shí)更新,使所述領(lǐng)域大模型具備垂直領(lǐng)域知識(shí)體系;
5、s3、通過(guò)知識(shí)蒸餾與多模型融合方法,將所述領(lǐng)域大模型的專業(yè)知識(shí)遷移至多個(gè)輔助小模型,并基于評(píng)分機(jī)制綜合各所述輔助小模型的輸出,完成大小模型協(xié)同訓(xùn)練;
6、s4、獲取用戶輸入信息,加載與當(dāng)前用戶輸入任務(wù)類型對(duì)應(yīng)的業(yè)務(wù)流程提示詞和約束提示詞,將所述用戶輸入信息、業(yè)務(wù)流程提示詞與約束提示詞組合輸入至所述領(lǐng)域大模型,由所述領(lǐng)域大模型根據(jù)提示詞判斷是否調(diào)用外部工具,并返回工具輸出結(jié)果;
7、s5、建立迭代執(zhí)行機(jī)制,若所述工具輸出結(jié)果不滿足預(yù)設(shè)的終止條件,則將所述工具輸出結(jié)果轉(zhuǎn)化為中間提示詞并更新輸入數(shù)據(jù),由所述領(lǐng)域大模型循環(huán)執(zhí)行調(diào)用與判斷過(guò)程,直至滿足所述終止條件。
8、該技術(shù)方案通過(guò)結(jié)合大模型的泛化理解與小模型的輕量化推理,有效解決了大模型在資源消耗高、適應(yīng)性弱、冷啟動(dòng)困難及任務(wù)可控性不足等問(wèn)題。具體而言,方案首先利用通用大模型的零樣本冷啟動(dòng)能力快速響應(yīng)垂直領(lǐng)域任務(wù),緩解了冷啟動(dòng)困難;其次,借助小樣本微調(diào)和持續(xù)學(xué)習(xí)構(gòu)建出具備領(lǐng)域知識(shí)體系的專業(yè)大模型,提升了任務(wù)適應(yīng)性與知識(shí)深度;然后,通過(guò)知識(shí)蒸餾與多模型協(xié)同,將領(lǐng)域大模型的專業(yè)能力遷移至輕量化的小模型集群,既降低了資源消耗又綜合了多模型輸出,增強(qiáng)了推理效率與穩(wěn)定性;之后,基于流程化與約束化提示詞引導(dǎo)大模型精準(zhǔn)調(diào)用外部工具,強(qiáng)化了任務(wù)的可控性與執(zhí)行準(zhǔn)確性;最后,依托迭代執(zhí)行機(jī)制實(shí)現(xiàn)閉環(huán)優(yōu)化,進(jìn)一步確保了復(fù)雜任務(wù)輸出的可靠性與完整性。整體上,該協(xié)同智能體系統(tǒng)在保持高性能的同時(shí),實(shí)現(xiàn)了資源優(yōu)化、適應(yīng)性強(qiáng)、啟動(dòng)快速與流程可控的綜合技術(shù)效果。
9、優(yōu)選的,所述步驟s1包括:
10、s1.1、收集垂直領(lǐng)域場(chǎng)景相關(guān)的文本數(shù)據(jù)集,并基于不同任務(wù)類型構(gòu)建層次化的標(biāo)簽空間,所述文本數(shù)據(jù)集包括文本集、學(xué)術(shù)與技術(shù)文件、對(duì)話與交互數(shù)據(jù);
11、s1.2、根據(jù)任務(wù)類型和場(chǎng)景,結(jié)合所述文本數(shù)據(jù)集與對(duì)應(yīng)的標(biāo)簽空間設(shè)計(jì)提示模板,并將所述提示模板輸入所述通用大模型,以獲取初始答案;
12、s1.3、定義應(yīng)用程序接口,所述應(yīng)用程序接口包括提示輸入格式、答案輸出格式及錯(cuò)誤處理機(jī)制,將所述通用大模型和垂直領(lǐng)域場(chǎng)景結(jié)合構(gòu)建智能服務(wù),并基于預(yù)設(shè)的任務(wù)需求確定支持的輸出類型及對(duì)應(yīng)的答案空間,所述輸出類型包括文本描述、決策建議和數(shù)據(jù)表格;
13、s1.4、將基于所述通用大模型構(gòu)建的智能服務(wù)部署至垂直領(lǐng)域?qū)嶋H環(huán)境,實(shí)現(xiàn)零樣本冷啟動(dòng)上線。
14、該步驟通過(guò)系統(tǒng)化的零樣本冷啟動(dòng)設(shè)計(jì),有效解決大模型在垂直領(lǐng)域初始適配性弱與冷啟動(dòng)困難的問(wèn)題。首先,基于領(lǐng)域文本與層次化標(biāo)簽構(gòu)建有針對(duì)性的數(shù)據(jù)基礎(chǔ),為大模型提供結(jié)構(gòu)化的領(lǐng)域認(rèn)知框架;其次,結(jié)合任務(wù)場(chǎng)景設(shè)計(jì)專用提示模板,引導(dǎo)大模型理解領(lǐng)域任務(wù)并生成初步可靠輸出;同時(shí),通過(guò)標(biāo)準(zhǔn)化接口與服務(wù)封裝,明確輸入輸出規(guī)范與錯(cuò)誤處理機(jī)制,增強(qiáng)服務(wù)的可控性與穩(wěn)定性,并支持多樣化的輸出類型以滿足實(shí)際需求;最后,將服務(wù)直接部署至真實(shí)環(huán)境完成冷啟動(dòng)上線,顯著縮短從模型準(zhǔn)備到實(shí)際應(yīng)用的周期,實(shí)現(xiàn)了在無(wú)需標(biāo)注訓(xùn)練的情況下快速適配垂直領(lǐng)域任務(wù),兼顧了啟動(dòng)效率與初期服務(wù)的可用性。
15、優(yōu)選的,所述步驟s2包括:
16、s2.1、建立線上回溯機(jī)制,對(duì)垂直領(lǐng)域場(chǎng)景的語(yǔ)料數(shù)據(jù)x及通用大模型輸出的結(jié)果q1進(jìn)行存檔回溯;針對(duì)每一數(shù)據(jù)對(duì)(x,q1)進(jìn)行人工干預(yù)修正模型答案,得到修正后的新數(shù)據(jù)對(duì)(x,q2);
17、s2.2、將所述新數(shù)據(jù)對(duì)(x,q2)輸入通用大模型m,并基于低秩自適應(yīng)lora算法對(duì)通用大模型m進(jìn)行微調(diào),得到領(lǐng)域大模型m1;
18、s2.3、基于語(yǔ)料數(shù)據(jù)x及其對(duì)應(yīng)的答案空間q構(gòu)建文本提示,輸入至所述領(lǐng)域大模型m1;對(duì)于所述答案空間q中的每一答案q,計(jì)算所述領(lǐng)域大模型m1輸出該答案的概率,并通過(guò)求解確定得分最高的答案q;其中為搜索操作符,為最大化某個(gè)概率值,為領(lǐng)域大模型m1?的評(píng)分函數(shù),是經(jīng)過(guò)處理的輸入文本,由語(yǔ)料數(shù)據(jù)x與預(yù)設(shè)的提示模板prompt組合構(gòu)建而成,表示領(lǐng)域大模型m1的模型參數(shù);
19、s2.4、將所述答案空間q映射至標(biāo)簽空間y,使所選出的答案q與所需標(biāo)簽y對(duì)應(yīng)。
20、該步驟通過(guò)建立持續(xù)的閉環(huán)優(yōu)化機(jī)制,有效提升了模型在垂直領(lǐng)域的適應(yīng)性與知識(shí)準(zhǔn)確性。首先,通過(guò)線上回溯與人工干預(yù)構(gòu)建高質(zhì)量的領(lǐng)域校正數(shù)據(jù)集,為模型迭代提供了可靠的知識(shí)來(lái)源;其次,利用高效的低秩自適應(yīng)微調(diào)技術(shù),使通用大模型能夠以較低成本吸收領(lǐng)域知識(shí),快速轉(zhuǎn)化為專業(yè)化的領(lǐng)域大模型;然后,結(jié)合概率化評(píng)分與答案空間搜索,增強(qiáng)了模型輸出的確定性與可控性,確保其能夠在預(yù)設(shè)的領(lǐng)域知識(shí)體系內(nèi)作出可靠選擇;最后,通過(guò)答案至標(biāo)簽的映射,進(jìn)一步將模型輸出與業(yè)務(wù)需求對(duì)齊,實(shí)現(xiàn)了領(lǐng)域知識(shí)的結(jié)構(gòu)化沉淀與可復(fù)用。整體上,該過(guò)程不僅顯著提升了模型對(duì)垂直任務(wù)的適應(yīng)能力和輸出準(zhǔn)確性,還通過(guò)持續(xù)學(xué)習(xí)機(jī)制保障了模型知識(shí)的可進(jìn)化性與業(yè)務(wù)貼合度。
21、優(yōu)選的,所述步驟s2.2中,基于低秩自適應(yīng)lora算法對(duì)通用大模型m進(jìn)行微調(diào),其優(yōu)化目標(biāo)為最小化損失函數(shù)?l:
22、
23、其中,代表領(lǐng)域大模型?m1?中待微調(diào)的低秩參數(shù)集合,l為損失函數(shù),為第i個(gè)訓(xùn)練樣本的輸入數(shù)據(jù),為第i個(gè)樣本的人工修正后的正確答案。
24、該技術(shù)方案通過(guò)采用低秩自適應(yīng)(lora)算法進(jìn)行微調(diào),旨在以高效且資源節(jié)約的方式將通用大模型轉(zhuǎn)化為領(lǐng)域?qū)S媚P汀F鋬?yōu)化目標(biāo)旨在最小化模型輸出與人工修正標(biāo)準(zhǔn)答案之間的差異,從而確保領(lǐng)域大模型能夠精準(zhǔn)學(xué)習(xí)垂直領(lǐng)域知識(shí),顯著提升任務(wù)輸出的準(zhǔn)確性與可靠性。這一方法不僅大幅降低了對(duì)大規(guī)模計(jì)算資源的需求,加快了模型迭代速度,還通過(guò)參數(shù)高效微調(diào)有效避免了過(guò)擬合風(fēng)險(xiǎn),使模型在吸收新知識(shí)的同時(shí)保持了原有泛化能力的穩(wěn)定,實(shí)現(xiàn)了模型性能與資源消耗之間的優(yōu)化平衡。
25、優(yōu)選的,所述步驟s2.4中的映射通過(guò)一個(gè)確定的映射函數(shù)g實(shí)現(xiàn),所述映射函數(shù)將所述答案空間q映射至所述標(biāo)簽空間y:所述映射函數(shù)g確保所述領(lǐng)域大模型選出的得分最高的答案q,通過(guò)映射后與所需業(yè)務(wù)標(biāo)簽y嚴(yán)格對(duì)應(yīng)。
26、該技術(shù)方案通過(guò)引入確定的映射函數(shù),構(gòu)建了從模型內(nèi)部答案空間到外部業(yè)務(wù)標(biāo)簽空間的可靠轉(zhuǎn)換橋梁。這確保了領(lǐng)域大模型基于概率評(píng)分選出的最優(yōu)答案,能夠被精準(zhǔn)、無(wú)歧義地映射為業(yè)務(wù)系統(tǒng)可直接理解和處理的標(biāo)準(zhǔn)化標(biāo)簽。此舉顯著增強(qiáng)了模型輸出與下游業(yè)務(wù)流程的兼容性與集成效率,消除了語(yǔ)義層面的不確定性,保障了決策結(jié)果的可執(zhí)行性,從而在提升任務(wù)自動(dòng)化水平的同時(shí),強(qiáng)化了整體系統(tǒng)在垂直領(lǐng)域應(yīng)用中的可控性與穩(wěn)定性。
27、優(yōu)選的,所述步驟s3包括:
28、s3.1、將所述領(lǐng)域大模型m1通過(guò)知識(shí)蒸餾方法壓縮為多個(gè)輔助小模型,所述輔助小模型包括m1、m2、m3和m4,每個(gè)輔助小模型對(duì)應(yīng)于不同子任務(wù);
29、s3.2、基于所述領(lǐng)域大模型m1的transformer結(jié)構(gòu)與線性層,訓(xùn)練多模型融合打分模型,其中是經(jīng)過(guò)處理的輸入文本,為各小模型及大模型輸出預(yù)測(cè)的加權(quán)向量,表示領(lǐng)域大模型 m1的模型參數(shù);所述多模型融合打分模型用于對(duì)各輔助小模型的輸出進(jìn)行加權(quán)評(píng)分,生成加權(quán)評(píng)分過(guò)程其中,m表示輔助小模型集合{m1,?m2,m3,?m4}中的任一模型;
30、s3.3、建立多模型協(xié)同工作機(jī)制,以所述多個(gè)輔助小模型共同處理相同語(yǔ)料數(shù)據(jù)x,并通過(guò)所述多模型融合打分模型對(duì)處理結(jié)果進(jìn)行融合,得到最終預(yù)測(cè)結(jié)果。
31、該步驟通過(guò)知識(shí)蒸餾與多模型協(xié)同機(jī)制,有效解決了大模型資源消耗高與部署成本大的問(wèn)題。首先,將領(lǐng)域大模型的專業(yè)知識(shí)壓縮至多個(gè)輕量化的小模型,使其各自專注于不同子任務(wù),顯著降低了推理所需的計(jì)算資源與延遲;其次,通過(guò)設(shè)計(jì)多模型融合打分模型,對(duì)各小模型的輸出進(jìn)行智能加權(quán)與綜合評(píng)判,提升了整體決策的穩(wěn)健性與準(zhǔn)確性,有效融合了多樣化模型視角;最終,協(xié)同工作機(jī)制實(shí)現(xiàn)了并行處理與結(jié)果融合,在確保任務(wù)處理效率與質(zhì)量的同時(shí),增強(qiáng)了系統(tǒng)的可擴(kuò)展性與容錯(cuò)能力,使整體智能體在資源受限環(huán)境下仍能保持高性能的領(lǐng)域任務(wù)執(zhí)行水平。
32、優(yōu)選的,所述步驟s3.1中,通過(guò)最小化所述領(lǐng)域大模型m1與各輔助小模型輸出分布之間的kl散度進(jìn)行知識(shí)蒸餾,其蒸餾過(guò)程的優(yōu)化目標(biāo)為:
33、
34、其中,代表第?k?個(gè)輔助小模型的可訓(xùn)練參數(shù),代表領(lǐng)域大模型 ?m1?中待微調(diào)的低秩參數(shù)集合,為kl散度損失。
35、該知識(shí)蒸餾技術(shù)通過(guò)最小化領(lǐng)域大模型與各輔助小模型之間輸出分布的差異,實(shí)現(xiàn)了專業(yè)知識(shí)從大模型向輕量化小模型的高效、保真遷移。這一過(guò)程確保了每個(gè)小模型在壓縮后仍能繼承并模仿大模型在垂直領(lǐng)域的核心推理模式和知識(shí)表達(dá)能力,從而在顯著降低模型參數(shù)量和計(jì)算開銷的同時(shí),最大限度地保持了小模型處理領(lǐng)域子任務(wù)的準(zhǔn)確性與可靠性,實(shí)現(xiàn)了模型性能與效率的優(yōu)化平衡,為后續(xù)的多模型協(xié)同工作奠定了堅(jiān)實(shí)且一致的性能基礎(chǔ)。
36、優(yōu)選的,在所述步驟3.2中,所述多模型融合打分模型的加權(quán)融合方式為:
37、
38、其中,為第?k個(gè)輔助小模型,k?代表輔助小模型的總數(shù)量,為領(lǐng)域大模型,和?分別為對(duì)應(yīng)模型的權(quán)重參數(shù),且滿足。
39、該加權(quán)融合機(jī)制通過(guò)將多個(gè)輔助小模型的輸出與領(lǐng)域大模型的輸出進(jìn)行加權(quán)集成,創(chuàng)造了一個(gè)兼具輕量化效率與專家級(jí)準(zhǔn)確性的協(xié)同決策體系。它不僅賦予各小模型與其任務(wù)適配的權(quán)重,以靈活整合其專長(zhǎng),同時(shí)保留了領(lǐng)域大模型作為關(guān)鍵參考,確保了最終結(jié)果在保持整體輕量化推理優(yōu)勢(shì)的基礎(chǔ)上,仍能獲得來(lái)自源頭大模型的可靠性校準(zhǔn)與知識(shí)兜底。這一設(shè)計(jì)有效平衡了資源消耗與輸出質(zhì)量,提升了系統(tǒng)在面對(duì)復(fù)雜或邊界情況時(shí)的穩(wěn)健性與綜合判斷能力。
40、優(yōu)選的,所述步驟s4包括:
41、s4.1、獲取與待執(zhí)行任務(wù)對(duì)應(yīng)的用戶輸入數(shù)據(jù);
42、s4.2、根據(jù)所述用戶輸入數(shù)據(jù)的任務(wù)類型,加載與該任務(wù)類型相匹配的預(yù)存的業(yè)務(wù)流程提示詞;
43、s4.3、加載預(yù)存的約束提示詞,所述約束提示詞用于指示所述領(lǐng)域大模型在所述用戶輸入數(shù)據(jù)中出現(xiàn)預(yù)設(shè)的內(nèi)容時(shí)調(diào)用對(duì)應(yīng)的任務(wù)工具。
44、該步驟通過(guò)動(dòng)態(tài)加載任務(wù)驅(qū)動(dòng)的業(yè)務(wù)流程提示詞與約束提示詞,顯著增強(qiáng)了領(lǐng)域大模型在執(zhí)行垂直領(lǐng)域任務(wù)時(shí)的可控性、準(zhǔn)確性與自動(dòng)化水平。它使模型能夠精準(zhǔn)理解用戶意圖,并嚴(yán)格遵循預(yù)設(shè)的業(yè)務(wù)邏輯與規(guī)則,有效避免了輸出結(jié)果的隨意性與偏差。當(dāng)輸入中出現(xiàn)預(yù)設(shè)的關(guān)鍵詞或場(chǎng)景時(shí),約束提示詞能可靠地觸發(fā)對(duì)外部工具的調(diào)用,將大模型的通用推理能力與專用工具的功能性緊密結(jié)合,從而在復(fù)雜任務(wù)中實(shí)現(xiàn)流程化、標(biāo)準(zhǔn)化的智能決策與操作執(zhí)行,提升了整體系統(tǒng)的可靠性與實(shí)用性。
45、優(yōu)選的,所述步驟s5中的迭代執(zhí)行機(jī)制通過(guò)遞進(jìn)式推理鏈實(shí)現(xiàn)任務(wù)的動(dòng)態(tài)收斂,包括:
46、若第t輪的工具輸出結(jié)果qt不滿足預(yù)設(shè)的終止條件,則系統(tǒng)執(zhí)行以下更新操作:其中,為第t輪輸入至所述領(lǐng)域大模型的經(jīng)處理的輸入文本,concat為拼接操作;更新后的作為下一輪的輸入,驅(qū)動(dòng)所述領(lǐng)域大模型繼續(xù)執(zhí)行判斷與調(diào)用過(guò)程,直至滿足所述終止條件。
47、該迭代執(zhí)行機(jī)制通過(guò)遞進(jìn)式推理鏈的設(shè)計(jì),使領(lǐng)域大模型能夠以動(dòng)態(tài)、自適應(yīng)的方式處理復(fù)雜多步任務(wù)。它將每一輪的工具輸出結(jié)果轉(zhuǎn)化為結(jié)構(gòu)化的中間提示,并迭代地反饋給模型,從而模擬了人類逐步推理、持續(xù)優(yōu)化的決策過(guò)程。這一機(jī)制不僅有效解決了單一輪次模型輸出可能不完整或不精確的問(wèn)題,還通過(guò)循環(huán)判斷與條件終止確保了任務(wù)執(zhí)行路徑的可靠收斂,大幅提升了智能體在應(yīng)對(duì)開放式、流程化垂直領(lǐng)域任務(wù)時(shí)的完成度、準(zhǔn)確性與自動(dòng)化水平。
48、有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具有如下顯著優(yōu)點(diǎn):1、通過(guò)設(shè)計(jì)提示策略對(duì)通用大模型進(jìn)行零樣本冷啟動(dòng)并執(zhí)行垂直領(lǐng)域任務(wù),再以知識(shí)蒸餾與多模型融合方式將領(lǐng)域大模型的知識(shí)遷移至多個(gè)輔助小模型,在保障任務(wù)適應(yīng)性的同時(shí)降低了部署與推理成本;2、通過(guò)業(yè)務(wù)流程提示詞和約束提示詞的組合引導(dǎo),配合迭代執(zhí)行機(jī)制與動(dòng)態(tài)輸入更新,使領(lǐng)域大模型能夠按預(yù)設(shè)流程判斷和調(diào)用外部工具,減少了模型自主決策的不確定性,增強(qiáng)了任務(wù)執(zhí)行的可控性和收斂性;3、基于線上回溯機(jī)制對(duì)模型輸出進(jìn)行人工修正和持續(xù)微調(diào),構(gòu)建領(lǐng)域大模型,并通過(guò)答案空間到標(biāo)簽空間的映射確保輸出與業(yè)務(wù)需求嚴(yán)格對(duì)應(yīng),從而提升了模型在專業(yè)場(chǎng)景下的輸出準(zhǔn)確性和領(lǐng)域知識(shí)適配能力;4、通過(guò)多模型融合方法對(duì)多個(gè)輔助小模型的輸出進(jìn)行加權(quán)評(píng)分與綜合,形成協(xié)同推理機(jī)制,不僅降低了單一模型的不確定性,還提升了整體任務(wù)處理的容錯(cuò)性與泛化性能。