基于大模型技術(shù)的低成本訓(xùn)練及多輪對(duì)話記憶性方法與流程

文檔序號(hào)：45269973發(fā)布日期：2026-04-17 20:06閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于自然語(yǔ)言處理和人工智能，具體為基于大模型技術(shù)的低成本訓(xùn)練及多輪對(duì)話記憶性方法。

背景技術(shù)：

1、大模型技術(shù)是指利用深度學(xué)習(xí)中的大型神經(jīng)網(wǎng)絡(luò)模型，如transformer模型、bert模型、gpt模型等，在自然語(yǔ)言處理和生成任務(wù)中進(jìn)行訓(xùn)練和應(yīng)用，這些大模型具有更多的參數(shù)和更強(qiáng)的表示能力，可以對(duì)復(fù)雜的語(yǔ)言結(jié)構(gòu)和語(yǔ)義進(jìn)行建模。

2、利用大模型分析整個(gè)對(duì)話歷史，可以捕捉上下文關(guān)系，實(shí)現(xiàn)更準(zhǔn)確、連貫的回復(fù)，在對(duì)話過(guò)程中不斷改進(jìn)回復(fù)策略，通過(guò)學(xué)習(xí)用戶反饋和行為進(jìn)行及時(shí)調(diào)整，捕捉用戶個(gè)性和口吻，能夠使得回復(fù)更具個(gè)性化；通過(guò)學(xué)習(xí)用戶偏好和個(gè)性化表達(dá)方式，更好地適應(yīng)用戶個(gè)體差異，以及提供問(wèn)題引導(dǎo)、建議和提示，促使用戶更積極參與對(duì)話，了解用戶需求并提供有針對(duì)性的信息和幫助等。

3、盡管大模型技術(shù)在自然語(yǔ)言處理和對(duì)話系統(tǒng)領(lǐng)域取得了顯著的進(jìn)展，但仍然存在一些技術(shù)缺陷和挑戰(zhàn)，訓(xùn)練和運(yùn)行大型模型需要大量計(jì)算資源，這可能對(duì)中小規(guī)模的企業(yè)或研究團(tuán)隊(duì)造成負(fù)擔(dān)，大型模型通常需要在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練，其中可能包含用戶的敏感信息，如何在訓(xùn)練過(guò)程中有效保護(hù)用戶隱私成為一個(gè)重要問(wèn)題，大型模型可能對(duì)對(duì)抗攻擊敏感，微小擾動(dòng)可能導(dǎo)致錯(cuò)誤輸出，這對(duì)于對(duì)話系統(tǒng)尤為重要，因用戶可能提供誤導(dǎo)性輸入，以及處理長(zhǎng)文本或長(zhǎng)時(shí)序任務(wù)時(shí)可能難以捕捉長(zhǎng)時(shí)依賴關(guān)系，限制了上下文理解能力。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供基于大模型技術(shù)的低成本訓(xùn)練及多輪對(duì)話記憶性方法，以解決上述背景技術(shù)中提出的問(wèn)題。

2、為了實(shí)現(xiàn)上述目的，本發(fā)明提供如下技術(shù)方案：基于大模型技術(shù)的低成本訓(xùn)練及多輪對(duì)話記憶性方法，該低成本訓(xùn)練及多輪對(duì)話記憶性方法步驟為；

3、s1，遷移學(xué)習(xí)；在選擇預(yù)訓(xùn)練模型時(shí)，確保與模型提供商進(jìn)行充分的溝通，了解模型的優(yōu)勢(shì)、限制和適用范圍，以便選擇最符合需求的模型；此外，如果數(shù)據(jù)不足以滿足模型的要求，可以考慮進(jìn)行數(shù)據(jù)擴(kuò)充；

4、s2，數(shù)據(jù)增強(qiáng)技術(shù)；在應(yīng)用這些數(shù)據(jù)增強(qiáng)技術(shù)時(shí)，需要根據(jù)具體數(shù)據(jù)和任務(wù)特點(diǎn)選擇合適的算法，并確保增強(qiáng)后的數(shù)據(jù)仍保留原始數(shù)據(jù)的特征和語(yǔ)義，通過(guò)人工審核或自動(dòng)化檢查來(lái)確保增強(qiáng)后的數(shù)據(jù)質(zhì)量，避免引入臟數(shù)據(jù)或錯(cuò)誤信息；

5、s3,自動(dòng)調(diào)參；選擇合適的調(diào)參算法來(lái)確定適用于問(wèn)題，定義超參數(shù)空間，確定需要調(diào)節(jié)的超參數(shù)的范圍和取值，實(shí)施自動(dòng)調(diào)參算法，通過(guò)不斷地嘗試不同的超參數(shù)組合來(lái)尋找最優(yōu)的模型配置；

6、s4，分階段訓(xùn)練；通過(guò)在較小數(shù)據(jù)集上訓(xùn)練出高性能的模型，在訓(xùn)練過(guò)程中監(jiān)控模型的性能，并根據(jù)驗(yàn)證集的表現(xiàn)及時(shí)調(diào)整模型結(jié)構(gòu)和參數(shù)；

7、s5，模型剪枝和壓縮；優(yōu)化模型的大小和復(fù)雜度，使其在保持性能的前提下更加輕量化和高效，主要分為剪枝、壓縮、保持性能三個(gè)方面；

8、s6，風(fēng)控和檢測(cè)；設(shè)計(jì)模型風(fēng)控機(jī)制，通過(guò)對(duì)敏感詞的屏蔽，實(shí)施檢測(cè)算法實(shí)時(shí)檢測(cè)用戶對(duì)話，模型進(jìn)行周期性監(jiān)測(cè)的措施；

9、s7，流式傳輸技術(shù)；優(yōu)化流式傳輸?shù)乃俣炔⑻岣咝?，使用算法?shí)現(xiàn)流式編碼和解碼，對(duì)整體輸出進(jìn)行分塊編碼，逐個(gè)編碼并輸出一個(gè)數(shù)據(jù)塊，以實(shí)現(xiàn)流式傳輸和處理；

10、s8，儲(chǔ)存聊天的算法；對(duì)聊天記錄進(jìn)行儲(chǔ)存管理，使用數(shù)據(jù)存儲(chǔ)系統(tǒng)對(duì)聊天記錄進(jìn)行持久化保存，對(duì)超過(guò)10條的聊天記錄實(shí)施定期的清理，根據(jù)業(yè)務(wù)場(chǎng)景和需求來(lái)調(diào)整保存的聊天記錄條數(shù)，對(duì)于一些對(duì)話頻繁的場(chǎng)景，適當(dāng)增加保存的聊天記錄條數(shù)，而對(duì)于一些較為靜態(tài)的場(chǎng)景，則可以減少保存的聊天記錄條數(shù)。

11、優(yōu)選地，所述s1中的遷移學(xué)習(xí)步驟包括有：

12、a1，調(diào)查已有的預(yù)訓(xùn)練模型；在選擇預(yù)訓(xùn)練模型之前，需要先了解已有的預(yù)訓(xùn)練模型，并選擇與小公司任務(wù)相符的模型，通過(guò)文獻(xiàn)調(diào)研、網(wǎng)絡(luò)搜索、論壇討論的方式，找到具有相關(guān)特征和性能的預(yù)訓(xùn)練模型，并進(jìn)行評(píng)估和比較；

13、a2，考慮模型的架構(gòu)、性能和對(duì)特定領(lǐng)域的適應(yīng)能力；在選擇預(yù)訓(xùn)練模型時(shí)，需要考慮其架構(gòu)、性能和對(duì)特定領(lǐng)域的適應(yīng)能力的因素；

14、a3，下載或使用深度學(xué)習(xí)框架提供的預(yù)訓(xùn)練模型權(quán)重；在選擇好適合小公司任務(wù)的預(yù)訓(xùn)練模型后，從開(kāi)源社區(qū)或深度學(xué)習(xí)框架提供的模型庫(kù)中獲取預(yù)訓(xùn)練模型的權(quán)重，以加快模型訓(xùn)練和優(yōu)化的速度；

15、a4，在訓(xùn)練環(huán)境中加載這些參數(shù)；下載預(yù)訓(xùn)練模型參數(shù)后，需要在訓(xùn)練環(huán)境中加載這些參數(shù)，以確保模型初始狀態(tài)具有較好的性能，能夠使用開(kāi)源深度學(xué)習(xí)框架提供的api接口來(lái)加載預(yù)訓(xùn)練模型參數(shù)，并進(jìn)行測(cè)試和驗(yàn)證；

16、a5，準(zhǔn)備小公司任務(wù)的特定數(shù)據(jù)集；在加載預(yù)訓(xùn)練模型參數(shù)后，需要準(zhǔn)備小公司任務(wù)的特定數(shù)據(jù)集，以便對(duì)模型進(jìn)行微調(diào)和優(yōu)化；

17、a6，使用適當(dāng)?shù)膿p失函數(shù)和優(yōu)化器進(jìn)行微調(diào)；在準(zhǔn)備好小公司任務(wù)的特定數(shù)據(jù)集后，使用適當(dāng)?shù)膿p失函數(shù)和優(yōu)化器對(duì)模型進(jìn)行微調(diào)和優(yōu)化，以提高模型的性能和適應(yīng)能力，選擇交叉熵、均方誤差等常見(jiàn)的損失函數(shù)，進(jìn)行模型微調(diào)和訓(xùn)練。

18、優(yōu)選地，所述s2中的增強(qiáng)數(shù)據(jù)技術(shù)包括有：

19、b1，在進(jìn)行數(shù)據(jù)增強(qiáng)之前，根據(jù)任務(wù)類型選擇適用的數(shù)據(jù)增強(qiáng)算法，對(duì)于圖像分類任務(wù)，使用旋轉(zhuǎn)、縮放、裁剪、平移、翻轉(zhuǎn)等圖像增強(qiáng)算法；對(duì)于文本分類任務(wù)，使用詞匯替換、同義詞替換、句子重組的方法進(jìn)行文本擴(kuò)充算法；

20、b2，選擇了適用的數(shù)據(jù)增強(qiáng)算法，將其應(yīng)用于訓(xùn)練數(shù)據(jù)集上，生成更多樣性的訓(xùn)練樣本，在圖像分類任務(wù)中，將圖像進(jìn)行旋轉(zhuǎn)、縮放、裁剪的操作來(lái)生成更多變化的圖像樣本，在應(yīng)用增強(qiáng)算法時(shí)，保持增強(qiáng)后數(shù)據(jù)的真實(shí)性，確保其保留原始數(shù)據(jù)的統(tǒng)計(jì)特性；

21、b3，對(duì)于不同的數(shù)據(jù)類型和任務(wù)，定制化增強(qiáng)算法，以保留關(guān)鍵數(shù)據(jù)特征，在圖像分類任務(wù)中，如果存在特定的目標(biāo)物體，使用目標(biāo)檢測(cè)算法來(lái)定位和擴(kuò)充目標(biāo)物體；在文本分類任務(wù)中，根據(jù)任務(wù)需求設(shè)計(jì)特定的語(yǔ)義替換規(guī)則，以保留關(guān)鍵詞匯和語(yǔ)義信息。

22、優(yōu)選地，所述s3中的自動(dòng)調(diào)參處理步驟包括有：

23、c1,列出模型的關(guān)鍵超參數(shù)：

24、如學(xué)習(xí)率(learning?rate)

25、批量大小(batch?size)

26、正則化參數(shù)(regularization?parameter)

27、決策樹(shù)最大深度(max?depth?of?decision?tree)

28、樹(shù)的數(shù)量(number?of?trees)

29、k值(k?value)

30、神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)數(shù)；

31、c2,確定超參數(shù)搜索的范圍和步長(zhǎng)：對(duì)于每個(gè)超參數(shù)，確定搜索的范圍和步長(zhǎng)，學(xué)習(xí)率可從0.001到0.1，步長(zhǎng)可設(shè)定為0.01；批量大小可選擇64、128、256等不同的取值,通過(guò)網(wǎng)格搜索(grid?search)、隨機(jī)搜索(random?search)或貝葉斯優(yōu)化等方法，在超參數(shù)空間中搜索最佳的超參數(shù)組合；

32、c3,將集成選擇的調(diào)參算法應(yīng)用到訓(xùn)練流程中：使用集成學(xué)習(xí)選擇的調(diào)參算法，來(lái)幫助確定最佳的超參數(shù)組合,通過(guò)集成選擇的算法在超參數(shù)空間中進(jìn)行搜索，并找到效果較好的超參數(shù)組合；

33、c4,設(shè)置合適的停止條件：在進(jìn)行超參數(shù)搜索時(shí)，需要設(shè)置合適的停止條件，以確保算法在合理的時(shí)間內(nèi)找到最佳超參數(shù)組合,基于訓(xùn)練誤差或驗(yàn)證誤差的變化情況來(lái)設(shè)定停止條件，當(dāng)誤差趨于穩(wěn)定時(shí)停止搜索，避免過(guò)度擬合和浪費(fèi)計(jì)算資源。

34、優(yōu)選地，所述s4中的分階段訓(xùn)練步驟包括有：

35、d1,定義訓(xùn)練任務(wù)的階段：深度學(xué)習(xí)模型訓(xùn)練可以分為多個(gè)階段，每個(gè)階段解決問(wèn)題的一個(gè)特定方面；

36、d2,從一個(gè)簡(jiǎn)單的模型開(kāi)始：在每個(gè)階段開(kāi)始時(shí)，從一個(gè)簡(jiǎn)單的模型開(kāi)始，逐漸引入更多的層和參數(shù)；

37、d3,評(píng)估模型的性能：在每個(gè)階段結(jié)束后，需要對(duì)模型的性能進(jìn)行評(píng)估，以確定其在解決特定問(wèn)題上的表現(xiàn),使用各種評(píng)價(jià)指標(biāo)，來(lái)評(píng)估模型的性能；

38、d4,使用相對(duì)較小的數(shù)據(jù)集進(jìn)行訓(xùn)練：在每個(gè)階段，可以使用相對(duì)較小的數(shù)據(jù)集進(jìn)行訓(xùn)練，以降低計(jì)算成本,通過(guò)隨機(jī)采樣或者數(shù)據(jù)增強(qiáng)等技術(shù)來(lái)實(shí)現(xiàn)，以便在小數(shù)據(jù)集上訓(xùn)練出具有良好性能的模型；

39、d5,確保每個(gè)階段的模型都在小數(shù)據(jù)集上獲得了良好的性能：在每個(gè)階段結(jié)束后，需要確保該階段的模型在小數(shù)據(jù)集上獲得了良好的性能,以便確定模型的泛化能力，并避免過(guò)擬合。

40、優(yōu)選地，所述s5中的數(shù)據(jù)處理步驟包括有：

41、e1,使用剪枝算法去除不重要的連接和參數(shù)：剪枝算法可以幫助減少模型的復(fù)雜度和計(jì)算量；

42、e2,根據(jù)模型的敏感性進(jìn)行剪枝：在剪枝過(guò)程中，需要考慮模型的敏感性，確保剪枝后性能下降最小；

43、e3,應(yīng)用模型壓縮技術(shù)，模型壓縮技術(shù)進(jìn)一步減小模型的體積，提高模型的推理速度；

44、e4,在壓縮后評(píng)估模型性能：在對(duì)模型進(jìn)行剪枝和壓縮后，對(duì)壓縮后的模型性能進(jìn)行評(píng)估；

45、e5,進(jìn)行端到端的性能評(píng)估：在剪枝和壓縮后，需要進(jìn)行端到端的性能評(píng)估，確保模型在壓縮后仍然具有足夠的性能。

46、優(yōu)選地，所述s6中的風(fēng)控和檢測(cè)處理步驟包括有；

47、f1,定義不公平或不合規(guī)回答的風(fēng)險(xiǎn)標(biāo)準(zhǔn)：明確定義什么樣的回答被認(rèn)為是不公平或不合規(guī)的，并制定相應(yīng)的風(fēng)險(xiǎn)標(biāo)準(zhǔn)；

48、f2,制定風(fēng)控策略：基于定義的風(fēng)險(xiǎn)標(biāo)準(zhǔn)，制定相應(yīng)的風(fēng)控策略，建立審核機(jī)制，對(duì)可能存在風(fēng)險(xiǎn)的回答進(jìn)行人工審核和審查；

49、f3,設(shè)計(jì)和實(shí)施算法來(lái)監(jiān)測(cè)模型輸出：開(kāi)發(fā)算法來(lái)監(jiān)測(cè)模型輸出，識(shí)別潛在的不合規(guī)回答或風(fēng)險(xiǎn)輸出，并及時(shí)采取相應(yīng)措施進(jìn)行處理；

50、f4,使用驗(yàn)證集或真實(shí)場(chǎng)景數(shù)據(jù)進(jìn)行算法的訓(xùn)練和測(cè)試：在開(kāi)發(fā)監(jiān)測(cè)算法時(shí)，需要使用驗(yàn)證集或者真實(shí)場(chǎng)景數(shù)據(jù)進(jìn)行算法的訓(xùn)練和測(cè)試，以確保算法的有效性和準(zhǔn)確性；

51、f5,定期監(jiān)測(cè)模型在生產(chǎn)環(huán)境中的性能：對(duì)部署在生產(chǎn)環(huán)境中的模型進(jìn)行定期監(jiān)測(cè)，檢查模型輸出是否符合預(yù)期，并及時(shí)調(diào)整和優(yōu)化模型。

52、優(yōu)選地，所述s7中的流式傳輸技術(shù)包括有；

53、g1,使用適當(dāng)?shù)募夹g(shù)實(shí)現(xiàn)流式傳輸：分塊傳輸：將數(shù)據(jù)分成較小的塊進(jìn)行傳輸，以提高傳輸效率；逐字傳輸：按照字節(jié)的順序逐字傳輸數(shù)據(jù)，使接收方能夠盡早開(kāi)始處理數(shù)據(jù)，而無(wú)需等待整個(gè)文本的完整傳輸；

54、g2,針對(duì)特定硬件和網(wǎng)絡(luò)環(huán)境進(jìn)行優(yōu)化：根據(jù)目標(biāo)設(shè)備的性能和資源限制，針對(duì)特定硬件進(jìn)行優(yōu)化；

55、g3,數(shù)據(jù)壓縮和編碼：在傳輸過(guò)程中，可以使用數(shù)據(jù)壓縮技術(shù)來(lái)減小數(shù)據(jù)的體積，從而降低傳輸延遲和帶寬消耗；

56、g4,優(yōu)先級(jí)和調(diào)度策略：根據(jù)數(shù)據(jù)的重要性和優(yōu)先級(jí)，設(shè)置合適的傳輸順序和調(diào)度策略，確保關(guān)鍵數(shù)據(jù)能夠優(yōu)先傳輸，以提供及時(shí)的反饋；

57、g5,并行處理和多線程技術(shù)：利用并行處理和多線程技術(shù)，同時(shí)處理多個(gè)數(shù)據(jù)塊或字節(jié)，加快數(shù)據(jù)的傳輸和處理速度。

58、優(yōu)選地，所述s8中的儲(chǔ)存聊天的算法數(shù)據(jù)處理步驟包括有；

59、h1,開(kāi)發(fā)算法以有效地保存用戶的聊天歷史：使用數(shù)據(jù)庫(kù)或其他數(shù)據(jù)存儲(chǔ)技術(shù)，將用戶的聊天歷史保存下來(lái)；使用自然語(yǔ)言處理技術(shù)，將用戶聊天歷史進(jìn)行分析和建模；

60、h2,在多輪對(duì)話中，將用戶歷史聊天和當(dāng)前prompt結(jié)合，形成上下文：需要從用戶歷史聊天中提取有用的信息，例如用戶的意圖、偏好、情感等，作為上下文信息；然后將上下文信息與當(dāng)前的prompt結(jié)合起來(lái)，以生成合理的回復(fù)；

61、h3,考慮對(duì)話歷史的權(quán)重，以確保最近的對(duì)話更具影響力：對(duì)于多輪對(duì)話系統(tǒng)，最近的對(duì)話可能比早期的對(duì)話更具影響力，因此需要考慮對(duì)話歷史的權(quán)重；

62、h4,確保在對(duì)話中一致地使用和更新上下文信息：在多輪對(duì)話系統(tǒng)中，需要確保在不同的回復(fù)中一致地使用和更新上下文信息。

63、本發(fā)明的有益效果如下：

64、1、本發(fā)明訓(xùn)練成本降低：通過(guò)利用預(yù)訓(xùn)練模型的知識(shí)，在新任務(wù)上進(jìn)行微調(diào)，可以顯著減少訓(xùn)練成本并加快模型收斂速度，使用自動(dòng)調(diào)參技術(shù)，從而降低調(diào)參的時(shí)間成本，將模型訓(xùn)練分解成多個(gè)階段，逐步增加模型復(fù)雜度和數(shù)據(jù)量，以降低單次訓(xùn)練的成本；模型回答效率有效提升：通過(guò)將用戶輸入的大段文本分塊或分字逐步傳輸給模型，可以降低用戶等待時(shí)間，提高回答效率，此外在處理用戶輸入時(shí)，可以使用異步處理技術(shù)來(lái)同時(shí)處理多個(gè)用戶請(qǐng)求，從而提高系統(tǒng)的并發(fā)性能和響應(yīng)速度；用戶對(duì)話不會(huì)出現(xiàn)割裂感：確保用戶的聊天記錄被安全地存儲(chǔ)，同時(shí)遵循相關(guān)隱私法規(guī)，以保護(hù)用戶數(shù)據(jù)安全和隱私，根據(jù)聊天記錄調(diào)整回復(fù)：通過(guò)利用用戶的歷史對(duì)話記錄，包括意圖、偏好等信息，來(lái)個(gè)性化調(diào)整模型的回復(fù)，以提供更符合用戶期望的交互體驗(yàn)；模型大小減少：通過(guò)剪枝、量化等技術(shù)來(lái)減小模型的體積，從而降低部署成本，同時(shí)確保模型效果不會(huì)顯著下降，使用模型壓縮技術(shù)來(lái)減小模型的大小，以便更容易部署到資源有限的設(shè)備上；所需數(shù)據(jù)量減少：通過(guò)數(shù)據(jù)增強(qiáng)技術(shù)可以擴(kuò)充數(shù)據(jù)集，提高模型的泛化能力，減少對(duì)大量數(shù)據(jù)的依賴，在訓(xùn)練過(guò)程中使用正則化技術(shù)來(lái)防止模型過(guò)擬合，同時(shí)保證模型在少量數(shù)據(jù)上也能取得良好效果。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：倪涵樹(shù)
技術(shù)所有人：北京中煙創(chuàng)新科技有限公司
我是此專利的發(fā)明人

上一篇：一種食堂稱重結(jié)算一體機(jī)的制作方法
下一篇：一種自動(dòng)補(bǔ)料方法及系統(tǒng)與流程

該領(lǐng)域下的技術(shù)專家

1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)

2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制

3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)

4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)

5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用

網(wǎng)友詢問(wèn)留言留言:0條

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

文明留言，給您點(diǎn)贊！

同類技術(shù)