本發明涉及多目標優化,尤其涉及一種基于動態權向量選擇的兩階段約束多目標優化進化方法。
背景技術:
1、約束多目標優化問題(constrained?multi-objective?optimization?problems,cmops)廣泛存在于工程優化與決策系統中,例如車輛路徑規劃、能源調度、生產調度等。該類問題需要在滿足一系列約束條件的前提下,同時優化多個相互沖突的目標函數,其解集構成受約束的帕累托前沿(constrained?pareto?front,cpf)。與無約束多目標優化問題相比,cmops的求解不僅需保證解集的收斂性與分布性,還必須滿足約束可行性,因此更為復雜。
2、目前,求解cmops的主流方法主要基于進化算法結合約束處理技術。常見的約束處理方法包括約束支配原則(constrained?dominance?principle,cdp)、懲罰函數法、-約束法、多目標轉化法等。然而,這些方法仍存在明顯局限:cdp過度強調可行性,可能導致早熟收斂;懲罰函數法需要合理設置罰因子,且對復雜約束適應性差;-約束法對閾值敏感,且隨著減小,對不可行區域的探索能力下降。此外,當cmops具有大范圍不可行區域、狹窄或離散的可行域時,傳統方法容易陷入局部最優,難以全面探索cpf。
3、近年來,為提高算法在復雜cmops上的性能,研究者提出了多種基于多種群、多階段以及多任務機制的約束多目標進化算法(constrained?multi-objective?evolutionaryalgorithms,cmoeas)。例如,通過引入輔助種群在不可行區域中探索,或采用多階段策略分步處理目標與約束。盡管這些方法在一定程度上提升了搜索能力,但仍存在以下問題:一是多數方法僅采用單一策略(如固定權向量或固定松弛閾值)利用不可行解,未能充分挖掘其隱含的搜索方向信息;二是當cpf稀疏、不連續或形狀不規則時,已有方法往往無法實現全面覆蓋,導致解集多樣性與收斂性不足;三是不同種群或階段之間的協作機制較為簡單,未能實現搜索方向的自適應引導與計算資源的高效分配。
4、因此,如何在復雜約束環境下,動態引導種群搜索方向、平衡可行性與目標優化、并實現cpf的全面逼近,仍是當前約束多目標優化領域亟待解決的關鍵技術問題。
技術實現思路
1、為此,本發明實施例提供了一種基于動態權向量選擇的兩階段約束多目標優化進化方法,用于解決現有技術中因采用單一策略利用不可行解而導致潛在搜索方向挖掘不足、在復雜約束下對稀疏或離散的約束帕累托前沿覆蓋不全、以及計算資源分配效率低的問題。
2、為了解決上述技術問題,本發明實施例提供一種基于動態權向量選擇的兩階段約束多目標優化進化方法,該方法包括以下步驟:
3、初始化階段:生成一組均勻分布的權向量,隨機初始化三個種群、和,每個種群包含個個體,初始化外部檔案為空集,并設置階段切換參數;
4、第一階段進化:在函數評估次數小于時,并行進化所述三個種群,其中在完整約束下進化,在約束松弛條件下進化,在無約束條件下進化,三者通過弱協作機制交換信息,并將可行解存入外部檔案,其中表示最大函數評估次數;
5、第二階段進化:當函數評估次數達到或超過時,停用,保留繼續在約束松弛條件下進化,則采用基于動態權向量選擇的搜索機制更新,并與協同進化;
6、動態權向量選擇:基于和外部檔案在目標空間的分布,動態選擇一組權向量,用于引導的搜索方向;
7、檔案更新:從和中選取高質量可行解更新外部檔案;
8、輸出階段:當函數評估次數達到最大函數評估次數時,輸出外部檔案作為最終解集。
9、優選地,所述第一階段中,的約束松弛閾值隨進化代數動態遞減,計算公式為:
10、,
11、其中,為初始約束松弛值,表示最大進化代數,為衰減速率。
12、優選地,所述動態權向量選擇包括以下步驟:
13、對和外部檔案中的個體進行目標值歸一化;
14、將每個歸一化個體關聯至最近的權向量;
15、選取所有被關聯的權向量及其鄰域權向量,構成動態權向量集合。
16、優選地,所述鄰域權向量通過預計算的權向量鄰域關系表獲取,每個權向量的鄰域數量為。
17、優選地,所述第二階段中的更新采用基于動態向量的搜索機制,包括:
18、從外部檔案中提取非支配可行解集;
19、將候選解集劃分為位于潛在區域的解集和其他解集;
20、若中個體數少于,則從外部檔案中補充個體;
21、將中個體按動態權向量劃分至子區域,基于約束違反度和聚合函數值進行環境選擇,更新。
22、優選地,所述聚合函數為歸一化tchebycheff函數,計算公式為:
23、,
24、其中,為歸一化的加權切比雪夫標量化函數值,為決策空間中的一個候選解,表示與第個子區域對應的參考向量,為待優化問題的目標函數的總數,為參考向量的第個分量,為解的第個歸一化后的目標函數值。
25、優選地,所述檔案更新步驟包括:
26、從和中隨機選取個個體;
27、將選取的個體與當前檔案合并,篩選出所有可行解;
28、若可行解數量超過,則采用spea2算法的環境選擇策略進行截斷。
29、優選地,所述階段切換參數的取值為0、0.2、0.4、0.6、0.8或1,優選值為0.2。
30、優選地,所述三個種群、、的規模相同,均為,其中根據目標數量設定:對于雙目標問題,對于三目標問題。
31、優選地,所述方法適用于車輛路徑規劃、能源調度、流水車間調度中的約束多目標優化問題。
32、從以上技術方案可以看出,本發明申請具有以下有益效果:
33、(1)本發明提出的動態權向量選擇(dwvs)機制,能夠依據約束松弛種群在目標空間的實時分布,自適應地聚焦于最具潛力的搜索方向,并淘汰無效方向。這克服了傳統采用固定、均勻權向量方法在探索稀疏、離散或狹窄的受限帕累托前沿(cpf)時存在的盲目性和資源浪費問題,實現了對復雜形狀cpf由粗到細的精確覆蓋。
34、(2)本發明設計的基于動態向量的搜索機制(dvsm),在環境選擇中創造性地引入了“潛在區域”概念,優先保留能有效拓展cpf范圍的高質量解(包括部分有潛力的不可行解),再結合聚合函數進行篩選。該方法避免了傳統約束支配原則過度偏好可行解而導致的早熟收斂和多樣性損失,同時通過外部檔案確保最終解集的可行性,從而在收斂性、可行性和多樣性間取得了更優的權衡。
35、(3)本發明構建的雙階段協同進化框架具有明確分工和協作機制。第一階段利用多策略種群實現全局探索和穿越不可行區域;第二階段通過dwvs和dvsm進行局部精細開發。兩個階段通過弱協作機制和共享檔案實現知識遷移,使得算法能夠自動適應不同特征的約束優化問題(如大范圍不可行區域、狹窄可行域等),在廣泛的基準測試和實際應用問題上均表現出一致且優越的性能。