本發(fā)明涉及自動(dòng)駕駛汽車測(cè)試,尤其是涉及一種交互測(cè)試場(chǎng)景生成方法。
背景技術(shù):
1、自動(dòng)駕駛技術(shù)正迅速向高等級(jí)演進(jìn),其安全性驗(yàn)證日益依賴于封閉場(chǎng)地測(cè)試。然而,現(xiàn)有測(cè)試場(chǎng)主要通過數(shù)據(jù)回放或預(yù)設(shè)規(guī)則腳本生成測(cè)試場(chǎng)景,在覆蓋復(fù)雜博弈交互中的長(zhǎng)尾分布情形方面存在顯著局限。具體而言,純規(guī)則驅(qū)動(dòng)方法因行為模式僵化而缺乏多樣性與現(xiàn)實(shí)交通動(dòng)態(tài)的一致性;單一生成式模型(如gan、vae或transformer)則在多模態(tài)行為分布的完整覆蓋與物理合理性之間難以兼顧,因此現(xiàn)有技術(shù)通過將多種模型結(jié)合用于進(jìn)行場(chǎng)景生成,具體而言,如中國(guó)專利申請(qǐng)cn120951770a,其提供了一種融合視覺語言大模型與擴(kuò)散模型的自動(dòng)駕駛關(guān)鍵測(cè)試場(chǎng)景生成方法,通過將擴(kuò)散模型和視覺語言大模型的結(jié)合,利用視覺大預(yù)言模型生成引導(dǎo)策略,通過該引導(dǎo)策略指引擴(kuò)散模型進(jìn)行測(cè)試場(chǎng)景生成。雖然解決了現(xiàn)有技術(shù)中自動(dòng)駕駛場(chǎng)景生成的閉環(huán)優(yōu)化不足,但其在生成過程中采用統(tǒng)一的生成策略作用于整段軌跡,若面對(duì)前期要求軌跡可控,而后期需要實(shí)現(xiàn)多模態(tài)分叉以充分覆蓋博弈交互可能性的交互場(chǎng)景生成,上述技術(shù)方案難以同時(shí)兼顧兩階段的差異化需求。
2、因此,如何生成前期軌跡可控而后期軌跡發(fā)散以確保充分覆蓋博弈交互可能性的交互場(chǎng)景,是需要解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種交互測(cè)試場(chǎng)景生成方法,旨在解決現(xiàn)有技術(shù)難以為復(fù)雜博弈交互場(chǎng)景生成階段差異以及高覆蓋的測(cè)試場(chǎng)景的問題。
2、本發(fā)明的目的可以通過以下技術(shù)方案來實(shí)現(xiàn):
3、本發(fā)明提供了一種交互測(cè)試場(chǎng)景生成方法,所述的方法包括:
4、獲取各交通參與者的當(dāng)前狀態(tài)、測(cè)試車輛的測(cè)試路徑以及各交通參與者和被測(cè)車輛的當(dāng)前交互關(guān)系,并基于高斯分布生成軌跡噪聲;所述的軌跡噪聲包括前段軌跡噪聲和后段軌跡噪聲;
5、對(duì)于每一交通參與者,執(zhí)行以下步驟獲取其對(duì)應(yīng)的交互軌跡:
6、基于所述的當(dāng)前狀態(tài)、當(dāng)前交互關(guān)系、前段軌跡噪聲以及當(dāng)前時(shí)刻,利用transformer模型生成交通參與者的前段軌跡,并輸出切換點(diǎn);
7、基于所述的后段軌跡噪聲以及測(cè)試路徑,利用條件擴(kuò)散模型生成所述的切換點(diǎn)后的后段多樣軌跡束;
8、將所述的前段軌跡與后段多樣軌跡束在切換點(diǎn)處進(jìn)行動(dòng)力學(xué)平滑銜接形成發(fā)散軌跡束;基于所述的發(fā)散軌跡束進(jìn)行動(dòng)力學(xué)可行性校驗(yàn)與交通規(guī)則一致性校驗(yàn),若滿足則計(jì)算軌跡價(jià)值并選取前top-k條高價(jià)值軌跡作為交互軌跡;
9、獲取每一交通參與者執(zhí)行所述的交互軌跡后的測(cè)試任務(wù)完成情況與碰撞狀態(tài),若所有測(cè)試任務(wù)完成或發(fā)生碰撞,則結(jié)束測(cè)試,并搜集場(chǎng)景數(shù)據(jù)用于交互測(cè)試場(chǎng)景生成;反之,則重新生成前段軌跡與后段多樣軌跡束。
10、作為優(yōu)選的技術(shù)方案,所述的transformer模型包括編碼器、解碼器和多個(gè)基模型;生成所述的前段軌跡的方法為:
11、將所述的當(dāng)前狀態(tài)和當(dāng)前交互關(guān)系利用第一編碼器進(jìn)行編碼,得到第一特征;將所述的前段軌跡噪聲利用第二編碼器進(jìn)行編碼,得到第二特征;將當(dāng)前時(shí)刻利用第三編碼器進(jìn)行編碼得到第三特征;
12、將所述的第一特征、第二特征和第三特征進(jìn)行融合編碼得到融合特征;所述的融合特征為第一特征與第二特征的交叉注意力項(xiàng)、第一特征與第三特征的交叉注意力項(xiàng)和第一特征之和;
13、基于所述的融合特征和前段軌跡噪聲,利用所述的解碼器,輸出前段軌跡參數(shù)分布的均值和協(xié)方差;
14、基于所述的均值和協(xié)方差利用基模型生成前段軌跡。
15、作為優(yōu)選的技術(shù)方案,獲取所述的第一特征、第二特征以及第三特征的方法為:
16、獲取第一特征,為:,表示時(shí)刻交通參與者的狀態(tài);表示時(shí)刻交通參與者的交互關(guān)系張量,基于所述的當(dāng)前交互關(guān)系獲取,為:,表示時(shí)刻交通參與者與智能體的相對(duì)位置,表示時(shí)刻交通參與者與智能體的相對(duì)速度,表示時(shí)刻交通參與者與智能體的距離,表示時(shí)刻的智能體包括交通參與者和被測(cè)車輛;表示將多維張量壓縮為一維向量;表示拼接處理;
17、獲取第二特征,為:,表示交通參與者的前段軌跡噪聲嵌入,,表示前段軌跡噪聲的權(quán)重,表示交通參與者的前段軌跡噪聲的采樣值且,表示交通參與者的前段軌跡噪聲,表示可學(xué)習(xí)參數(shù),表示為前段軌跡噪聲做全連接處理;表示對(duì)交通參與者的位置編碼;表示將層歸一化向量變成均值為0且方差為1的標(biāo)準(zhǔn)形式;
18、獲取第三特征,為:,其中:
19、;
20、;
21、表示時(shí)刻;表示預(yù)測(cè)事件的發(fā)生時(shí)刻;表示時(shí)間,且;表示正弦-余弦編碼頻率;表示正弦-余弦編碼頻率的索引。
22、作為優(yōu)選的技術(shù)方案,所述的基模型基于均值和協(xié)方差執(zhí)行以下步驟得到前段軌跡:
23、;
24、;
25、;
26、;
27、;
28、;
29、表示時(shí)刻交通參與者最終預(yù)測(cè)的集成平均不確定性;表示基模型總數(shù);表示在基模型中交通參與者的協(xié)方差矩陣;表示在基模型中交通參與者的均值;表示轉(zhuǎn)置;表示時(shí)刻交通參與者初始預(yù)測(cè)軌跡均值;表示時(shí)刻交通參與者協(xié)方差矩陣平方根;表示帶溫度控制的軌跡采樣函數(shù);表示溫度縮放系數(shù);表示7維標(biāo)準(zhǔn)高斯噪聲;表示均值為0,協(xié)方差矩陣為7為單位矩陣的正態(tài)分布;表示時(shí)刻交通參與者經(jīng)低溫校正后的預(yù)測(cè)軌跡均值;表示交通參與者在時(shí)間段中的前段軌跡。
30、作為優(yōu)選的技術(shù)方案,生成所述的后段多樣軌跡束的方法為:
31、獲取所述的切換點(diǎn)處交通參與者經(jīng)低溫校正后的預(yù)測(cè)軌跡均值,并結(jié)合交通參與者的前段軌跡噪聲嵌入與被測(cè)車輛測(cè)試軌跡生成交互條件向量;
32、基于所述的交互條件向量對(duì)后段軌跡噪聲進(jìn)行反向降噪后生成后段多樣軌跡束,為:
33、;
34、,;
35、表示交通參與者在第迭代步的第條軌跡對(duì)應(yīng)的后段軌跡噪聲;表示條件擴(kuò)散模型前向過程中到第迭代步的累計(jì)擴(kuò)散系數(shù);表示條件擴(kuò)散模型前向過程中到第迭代步的累計(jì)擴(kuò)散系數(shù);表示交通參與者在第迭代步的第條軌跡對(duì)應(yīng)的后段軌跡噪聲,且時(shí)有,表示擴(kuò)散時(shí)間窗口長(zhǎng)度為時(shí)的第條軌跡的后段軌跡噪聲;表示條件擴(kuò)散模型中由參數(shù)定義的噪聲預(yù)測(cè)神經(jīng)網(wǎng)絡(luò);表示交通參與者的第條軌跡對(duì)應(yīng)的后段軌跡噪聲對(duì)應(yīng)的交互條件向量;表示預(yù)設(shè)的噪聲保留強(qiáng)度;表示交通參與者在第迭代步第條軌跡的專屬隨機(jī)噪聲,且服從均值為0、協(xié)方差矩陣為階單位矩陣的正態(tài)分布;表示交通參與者的第條后段軌跡;表示交通參與者第條軌跡在終止步的后段軌跡噪聲;表示交通參與者的第條后段多樣性交互軌跡。
36、作為優(yōu)選的技術(shù)方案,所述的動(dòng)力學(xué)可行性校驗(yàn)的方法為:
37、對(duì)發(fā)散軌跡束中每一發(fā)散軌跡獲取其每一時(shí)刻軌跡點(diǎn)的加速度和曲率,對(duì)每一時(shí)刻軌跡點(diǎn),計(jì)算動(dòng)力學(xué)可行性指標(biāo),若所述的動(dòng)力學(xué)可行性指標(biāo)取值為1則判定該發(fā)散軌跡符合動(dòng)力學(xué)可行性約束;若所述的動(dòng)力學(xué)可行性指標(biāo)取值為0則判定該發(fā)散軌跡不符合動(dòng)力學(xué)可行性約束;
38、且動(dòng)力學(xué)可行性指標(biāo)計(jì)算式包括加速度的指示函數(shù)項(xiàng)和曲率驗(yàn)證的指示函數(shù)項(xiàng);對(duì)于所述的加速度的指示函數(shù)項(xiàng),僅當(dāng)軌跡點(diǎn)對(duì)應(yīng)加速度絕對(duì)值小于最大加速度時(shí)該項(xiàng)取1,否則取0;對(duì)于所述的曲率驗(yàn)證的指示函數(shù)項(xiàng),僅當(dāng)軌跡點(diǎn)對(duì)應(yīng)的曲率絕對(duì)值小于最大曲率時(shí),該項(xiàng)取1,否則取0。
39、作為優(yōu)選的技術(shù)方案,所述的交通規(guī)則一致性校驗(yàn)的方法為:
40、構(gòu)建包括停車線以及車道邊界的交通規(guī)則集合;
41、對(duì)于發(fā)散軌跡束中每一發(fā)散軌跡獲取其每一時(shí)刻軌跡點(diǎn)的速度,基于所述的交通規(guī)則集合計(jì)算交通規(guī)則一致性指標(biāo),為:
42、;
43、;
44、其中,表示對(duì)發(fā)散軌跡束中第條發(fā)散軌跡的交通規(guī)則一致性指標(biāo);表示發(fā)散軌跡的總時(shí)間步長(zhǎng);表示交通規(guī)則集合;表示發(fā)散軌跡中第個(gè)時(shí)間步對(duì)應(yīng)的軌跡點(diǎn)位置;表示子交通規(guī)則;表示計(jì)算軌跡點(diǎn)與交通規(guī)則的最短距離;表示基于速度計(jì)算的安全停車距離;表示指示函數(shù);表示查詢軌跡點(diǎn)的限速;表示反應(yīng)時(shí)間;表示最大加速度;表示最小停車距離;
45、若所述的交通規(guī)則一致性指標(biāo)取值為1則判定該發(fā)散軌跡符合交通規(guī)則一致性約束;若所述的交通規(guī)則一致性指標(biāo)取值為0則判定該發(fā)散軌跡不符合交通規(guī)則一致性約束。
46、作為優(yōu)選的技術(shù)方案,所述的方法還包括對(duì)所述的transformer模型和條件擴(kuò)散模型進(jìn)行訓(xùn)練,所述訓(xùn)練的過程為:
47、獲取智能體的真實(shí)復(fù)雜博弈交互軌跡數(shù)據(jù),進(jìn)行預(yù)處理后構(gòu)建為訓(xùn)練數(shù)據(jù)集,所述的訓(xùn)練數(shù)據(jù)集包括多條軌跡數(shù)據(jù);且每一所述的軌跡數(shù)據(jù)包括對(duì)應(yīng)智能體在每一時(shí)刻的狀態(tài),包括位置、航向角、速度、加速度、曲率和身份標(biāo)識(shí);所述的智能體包括交通參與者與被測(cè)車輛;
48、基于所述的訓(xùn)練數(shù)據(jù)集訓(xùn)練分別對(duì)transformer模型和條件擴(kuò)散模型進(jìn)行獨(dú)立訓(xùn)練,且在該訓(xùn)練過程中分別計(jì)算第一損失函數(shù)和第二損失函數(shù);其中所述的第一損失函數(shù)用于進(jìn)行transformer模型的參數(shù)優(yōu)化,所述的第二損失函數(shù)用于進(jìn)行條件擴(kuò)散模型的參數(shù)優(yōu)化,得到初始transformer模型和初始條件擴(kuò)散模型;
49、獲取獨(dú)立訓(xùn)練過程中生成的交互分段軌跡,并構(gòu)建交互分段軌跡集合,利用所述的交互分段軌跡集合聯(lián)合訓(xùn)練所述的初始transformer模型和初始條件擴(kuò)散模型,且在該訓(xùn)練過程中計(jì)算聯(lián)合損失函數(shù),用于更新初始transformer模型和初始條件擴(kuò)散模型的參數(shù)優(yōu)化,得到最終transformer模型和最終條件擴(kuò)散模型;所述的聯(lián)合損失函數(shù)為第一損失函數(shù)、第二損失函數(shù)和對(duì)抗對(duì)齊損失函數(shù)的加權(quán)和。
50、作為優(yōu)選的技術(shù)方案,所述的第一損失函數(shù)為:
51、;
52、;
53、其中,表示transformer模型的參數(shù);表示噪聲投影的可學(xué)習(xí)參數(shù);表示交通參與者的數(shù)量;表示起始時(shí)間;表示前段軌跡時(shí)間長(zhǎng)度;表示交通參與者的均值;表示前段軌跡的真值;表示方差損失的權(quán)重;表示交通參與者的協(xié)方差矩陣差的預(yù)測(cè)值;表示經(jīng)驗(yàn)協(xié)方差矩陣;和分別表示二范數(shù)和frobenius范數(shù)計(jì)算;表示噪聲對(duì)齊損失的權(quán)重;表示噪聲對(duì)齊損失函數(shù);表示期望計(jì)算;表示交通參與者的前段軌跡噪聲嵌入。
54、作為優(yōu)選的技術(shù)方案,所述的第二損失函數(shù)為:
55、;
56、;
57、其中,表示條件擴(kuò)散模型的模型參數(shù);表示后段軌跡生成的可學(xué)習(xí)參數(shù);表示期望計(jì)算;表示真實(shí)軌跡;表示后段軌跡噪聲集合;表示后段軌跡噪聲數(shù)量;表示第條后段軌跡噪聲;表示噪聲預(yù)測(cè)函數(shù);表示條件擴(kuò)散模型前向過程中到第迭代步的累計(jì)擴(kuò)散系數(shù);表示交通參與者的第條軌跡對(duì)應(yīng)的后段軌跡噪聲對(duì)應(yīng)的交互條件向量;表示前后段軌跡對(duì)齊損失的權(quán)重;表示前后段軌跡對(duì)齊損失函數(shù);表示在切換點(diǎn)對(duì)應(yīng)時(shí)刻交通參與者的初始預(yù)測(cè)軌跡均值;表示投影函數(shù);表示交通參與者在切換點(diǎn)的第條后段軌跡噪聲;表示速度對(duì)齊權(quán)重;表示前段軌跡終點(diǎn)的速度向量;表示后段軌跡起點(diǎn)的速度向量;表示二范數(shù)計(jì)算。
58、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
59、1)、為了解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供了一種基于transformer和條件擴(kuò)散融合模型的交互場(chǎng)景生成方法,利用了transformer能夠快速生成前期穩(wěn)定且可控的確定性軌跡,以及條件擴(kuò)散模型能夠?qū)崿F(xiàn)后期多模態(tài)分叉軌跡的優(yōu)勢(shì),具體而言通過transformer低溫度自回歸預(yù)測(cè)鎖定關(guān)鍵時(shí)空約束,再利用條件擴(kuò)散模型發(fā)散生成多模態(tài)后段軌跡簇;既保持交互軌跡在時(shí)間序列上的物理連續(xù)性與行為合理性,又顯著提高了模型對(duì)復(fù)雜博弈交互模式的表達(dá)能力。與現(xiàn)有依賴固定腳本相比,本發(fā)明在保證測(cè)試邏輯聚焦的同時(shí),大幅提升危險(xiǎn)場(chǎng)景與邊界工況的覆蓋率與可重現(xiàn)性。
60、2)、本發(fā)明還提供了一種多階段模型訓(xùn)練方法,通過在損失函數(shù)中引入切換點(diǎn)這一關(guān)鍵時(shí)空節(jié)點(diǎn),并圍繞其設(shè)置多重約束參數(shù),有效解決了前段可控軌跡與后段多樣軌跡之間的物理銜接與特征一致性問題;詳細(xì)的,在第二損失函數(shù)中強(qiáng)制后段擴(kuò)散模型生成的每一條軌跡束的起點(diǎn)位置,必須與前段transformer預(yù)測(cè)的軌跡終點(diǎn)在空間上精確匹配,同時(shí)通過速度對(duì)齊參數(shù)對(duì)前后兩段的速度矢量進(jìn)行加權(quán)約束,確保在切換瞬間運(yùn)動(dòng)狀態(tài)平滑過渡,從底層損失計(jì)算層面保證了生成軌跡在時(shí)序上的動(dòng)力學(xué)連續(xù)性與物理真實(shí)感;此外,還在聯(lián)合訓(xùn)練階段引入了對(duì)抗對(duì)齊損失參數(shù),進(jìn)一步推動(dòng)兩個(gè)異質(zhì)模型在共享潛在空間內(nèi)的特征分布趨于一致,消除了因模型架構(gòu)差異可能導(dǎo)致的特征表征鴻溝,使得前段輸出的確定性特征能夠被后段擴(kuò)散模型準(zhǔn)確理解并作為發(fā)散生成的有效條件,從而確保融合模型能夠兼顧擬合精度、生成多樣性以及前后段銜接的一致性。