本技術涉及計算機,具體涉及一種語義載荷高斯潑濺建模方法、裝置、設備和存儲介質。
背景技術:
1、近年來,三維重建與場景建模技術在數字孿生、自動駕駛、高精度地圖構建、工業檢測、電力巡檢及虛擬現實等領域得到廣泛應用。隨著多視圖重建技術與神經渲染技術的發展,基于高斯混合模型的三維表達方式,尤其是三維高斯潑濺(3d?gaussian?splatting,3dgs)建模方法,因其具有高渲染效率、高表達精度及良好的可微分特性,逐漸成為實時三維重建領域的重要技術路線。現有方法主要集中在幾何重建精度提升、渲染效率優化以及可視化質量增強等方面,而對模型內部語義信息的表達與利用關注相對不足。
2、然而,在實際應用場景中,僅有幾何結構信息往往無法滿足工業級應用需求。例如,在電力數字孿生系統中,不僅需要構建高精度的三維設備模型,還需要對設備類別、功能區域、風險等級等語義信息進行區分與識別;在自動駕駛場景中,車輛、行人、路面等語義標簽對于決策系統具有決定性作用。因此,如何在保持幾何建模精度不受影響的前提下,使三維模型本身具備語義表達能力,成為當前技術發展的重要問題。
3、現有技術中通常存在以下幾種處理方式。
4、后處理分類方式:在完成幾何建模后,額外訓練獨立的分類網絡對空間點或體素進行語義預測。這種方法增加了模型復雜度,并且語義模塊與幾何模塊解耦,導致推理階段需雙模型協同,計算成本較高。
5、聯合訓練耦合方式:在幾何建模階段引入語義監督信號,通過多任務損失函數共同優化幾何與語義參數。該方法雖然實現了語義嵌入,但由于幾何優化目標與語義目標同時作用于共享參數,往往會改變幾何最優解,導致幾何邊緣分布發生偏移,影響建模精度。
6、直接標簽附著方式:將已有標簽簡單綁定到對應3d高斯原語上。這種方式缺乏概率表達能力,無法刻畫語義不確定性,也未從生成模型角度建立語義與幾何的統一概率結構,創新性與理論完整性不足。
7、上述處理方式方法均未從概率生成模型層面對“幾何與語義解耦且嚴格無損”這一問題給出系統解決方案。
技術實現思路
1、有鑒于此,本技術所要解決的技術問題是:如何實現對3dgs模型的語義嵌入而不改變其幾何邊緣分布。
2、為解決上述技術問題,本技術提供如下技術方案:
3、第一方面,本技術提供一種語義載荷高斯潑濺建模方法,包括:
4、基于場景的稀疏點云,構建3d高斯原語集合,初始化所述3d高斯原語集合中每個3d高斯原語的幾何參數;
5、通過可微渲染過程對所述3d高斯原語的幾何參數進行迭代更新直至收斂,將所述3d高斯原語更新為幾何最優原語;
6、獲取場景的樣本點及其語義監督信息,計算所述幾何最優原語對所述樣本點的解釋權重,結合該解釋權重與所述樣本點的語義監督信息進行處理,得到所述幾何最優原語的語義載荷分布;
7、獲取場景的空間點,計算所述幾何最優原語對所述空間點的解釋權重,結合該解釋權重與所述幾何最優原語的語義載荷分布進行處理,得到所述空間點的語義后驗概率和語義熵并輸出。
8、在第一方面的一種可選方案中,所述通過可微渲染過程對所述3d高斯原語的幾何參數進行迭代更新直至收斂,將所述3d高斯原語更新為幾何最優原語,包括:
9、通過可微渲染過程將所述3d高斯原語投影到圖像平面,生成渲染圖像,并得到所述渲染圖像相對于所述3d高斯原語的梯度;
10、利用所述梯度,以最小化所述渲染圖像的渲染誤差為優化目標,對所述3d高斯原語的幾何參數進行迭代更新直至收斂,將所述3d高斯原語更新為幾何最優原語。
11、在第一方面的一種可選方案中,所述獲取場景的樣本點及其語義監督信息,計算所述幾何最優原語對所述樣本點的解釋權重,結合該解釋權重與所述樣本點的語義監督信息進行處理,得到所述幾何最優原語的語義載荷分布,包括:
12、獲取場景的樣本點及其語義監督信息,通過所述幾何最優原語對所述樣本點的貢獻值,計算所述幾何最優原語對所述樣本點的解釋權重;
13、將所述幾何最優原語對所述樣本點的解釋權重與所述樣本點的語義監督信息相結合,得到所述幾何最優原語的語義軟計數;
14、基于所述幾何最優原語的語義軟計數進行處理,得到歸一化的所述幾何最優原語的語義載荷分布。
15、在第一方面的一種可選方案中,所述幾何最優原語對所述樣本點的解釋權重的計算公式為:
16、;
17、式中:表示第個樣本點;表示所述3d高斯原語集合中幾何最優原語的數目;表示所述3d高斯原語集合中第個幾何最優原語的幾何參數的集合;表示所述第個幾何最優原語對所述第個樣本點的解釋權重;表示所述第個幾何最優原語對所述第個樣本點的貢獻值;為所述第個幾何最優原語對所述樣本點的貢獻函數,變量為所述樣本點。
18、在第一方面的一種可選方案中,所述幾何最優原語的語義軟計數的計算公式為:
19、;
20、式中:表示所述樣本點的數目;為所述第個樣本點關于第種語義類別的語義監督信息;表示所述第個幾何最優原語對所述第種語義類別的語義軟計數。
21、在第一方面的一種可選方案中,所述樣本點的語義監督信息為硬標簽;若第個所述樣本點的語義屬于所述第種語義類別,則;否則,。
22、在第一方面的一種可選方案中,所述樣本點的語義監督信息為軟標簽;所述軟標簽為所述第個樣本點的語義屬于第種語義類別的概率。
23、在第一方面的一種可選方案中,所述幾何最優原語的語義載荷分布的計算公式為:
24、;
25、式中:表示所述第個幾何最優原語對所述第種語義類別的語義載荷分布;表示語義類別的總數;
26、所述幾何最優原語的語義載荷分布滿足歸一化條件:
27、。
28、在第一方面的一種可選方案中,在基于所述幾何最優原語的語義軟計數進行處理,得到歸一化的所述幾何最優原語的語義載荷分布之后,所述方法還包括:
29、獲取場景的新增樣本點及其語義監督信息,通過所述幾何最優原語對所述新增樣本點的貢獻值,計算所述幾何最優原語對所述新增樣本點的解釋權重;
30、將所述幾何最優原語對所述新增樣本點的解釋權重與所述新增樣本點的語義監督信息相結合,得到所述幾何最優原語的新增語義軟計數;
31、基于所述幾何最優原語的語義軟計數與新增語義軟計數的累加值進行處理,重新得到歸一化的所述幾何最優原語的語義載荷分布。
32、在第一方面的一種可選方案中,所述獲取場景的空間點,計算所述幾何最優原語對所述空間點的解釋權重,結合該解釋權重與所述幾何最優原語的語義載荷分布進行處理,得到所述空間點的語義后驗概率和語義熵并輸出,包括:
33、獲取場景的空間點,計算所述幾何最優原語對所述空間點的解釋權重并使其滿足非負性及歸一化約束;
34、將所述幾何最優原語的語義載荷分布附著于所述幾何最優原語對所述空間點的解釋權重上,得到所述空間點的語義后驗概率;
35、基于所述空間點的語義后驗概率進行處理,得到所述空間點的語義熵,并輸出所述空間點的語義后驗概率和語義熵。
36、在第一方面的一種可選方案中,所述幾何最優原語對所述空間點的解釋權重的計算公式為:
37、;
38、式中:表示所述空間點;表示所述3d高斯原語集合中幾何最優原語的數目;表示所述3d高斯原語集合中第個幾何最優原語的幾何參數的集合;表示所述3d高斯原語集合中第個幾何最優原語對所述空間點的解釋權重;表示所述第個幾何最優原語對所述空間點的貢獻值;為所述第個幾何最優原語對所述空間點的貢獻函數,變量為所述空間點;
39、所述非負性約束為:
40、;
41、所述歸一化約束為:
42、。
43、在第一方面的一種可選方案中,所述空間點的語義后驗概率的計算公式為:
44、;
45、式中:表示所述空間點的語義屬于所述第種語義類別的概率;表示所述第個幾何最優原語的語義載荷分布;
46、所述空間點的語義熵的計算公式為:
47、。
48、第二方面,本技術提供一種語義載荷高斯潑濺建模裝置,包括:
49、原語初始化單元,用于基于場景的稀疏點云,構建3d高斯原語集合,初始化所述3d高斯原語集合中每個3d高斯原語的幾何參數;
50、幾何訓練單元,用于通過可微渲染過程對所述3d高斯原語的幾何參數進行迭代更新直至收斂,將所述3d高斯原語更新為幾何最優原語;
51、語義學習單元,用于獲取場景的樣本點及其語義監督信息,計算所述幾何最優原語對所述樣本點的解釋權重,結合該解釋權重與所述樣本點的語義監督信息進行處理,得到所述幾何最優原語的語義載荷分布;
52、推理與輸出單元,用于獲取場景的空間點,計算所述幾何最優原語對所述空間點的解釋權重,結合該解釋權重與所述幾何最優原語的語義載荷分布進行處理,得到所述空間點的語義后驗概率和語義熵并輸出。
53、第三方面,本技術提供一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現本技術第一方面或第一方面的任意一種實現方式提供的方法。
54、第四方面,本技術提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現本技術第一方面或第一方面的任意一種實現方式提供的方法。
55、本技術采用上述技術方案,與現有技術相比,主要具有如下技術效果:
56、語義的嵌入不改變3d高斯原語的幾何最優解和3dgs模型的幾何邊緣分布,保證三維建模精度不受影響;
57、語義通過語義載荷分布以概率分布形式附著于3d高斯原語,無需訓練額外語義訓練網絡,避免多模型協同帶來的復雜性;
58、語義通過與幾何一致的解釋權重進行統計,使語義載荷分布自然沿幾何結構傳播,避免語義與幾何邊界不對齊的問題;
59、通過硬標簽或軟標簽形式的語義監督信息,能夠兼容多視角、多來源語義監督,并通過語義軟計數機制平滑融合沖突信息,提高系統穩定性;
60、通過語義后驗概率和語義熵而非單一標簽表達語義,能夠同時反映語義類別及語義不確定性,更適用于復雜場景下的決策與查詢。
61、本技術的其他特征和優點將在隨后的具體實施方式部分予以詳細說明。