本發明涉及醫學圖像處理與計算機視覺領域,特別是一種多級特征引導與雙解碼融合策略的內鏡病灶分割方法。具體而言,本發明利用多級特征引導機制與雙解碼器融合策略,實現對內鏡圖像中弱邊界、多尺度混淆組織病灶的高精度分割,屬于人工智能輔助醫學診斷方向。
背景技術:
1、消化道內鏡檢查是當前胃腸道疾病診斷中最重要的臨床技術之一,尤其在胃腸腫瘤、癌前病變以及炎癥性疾病的檢測中具有不可替代的作用。通過內鏡設備,醫生能夠直接觀察組織表面結構并識別病灶,從而實現早篩與早診。然而,受限于圖像采集環境的復雜性,內鏡圖像往往存在光照不均、反光強烈、局部模糊、黏液遮擋以及組織折射等問題,使得病灶邊界呈現弱邊緣特性,導致病灶區域與健康粘膜結構之間的對比度極低。這些因素使人工識別存在較高的經驗依賴與漏檢風險,因此亟需更穩定、魯棒的自動化分割方法以輔助臨床診斷。
2、近年來,深度學習模型在醫學圖像分割領域取得長足發展,基于編碼器—解碼器結構的?u-net?及其變體成為主流技術路線。然而在實際內鏡圖像中,由于下采樣導致的高頻信息丟失,這類模型通常難以準確恢復病灶的真實邊界。此外,病灶在形態、大小、顏色紋理上的顯著差異使多尺度結構成為內鏡圖像的重要挑戰:大尺度病灶容易因為結構復雜而被誤分割,小尺度病灶則在下采樣過程中被掩蓋或忽略,進一步增加分割難度。傳統注意力機制雖然能夠強化特征表達,但其在多尺度結構與弱邊界場景下的建模能力仍顯不足。
3、內鏡圖像中存在大量偽影以及噪聲區域,包括血管紋理、光斑、液體反光、模糊邊緣等。常規卷積網絡在面對這些干擾因素時容易產生類似區域的錯誤關注,降低模型泛化能力。與此同時,醫學圖像應用往往需要輕量化模型以部署到內鏡設備或嵌入式系統中,這進一步限制了復雜網絡結構在臨床場景中的實際應用。因此,如何在保持模型輕量化的前提下,同時增強模型對弱邊界、多尺度結構以及干擾區域的辨識能力,成為內鏡圖像分割研究中的關鍵問題。
技術實現思路
1、本發明的目的在于解決現有內鏡圖像病灶分割中弱邊界模糊、多尺度組織混淆以及噪聲干擾嚴重的問題,使得常規深度學習模型難以獲得高精度且穩定的病灶區域預測,無法滿足臨床實際診斷需求。
2、為達到上述目的,本發明提供的技術方案為:
3、本發明提供了一種多級特征引導與雙解碼融合策略的內鏡病灶分割方法,包括如下步驟:
4、s1、采集足夠數量的內鏡醫學圖像數據集,并對圖像進行統一格式化處理,包括裁剪無效區域、去除冗余標識、顏色歸一化、亮度平衡等預處理操作,同時對標注數據進行質量檢查與格式轉換,以形成標準化訓練數據集;
5、s2、對預處理后的內鏡圖像進行數據增強,包括隨機旋轉、水平翻轉、尺度縮放、亮度擾動、混合增強等方法,以提升模型對于真實復雜臨床場景中弱邊界與多形態病灶的魯棒性;
6、s3、構建一種基于共享編碼器、多級特征引導模塊、雙解碼器結構與動態融合模塊的內鏡圖像病灶分割模型。該模型包括共享編碼器模塊、主解碼器模塊、副解碼器模塊、smee?高頻邊緣提取模塊、多尺度選擇性注意力模塊(msa)、漸進邊緣強化注意力模塊(pera)、shuffle?attention?模塊(sa)、動態引導融合模塊(dgf)以及分割預測模塊。
7、共享編碼器承擔對不同尺度的內鏡圖像特征進行逐級提取的任務。其各層由卷積單元、激活單元和歸一化單元構成,能夠從低級紋理、中級結構到高級語義逐層建立特征表示。編碼器得到的多尺度特征分別輸送至主解碼器與副解碼器,為后續的邊界建模與尺度分析提供基礎特征支持。
8、smee?高頻邊緣提取模塊用于補償編碼器在下采樣過程中造成的高頻細節丟失。該模塊結合傅里葉頻域增強與拉普拉斯金字塔分解,對輸入圖像生成多頻率子帶并進行加權融合,得到包含顯著邊界信息的高頻圖。其輸出作為后續解碼階段的邊緣引導信號,用于增強弱邊界區域的響應。
9、主解碼器由多個上采樣階段構成,每個階段接收來自上一解碼層的特征、共享編碼器對應階段的特征以及?smee?模塊提供的高頻信息。在解碼過程中嵌入的?pera?漸進邊緣強化注意力模塊包括邊緣檢測分支、反向注意力分支及雙分支融合結構,可逐步強化弱邊界區域的顯著性。此外,解碼器中集成的?shuffle?attention?模塊通過通道與空間維度的聯合重權重進一步增強局部結構表達能力。
10、副解碼器配備多尺度選擇性注意力模塊(msa),其中包含通道交叉注意力(cca)與空間交叉注意力(sca)兩部分。cca?用于建模不同尺度特征之間的通道依賴關系,sca?則用于捕獲多尺度結構在空間維度上的響應差異,從而提升模型對大小差異顯著、形態多變的病灶區域的識別能力。副解碼器的輸出形成尺度置信特征,為最終融合階段提供全局尺度約束。
11、動態引導融合模塊(dgf)負責整合來自主解碼器的邊界強化特征、副解碼器的尺度置信特征以及?smee?模塊的高頻信息。該融合過程通過自適應權重分配機制與殘差補償策略,實現不同類型特征的動態選擇與協調優化,從而生成結構完整、邊界細致且語義準確的最終分割結果。
12、s4、將步驟2增強后的內鏡圖像與標簽輸入步驟3構建的模型中進行訓練。采用dice?損失與二值交叉熵損失(bce)的加權組合作為損失函數,以提升分割區域的整體重疊度與像素精度。訓練過程中利用自適應矩估計(adam)優化模型參數,最終得到訓練完成的內鏡病灶分割模型。
13、s5、將待分割的內鏡圖像輸入步驟4所得訓練模型中,通過共享編碼器、smee?高頻模塊、主解碼器、副解碼器以及動態融合模塊的處理,生成該圖像的病灶分割預測結果。
14、于本發明構建的多級特征引導與雙解碼器融合模型體系中,共享編碼器承擔多尺度語義特征的分層提取任務。各編碼階段由卷積單元、歸一化單元及激活單元依次串聯構成,能夠自底向上逐級建立低級紋理、中級結構與高級語義等多層級特征表達。編碼器在不同階段產生的多尺度輸出分別傳遞至主解碼器與副解碼器,用以支撐后續的邊界重建與尺度建模過程。
15、作為該分割框架的重要組成單元,smee?高頻邊緣提取模塊負責補償編碼器下采樣過程中造成的高頻細節損失。其內部結合傅里葉頻域增強與拉普拉斯金字塔分解,將輸入圖像構建為多個高頻子帶,并通過加權融合策略生成具備豐富邊緣信息的高頻特征圖。此高頻輸出作為邊界引導信號,為主解碼器的弱邊界恢復提供關鍵輔助。
16、在所述網絡結構內,主解碼器由多個上采樣階段構成,每一階段均接收來自上一解碼層、共享編碼器對應層以及smee模塊的高頻信息。該解碼路徑內嵌的?pera?漸進邊緣強化注意力模塊包含邊緣檢測分支、反向注意力分支與雙分支融合結構,能夠在逐層解碼過程中持續強化弱邊界區域的特征響應。此外,主解碼器借助?shuffle?attention?模塊對通道與空間信息進行重權重分配,以增強局部結構的表達能力。
17、作為本發明多尺度建模的重要機制,副解碼器采用多尺度選擇性注意力模塊(msa),內部設有通道交叉注意力單元(cca)與空間交叉注意力單元(sca)。cca?用于捕獲不同尺度特征之間的通道依賴關系,而?sca?則負責建模多尺度結構在空間維度上的差異性分布。兩者協同產生的尺度置信特征為復雜、多變的病灶區域提供有效的尺度約束。
18、在所述分割框架的融合階段,動態引導融合模塊(dgf)承擔整合多源特征的任務。該模塊包括特征拼接單元、注意力選擇單元及融合卷積單元,能夠對主解碼器的邊界增強特征、副解碼器的尺度置信特征及?smee?高頻邊緣特征進行自適應選擇與加權融合。融合后得到的特征圖經殘差補償機制修正誤差傳播,從而生成結構連續、邊界清晰且語義準確的最終特征表示。
19、最終輸出組件,分割預測模塊由?1×1?卷積單元與?sigmoid?激活單元依次構成。動態融合后的特征輸入至?1×1?卷積單元進行通道壓縮,輸出經?sigmoid?激活形成最終二值化病灶分割預測圖
20、與現有技術相比,本發明有益效果:
21、能夠更加充分地挖掘內鏡圖像中的病灶語義信息與邊界結構信息。從特征建模角度看,本發明提出的?smee?高頻邊緣提取模塊有效彌補了傳統深度網絡在下采樣過程中導致的邊緣與高頻細節丟失問題,使弱邊界區域得以顯著增強;主解碼器中的?pera?漸進邊緣強化機制可持續放大模糊、低對比度區域的邊界響應,提高病灶輪廓的判別能力;副解碼器引入的?msa?多尺度選擇性注意力模塊能夠針對不同尺度、不同結構復雜度的病灶區域進行自適應注意建模,從而顯著緩解多尺度病灶混淆的問題。
22、此外提出的雙解碼器協同結構可分別從邊界層面與尺度層面對病灶區域進行特征重建,并通過?dgf?動態引導融合模塊實現兩者的有效整合。融合后的特征不僅在全局語義一致性上具有更高穩定性,在局部結構細節上亦具備更強表達能力。本發明構建的深度學習模型能夠在復雜內鏡場景下實現更加準確、魯棒、跨尺度的病灶分割預測,具有極高的臨床應用價值