本申請屬于數字圖像處理技術領域,具體地說,涉及數字圖像中目標物體多尺度捕捉方法。
背景技術:
數字圖像中的目標物體的捕捉就是把圖像分成若干個特定的、具有獨特性質的區域并捕獲感興趣目標的技術和過程。它是由圖像處理到圖像分析的關鍵步驟。現有的目標捕捉方法主要分以下幾類:基于像素值閾值的方法、基于灰度區域的方法、基于目標邊緣的方法以及基于特定理論的捕捉方法等。圖像中捕捉到的目標可以用于后續的圖像語義識別,圖像搜索、醫學自動診斷等領域。
但是目前的絕大部分目標捕捉方法都是是固定尺度捕捉,只能在某一特定尺度上進行目標捕捉,這樣很難處理目標捕捉過程中精確性和魯棒性的矛盾,以及欠捕捉和過捕捉的矛盾。目前少量的多尺度目標捕捉方法中,主要策略有三種,都采用的是“二步法”:
策略1,采用一種圖像多尺度表示的策略。第一步進行數字圖像的的多尺度分析,例如金字塔數據結構,第二步采用常見的固定尺度目標捕捉方法對多尺度結構的圖像分別進行目標捕捉,得到最終的多尺度捕捉結果;
策略2,采用一種由細尺度到粗尺度的捕捉策略。第一步,進行精細尺度的捕捉,第二步,采用精細尺度的捕捉結果來預測粗糙尺度的捕捉結果,然后通過融合粗尺度的結果,輸出最終的捕捉結果;
策略3,采用一種由粗尺度到細尺度的捕捉策略。第一步,先進行比較容易的粗尺度上的捕捉,然后第二步以此捕捉結果來引導較細尺度層上的目標捕捉。
技術實現要素:
本發明采用“單步法”,在變分極小化的理論框架下,在一個模型中結合變分水平集和圖像的多尺度表示,采用一個尺度參數調整目標的捕捉尺度,通過泛函極小實現目標物體的多尺度捕捉。
為了解決上述技術問題,本申請公開了一種數字圖像圖像的中目標物體的多尺度捕捉方法,包括多尺度捕捉的變分模型,模型的交替迭代求解算法,第三個子問題的admm求解算法。具體包括以下步驟:
一種數字圖像中目標物體多尺度捕捉方法,包括以下步驟:
步驟1:確定目標的多尺度捕捉模型;
步驟2:采用交替迭代法求解該模型的泛函極小值;
步驟3:根據求解的極小值的來確定捕捉結果是否滿意,如果滿意,結束;如果不滿意,則返回步驟1對模型的參數進行調整,然后求解泛函極小值,直到結果滿意;
設f是包含目標物體的數字圖像,則所述多尺度捕捉模型的能量泛函為:
c=argmin{e(uλ,c)+z(c)+λr(uλ,f)}
上式中,λ為尺度參數,uλ為圖像f的多尺度表示,c為捕捉目標物體的活動輪廓,e(uλ,c)為與捕捉輪廓有關的能量泛函,z(c)是捕捉輪廓的正則項,r(uλ,f)為圖像多尺度表示能量泛函。
進一步地,如上所述的方法,所述捕捉輪廓能量泛函e(uλ,c)為:
e(uλ,c)=∫inside(c)(uλ(x)-c1)2dx+∫outside(c)(uλ(x)-c2)2dx
式中c1,c2是擬合常數,能量泛函∫inside(c)(u(x)-c1)2dx和∫outside(c)(u(x)-c2)2dx分別是活動輪廓c內部和外部的常值擬合項。
進一步地,如上所述的方法,利用水平集函數φ(x),所述捕捉輪廓能量泛函e(uλ,c)改寫為:
e(uλ(x),φ(x))=∫ω(uλ(x)-c1)2h(φ(x))dx+∫ω(uλ(x)-c2)2(1-h(φ(x)))dx
其中,h(s)是標準heaviside函數,水平集函數定義為:
進一步地,如上所述的方法,給正則項z(c)中引入一個內部能量約束零水平集的長度的正則項,定義為:
其中d(s)是標準delta函數;
進一步地,如上所述的方法,給正則項z(c)中引入一個內部能量約束水平集函數在演化過程中保持為一個符號距離函數的正則項,定義為:
進一步地,如上所述的方法,所述圖像多尺度表示能量泛函r(uλ,f)定義為:
其中
進一步地,如上所述的方法,所述多尺度捕捉模型的最終能量泛函為:
在上式中,能量項e(uλ(x),φ(x))是驅動活動輪廓向目標邊界運動,并使活動輪廓停留在正確的目標邊界上的捕捉項;測地弧長
進一步地,如上所述的方法,步驟2所述采用交替迭代法求解該模型的泛函極小值具體為:
采用交替迭代法求解能量泛函e(c1,c2,uλ(x),φ(x))關于常數c1和c2,函數φ(x)和uλ(x)的極小值;
首先,固定水平集函數φ(x)和多尺度圖像函數uλ(x),求解能量泛函e(c1,c2,uλ(x),φ(x))關于常數c1和c2的極小值,即
接著,固定擬合常數c1,c2和多尺度圖像函數uλ(x),求解能量泛函e(c1,c2,uλ(x),φ(x))關于水平集函數φ(x)的極小值點,即
最后,固定擬合常數c1,c2和水平集函數φ(x),求解能量泛函e(c1,c2,uλ(x),φ(x))關于多尺度圖像函數uλ(x)的極小值點,即
進一步地,如上所述的方法,使用admm算法求解量泛函e(c1,c2,uλ(x),φ(x))關于多尺度圖像函數uλ(x)的極小值;
設
上式的增廣lagrange函數為:
其中,y是lagrange乘子(也可稱為對偶變量);ρ>0是懲罰因子;||·||2表示2范數,在極小化問題中,其增廣lagrange函數可以等價為:
其中c表示常數,在極小化過程中,忽略常數c,則求解uλ(x)的極小值就轉換為:極小化如下能量泛函:
與現有技術相比,本申請可以獲得包括以下技術效果:
1)本申請的只需要建立一個模型,通過一個參數的調整,就可實現數字圖像中的目標物體的多尺度的捕捉。
2)本申請的方法對于對比度較弱,但是目標物體較為明顯的圖像,例如醫學圖像,遙感圖像等,能夠取得較好的捕捉效果。
3)多尺度的捕捉結果,通過與專家手工操作的最優結果比對,正確率可達98%以上。
4)本申請的方法具有較快的捕捉速度,對于1024×1024大小的圖像,大約可以在2秒內完成整個多尺度捕捉過程。
5)本申請得到的多尺度捕捉結果可以很好地應用到模式識別,圖像檢索、醫學自動診斷等圖像分析領域。
6)本申請的技術方案,步驟簡單,易于操作,重復性好,只需要一個參數調整,技術人員易學、易掌握。
當然,實施本申請的任一產品必不一定需要同時達到以上所述的所有技術效果。
附圖說明
此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
圖1是本申請實施例的方法流程圖;
圖2是本申請實施例中目標數字圖像;
圖3是本申請實施例的多尺度捕捉結果(小尺度);
圖4是本申請實施例的多尺度捕捉結果(中尺度);
圖5是本申請實施例的多尺度捕捉結果(大尺度)。
具體實施方式
以下將配合附圖及實施例來詳細說明本申請的實施方式,藉此對本申請如何應用技術手段來解決技術問題并達成技術功效的實現過程能充分理解并據以實施。
本發明通過求解一個能量泛函的極小實現目標物體的多尺度捕捉。圖1為本發明目標物體多尺度捕捉的技術路線。
設f是包含目標物體的數字圖像,目標的多尺度捕捉模型為:
c=argmin{e(uλ,c)+z(c)+λr(uλ,f)}
其中λ為尺度參數,uλ為圖像f的多尺度表示,c為捕捉目標物體的活動輪廓,e(uλ,c)為與捕捉輪廓有關的能量泛函,z(c)是捕捉輪廓的正則項,r(uλ,f)為圖像多尺度表示能量泛函。
1.捕捉輪廓能量泛函e(uλ,c)的選取
設c為捕捉輪廓(一般情況下為一條封閉曲線),uλ(x):ω→r為圖像f(x)的多尺度表示,并且當尺度參數λ→0時,u0(x)=f(x),捕捉輪廓能量泛函e(uλ,c)的選取為:
e(uλ,c)=∫inside(c)(uλ(x)-c1)2dx+∫outside(c)(uλ(x)-c2)2dx(1)
(1)式中c1,c2是擬合常數。能量泛函∫inside(c)(u(x)-c1)2dx和∫outside(c)(u(x)-c2)2dx分別是活動輪廓c內部和外部的常值擬合項。求此兩個能量泛函的和關于活動輪廓c和擬合常數c1,c2的極小,可以使得活動輪廓c停留在多尺度圖像uλ(x)中目標物體的邊界,得到需要的捕捉結果。在實際應用中,由于能量泛函關于參數型曲線c的極小不容易計算,并且參數型曲線c的拓撲結構的變化在計算中不容易處理,所以本發明采用水平集方法進行處理。活動輪廓c可以用一個簡單函數φ(x):ω→r的零水平集φ(x)=0表示,簡單函數φ(x)被稱為水平集函數,一般定義為:
利用水平集函數φ(x),捕捉能量項e(uλ,c)可以改寫為:
e(uλ(x),φ(x))=∫ω(uλ(x)-c1)2h(φ(x))dx+∫ω(uλ(x)-c2)2(1-h(φ(x)))dx(2)
其中h(s)是標準heaviside函數。擬合項在本文模型中的作用是使得活動輪廓可以克服噪聲的影響,運動到正確的目標邊界。
2.捕捉輪廓的正則項z(c)的選取
為了使得捕捉輪廓在演化過程中保持光滑,并使得捕捉結果中盡可能少的出現面積小的孤立的分割區域,一般將活動輪廓c的弧長作為正則項引入到能量泛函中,定義為:
其中δ(s)是標準delta函數;
其中,div表示散度算子。梯度下降流方程是著名的平均曲率運動方程,它可以使得函數φ(x)的各個水平集在演化過程中保持光滑,不出現奇異尖點。
為了使得捕捉輪廓在演化過程中保持穩定,需要水平集函數在演化過程中保持為符號距離函數。但是在對水平集模型的數值計算中,就算初始水平集函數定義為符號距離函數,其在演化過程中也會比較嚴重的偏離符號距離函數。所以一般情況下,需要不斷的重新初始化水平集函數為符號距離函數,這大大增加了計算的復雜度。本發明在能量泛函中引入一個內部能量約束水平集函數在演化過程中保持為一個符號距離函數的正則項,定義為:
在極小化
3.圖像多尺度表示能量泛函r(uλ,f)
本發明采用rudin等在1992年提出的全變分(totalvariation,tv)極小化模型以進行圖像多尺度表示。采用tv(也稱為bv半模)度量多尺度圖像uλ(x);采用l2范數度量多尺度圖像uλ(x)與原圖像f(x)的方差。多尺度表示能量泛函定義為:
其中
明顯地,λ為尺度參數,控制對圖像的平滑力度。λ越大,對圖像f(x)的平滑力度越大,多尺度圖像uλ(x)中將含有很少的細節(粗尺度);相反,λ越小,對圖像f(x)的平滑力度越小,多尺度圖像uλ(x)中將含有大量的細節(細尺度)。
4.目標多尺度捕捉能量泛函
結合捕捉輪廓能量泛函(2)、水平集正則化項(3)、(4)和圖像多尺度表示能量泛函(5),本發明最終的目標物體多尺度捕捉能量泛函定義為:
在式(6)中,能量項e(uλ(x),φ(x))是捕捉項,其主要目的是驅動活動輪廓向目標邊界運動,并使活動輪廓停留在正確的目標邊界上。測地弧長
由于標準的heaviside函數和dirac函數在零點不可導,導致在數值計算中不容易處理,本發明中采用正則化的heaviside函數和dirac函數,分別定義為:
采用近似的標準heaviside函數和dirac函數,則最終的能量泛函為:
正則化參數ε在一定程度上控制活動輪廓捕捉目標物體的范圍,ε取值太小,離初始活動輪廓較遠的目標物體可能捕獲不到;相反,ε取值太大,捕捉結果將損失部分圖像細節,在本發明中,我們固定ε=3。
5.求能量泛函的極小
本發明采用交替迭代法求解能量泛函e(c1,c2,uλ(x),φ(x))關于常數c1和c2,函數φ(x)和uλ(x)的極小值。
5.1能量泛函關于c1和c2的極小值
固定水平集函數φ(x)和多尺度圖像函數uλ(x),求解能量泛函e(c1,c2,uλ(x),φ(x))關于常數c1和c2的極小值。根據函數取得極值的必要條件有:
利用(8)式和(9)式,分別求解c1和c2的值為:
由(10)式可以看出常數c1和c2實際上分別表示多尺度圖像uλ(x)在活動輪廓內外部區域的灰度均值。
5.2能量泛函關于φ(x)的極小值
固定擬合常數c1,c2和函數uλ(x),求解能量泛函e(c1,c2,uλ(x),φ(x))關于水平集函數φ(x)的極小值點。需要提到的是,為簡化美觀公式,本申請在函數的表達式中省略了變量x,例如將φ(x)記為φ等。采用變分法,能量泛函e(c1,c2,uλ(x),φ(x))關于φ(x)的gateaux導數為:
其中,div為散度算子。能量泛函e(c1,c2,u(x),φ(x))關于φ(x)取得極小的必要條件為:
采用梯度下降法,偏微分方程(11)的解等價為如下梯度下降流方程的穩定解:
其中φ(x)滿足初始條件φ(0,x)=φ0(x)和邊界條件
5.3能量泛函關于u(x)的極小值
固定擬合常數c1,c2和函數φ(x),求解能量泛函e(c1,c2,uλ(x),φ(x))關于多尺度圖像函數uλ(x)的極小值點,為了提高計算效率,本發明使用admm算法求解uλ(x)的極小值點。設
式(13)的增廣lagrange函數為:
其中,y是lagrange乘子(也可稱為對偶變量);ρ>0是懲罰因子;||·||2表示2范數。再極小化問題中,其增廣lagrange函數可以等價為:
其中c表示常數。在極小化過程中,可以忽略常數c,因此本發明就轉化為極小化如下能量泛函:
對于極小化子問題(16),本發明采用交替迭代法進行求解。首先求解關于uλ(x)的極小,能量泛函(16)的euler-lagrange方程為:
其中
其中,i表示單位矩陣,(·)*表示復共軛,
接著求解極小化子問題(16)關于v的極小值,由于此極小化問題是經典的l1+l2問題,可以直接采用閾值軟算法,即
最后采用下式更新lagrange乘子:
圖2是本申請實施例中的目標數字圖像,三角形輪廓為初始輪廓,圖3是本申請實施例的多尺度捕捉結果(小尺度),圖4是本申請實施例的多尺度捕捉結果(中尺度),圖5是本申請實施例的多尺度捕捉結果(大尺度),從圖2-圖5中可以看出,采用本發明方法均可以進行多尺度捕捉。
上述說明示出并描述了本申請的若干優選實施例,但如前所述,應當理解本申請并非局限于本文所披露的形式,不應看作是對其他實施例的排除,而可用于各種其他組合、修改和環境,并能夠在本申請構想范圍內,通過上述教導或相關領域的技術或知識進行改動。而本領域人員所進行的改動和變化不脫離本申請的精神和范圍,則都應在本申請所附權利要求的保護范圍內。