技術簡介:
本發明針對低質量醫學影像中發音器官輪廓提取難題,提出基于自動分割閾值與邊緣檢測的解決方案。通過灰度直方圖最大類間方差法實現唇部自動分割,結合剛體輪廓匹配與B樣條曲線擬合技術,精準提取牙齒、頜骨及舌部運動輪廓,有效解決影像模糊、噪聲干擾和器官遮擋導致的輪廓失真問題,實現發音器官動態特征的自動分析。
關鍵詞:發音器官輪廓提取,醫學影像處理,自動分割技術
專利名稱:在醫學影像中獲取發音器官輪廓的方法
技術領域:
本發明涉及信息技術行業圖像處理技術領域,具體地涉及ー種在醫學影像中獲取發音器官輪廓的方法。
背景技術:
目前人類對發音生理機理尚不明確,其中ー個重要原因是語音與器官間的運動關系缺乏有效的觀測和分析工具。目前針對口腔發音動態圖像研究的常用輔助手段有X光影像、超聲圖像及核磁共振突圖像等。這些醫學圖像具有分辨率低、成像模糊、噪聲嚴重的特點。盡管國內外研究人員提出了很多從醫學圖像中自動提取和跟蹤人體器官運動輪廓的方法,但是由于人的發音器官種類較多、運動靈活多變、并且在視頻成圖像中相互遮擋嚴重,會出現幅度較寬的虛假輪廓等情況。申請人:發現傳統的圖像分析技術不適于低質量醫學影像中的發音器官輪廓自動獲取,從低質量醫學圖像中自動獲取發音器官輪廓目前任然是語音與視覺計算中的ー個挑戰,特別是針對發音中的ー些舌位運動細節。
發明內容(一 )要解決的技術問題為解決上述的一個或多個問題,本發明提供了ー種在醫學影像中獲取發音器官輪廓的方法。( ニ )技術方案根據本發明的ー個方面,提供了ー種在醫學影像中獲取發音器官輪廓的方法。該 方法包括對于醫學圖像,利用唇部與背景的自動分割閾值,對醫學影像中嘴唇與背景區域進行ニ值化,得到唇部輪廓;在唇部輪廓包含的面部范圍內,提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對上頜輪廓和下頜輪廓之間圖像區域,獲取舌位輪廓的可靠邊緣點;以及由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。(三)有益效果從上述技術方案可以看出,本發明在醫學影像中獲取發音器官輪廓的方法具有以下有益效果(I)本發明能自動從影像背景中分割出發音人頭部、器官區域,整個過程自動完成,無需人工交互;(2)本發明針對低質量醫學影像中舌位成像模糊、噪聲和遮擋嚴重的情況,能很好獲取發音過程的舌位輪廓及舌位運動細節;(3)本發明能自動同時獲取包括唇、上下頜、牙齒、舌的運動輪廓,有利于直觀觀測和分析發音過程中的各發音器官運動特征。
圖I為本發明實施例在醫學影像中獲取發音器官輪廓方法的流程圖。圖2是發音器官X光圖像;圖3是對于圖2所示X光圖像,由本發明實施例在醫學影像中獲取發音器官輪廓方法中步驟A和步驟B得到的上唇輪廓、下唇輪廓、上牙齒輪廓、下牙齒輪廓、上頜輪廓、下頜輪廓及舌位初步輪廓的示意圖;圖4是本發明實施例在醫學影像中獲取發音器官輪廓方法中擬合下頜輪廓曲線的不意圖;圖5是本發明在醫學影像中獲取發音器官輪廓方法中擬合舌位輪廓的流程圖;圖6是本發明在醫學影像中獲取發音器官輪廓方法中獲取舌位輪廓的可靠邊緣點步驟中0度方向的區域最大梯度估計的11X11大小的一個模板示意圖;
圖7是本發明在醫學影像中獲取發音器官輪廓方法中基于隨機抽取一致性檢驗(RANSAC)和過控制點B樣條曲線擬合的舌部輪廓的示意圖;圖8是說話人發“Ban”音的X光圖像序列中,利用本發明實施例在醫學影像中獲取發音器官輪廓方法所提取的上唇、下唇、上牙齒、下牙齒、上頜、下頜及舌位輪廓的效果圖;圖9是利用本發明實施例在醫學影像中獲取發音器官輪廓方法提取超聲圖像中舌位輪廓的效果圖;圖10是本發明實施例在醫學影像中獲取發音器官輪廓方法提取核磁共振圖像中舌部輪廓的效果圖。
具體實施例方式為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本發明進ー步詳細說明。需要說明的是,在附圖或說明書描述中,相似或相同的部分都使用相同的圖號。且在附圖中,以簡化或是方便標示。再者,附圖中未繪示或描述的實現方式,為所屬技術領域中普通技術人員所知的形式。另外,雖然本文可提供包含特定值的參數的示范,但應了解,參數無需確切等于相應的值,而是可在可接受的誤差容限或設計約束內近似于相應的值。本發明基于傳統的圖像處理方法,在發音器官輪廓提取與跟蹤的過程中,采用灰度直方圖及最大類間自動閾值提取方法,實現對嘴唇輪廓的自動提取;采用自適應邊緣梯度方法,結合已知形狀的剛體輪廓投影匹配和曲線擬合技術,提取出牙齒、上下頜輪廓;利用最大梯度估計的模糊圖像邊緣檢測算法,獲取發音過程中ロ腔內部舌位邊緣點,并結合隨機抽樣一致性驗證(RANSAC)算法和B樣條曲線擬合方法,去除錯誤的舌位邊緣輪廓點,采用通過控制點的B樣條曲線技術,擬合出發音過程的舌位輪廓。在本發明的一個示例性實施例中,提供了ー種在醫學影像中獲取發音器官輪廓的方法。圖I為本發明實施例在醫學影像中獲取發音器官輪廓方法的流程圖。如圖I所示,該方法包括步驟A,對于醫學圖像,利用唇部與背景的自動分割閾值k,對醫學影像中嘴唇與背景區域進行ニ值化,得到唇部輪廓;如圖2所示,嘴唇位于發音器官的外側部位,由于其背景為白色,在邊緣模糊處找到合適的灰度閾值即可區分出唇部輪廓。
采用以下公式,基于灰度直方圖的最大類間方差方法獲取醫學影像中唇部與背景的自動分割閾值
權利要求1.ー種在醫學影像中獲取發音器官輪廓的方法,包括對于醫學圖像,利用唇部與背景的自動分割閾值,對所述醫學影像中嘴唇與背景區域進行ニ值化,得到唇部輪廓;在所述唇部輪廓包含的面部范圍內,提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對所述上頜輪廓和所述下頜輪廓之間圖像區域,獲取舌位輪廓的可靠邊緣點;以及由所述舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。
2.根據權利要求I所述的在醫學影像中獲取發音器官輪廓的方法,其中,采用以下公式,基于灰度直方圖的最大類間方差方法獲取醫學影像中唇部與背景的自動分割閾值
3.根據權利要求I所述的在醫學影像中獲取發音器官輪廓的方法,其中,所述提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓的步驟包括針對所述唇部輪廓范圍內的面部區域求出自動分割閾值,得到上牙齒輪廓,下牙齒輪廓及下頜初步輪廓;由所述下頜初步輪廓,采用剛體輪廓匹配和曲線擬合方法得到所述下頜輪廓;對于所述上牙齒輪廓朝向頭內部方向的口腔和鼻腔區域,計算出上頜區域的邊緣點;以及根據所述上牙齒輪廓的尖部以及所述上頜區域的邊緣點,擬合所述上頜輪廓。
4.根據權利要求3所述的在醫學影像中獲取發音器官輪廓的方法,其中,所述針對唇部輪廓范圍內的面部區域求出自動分割閾值,得到上牙齒輪廓,下牙齒輪廓及下頜初步輪廓的步驟包括計算所述唇部輪廓范圍內的面部區域的梯度圖像,把該梯度圖像歸一化到
之間,獲得灰度圖像I ;獲取該灰度圖像I的直方圖,得到該直方圖的最大類間方差閾值;以及以該最大類間方差閾值對所述唇部輪廓范圍內的面部區域進行ニ值化,落在(r-255]范圍內的圖像輪廓為上牙齒、下牙齒和下頜的初步輪廓。
在所述落在(r-255]范圍內的圖像輪廓中,與其他器官輪廓分開的部分為所述上牙齒的輪廓,剰余的部分為下牙齒和下頜的初步輪廓;在所述下牙齒和下頜的初步輪廓中,下巴上部的輪廓為下牙齒輪廓,剰余的部分為所述下頜初步輪廓。
5.根據權利要求4所述的在醫學影像中獲取發音器官輪廓的方法,其中,采用以下公式,得到直方圖的最大類間方差閾值
6.根據權利要求3所述的在醫學影像中獲取發音器官輪廓的方法,其中,對于所述上牙齒輪廓朝向頭內部方向的口腔和鼻腔區域,采用Sobel算子計算出上頜區域的邊緣點。
7.根據權利要求3所述的在醫學影像中獲取發音器官輪廓的方法,其中,根據上牙齒輪廓的尖部以及上頜區域的邊緣點,采用B樣條曲線方法擬合上頜輪廓。
8.根據權利要求I所述的在醫學影像中獲取發音器官輪廓的方法,其中,所述針對上頜輪廓和所述下頜輪廓之間圖像區域,獲取舌位輪廓的可靠邊緣點的步驟包括對所述上頜輪廓和所述下頜輪廓之間口腔區域部分圖像進行銳化處理,使亮的區域更亮,暗的區域更暗;采用0度及45度方向的區域最大梯度估計算法,在口腔區域部分的灰度圖像中計算舌部運動區域內各像素的梯度;以及取舌部運動區域最大梯度值的2/3作為閾值,梯度大于該閾值的像素組成舌位初步邊緣輪廓。
9.根據權利要求8所述的在醫學影像中獲取發音器官輪廓的方法,其中,采用以下公式,計算舌部運動區域中像素的梯度 M(x, y) = I (X, y) *Mi+a *1 (X, y) *M2其中,I(x,y)為舌部區域圖像某像素,M1為0度的梯度算子,M2為45度算子,a為加權系數,這里取值為0.5。最后,M(x,y)即為舌部區域的邊緣圖像,M(x,y)中值越大的像素越可能是舌的邊緣。
10.根據權利要求8所述的在醫學影像中獲取發音器官輪廓的方法,其中,所述取舌部運動區域最大梯度值的2/3作為閾值,梯度大于該閾值的像素組成初歩舌位邊緣輪廓的步驟之后還包括以所述舌位邊緣輪廓作為初步舌位輪廓,采用兩階段的中值過濾方法對進行錯誤點排除。
11.根據權利要求I所述的在醫學影像中獲取發音器官輪廓的方法,其中,所述由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓包括對于每個舌位輪廓的可靠邊緣點,執行以下步驟n次,得到n個縱向距離采用通過控制點的B樣條曲線方法,隨機抽取6個點擬合出曲線,計算出每個點到曲線的縱向距離;對于每個舌位輪廓的可靠邊緣點,計算隨機抽樣得到的35個縱向距離的平均值;去除縱向距離平均值最大的2 3個舌位輪廓的可靠邊緣點;以及利用剰余的舌位輪廓的可靠邊緣點,采用通過控制點的B樣條曲線方法擬合出舌位邊緣輪廓。
12.根據權利要求I至11中任一項所述的在醫學影像中獲取發音器官輪廓的方法,其中,所述醫學圖像為X光圖像、超聲圖像或核磁共振圖像。
全文摘要本發明提供了一種在醫學影像中獲取發音器官輪廓的方法。該方法包括對于醫學圖像,利用唇部與背景的自動分割閾值,對醫學影像中嘴唇與背景區域進行二值化,得到唇部輪廓;在唇部輪廓包含的面部范圍內,提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對上頜輪廓和下頜輪廓之間圖像區域,獲取舌位輪廓的可靠邊緣點;以及由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。本發明能自動從影像背景中分割出發音人頭部、器官區域,整個過程自動完成,無需人工交互。
文檔編號G06T7/00GK102831606SQ20121027218
公開日2012年12月19日 申請日期2012年8月1日 優先權日2012年8月1日
發明者陶建華, 楊明浩, 張大偉 申請人:中國科學院自動化研究所