本發明涉及眼科疾病圖像分類,涉及眼科疾病圖像分類系統。具體為一種基于大數據模型的眼科疾病圖像分類方法。
背景技術:
1、眼科疾病的圖像分類是近年來的研究熱點,既往所使用的圖像主要是由專業檢查設備獲取的眼科檢查照片,包括眼底照相、oct掃描圖像等;非專業檢查設備(如智能手機)獲取的照片主要應用于判斷疾病嚴重程度,尚缺乏眼科疾病分類的研究,圖像分類依賴于訓練數據集,由于既往沒有合適的訓練數據集(由智能手機拍攝各種眼科疾病的眼部照片,且標注了準確的分類標簽)用于實現智能手機照片的眼科疾病分類,因此手機照相僅用于判斷疾病的嚴重程度,尚未用于眼科疾病的分類,因此,本發明提供一種基于大數據模型的眼科疾病圖像分類方法用以解決上述問題。
技術實現思路
1、為實現以上目的,本發明通過以下技術方案予以實現:一種基于大數據模型的眼科疾病圖像分類系統,包括:
2、數據集構建模塊:用于收集眼科門診中不同眼科疾病患者由智能手機拍攝的眼部圖像,并進行圖像標記處理以構建訓練及測試數據集;
3、圖像分割模塊:采用yolov7對智能手機拍攝的圖像進行圖像分割,得到僅包含眉毛以下、顴弓以上部分的眼部圖像;
4、模型訓練模塊:采用五折交叉驗證方法對圖像進行模型訓練,應用數據增強技術、白平衡調整以及遷移學習算法,將在大規模通用圖像數據集上預訓練的模型參數遷移至眼科疾病分類模型中,對模型進行初始化,并根據眼科圖像數據集的特點對模型進行微調;
5、臨床驗證模塊:用于執行臨床驗證的兩個階段,包括收集病例、輸入圖像至模型以及以臨床分類為金標準進行數據分析。
6、優選的,所述模型訓練模塊中的數據增強技術包括以0.2概率進行隨機水平翻轉、-5到5度之間的隨機旋轉以及以0.2概率進行自動對比度調整。
7、優選的,所述臨床驗證模塊在第一階段按照固定數量收集各類眼科疾病病例。
8、優選的,所述臨床驗證模塊在第二階段按照設定的時間范圍在不同中心分別進行研究人員收集數據和患者自行采集數據。
9、一種基于大數據模型的眼科疾病圖像分類方法,包括如下步驟:
10、構建訓練及測試數據集:收集眼科門診中不同眼科疾病患者用智能手機拍攝的眼部圖像,由四位專家獨立地將圖像標記為四個類別,當三位或以上專家對同一分類達成一致時,則該分類確定為該圖片的標簽,若至少兩位專家無法達成一致,則排除該圖像,針對同時分類兩種或多種疾病的患者,對照片相應添加兩個或多個標簽;
11、圖像分割:采用yolov7目標檢測算法對智能手機拍攝的圖像進行圖像分割訓練,自動將眉毛以下、顴弓以上的部分分割出來,以聚焦于眼部區域;
12、模型訓練:采用五折交叉驗證方法訓練圖像模型,將數據集隨機分成五部分,每部分20%,在每次迭代中使用其中的四部分進行訓練,剩余一部分進行測試,選擇測試準確率最高的模型作為最終模型,訓練階段,每張圖像最初被調整為224x224像素大小,應用隨機水平翻轉、隨機旋轉及自動對比度調整的數據增強技術,并進行白平衡調整,在此基礎上,運用遷移學習算法,將在大規模通用圖像數據集上預訓練的模型參數遷移至眼科疾病分類模型中,對模型進行初始化,并根據眼科圖像數據集的特點對模型進行微調,測試階段,圖像同樣被調整為224x224像素并進行白平衡調整;
13、臨床驗證:包括兩個階段,第一階段計劃性地收集白內障、角膜炎和翼狀胬肉各25例及另外25例其他疾病,將患者由智能手機拍攝的面部照片輸入模型,并以臨床分類為金標準進行數據分析,第二階段在三家中心進行橫斷面式病例收集,包括本中心作為內部驗證和兩家其他中心作為外部驗證,各家中心均采用研究人員收集數據和患者自行采集兩種圖像采集方式,在患者自行采集數據階段,研究人員指導用戶完成照片采集,獲取高質量眼部照片,且不論何種數據收集方式,均以臨床分類為金標準進行數據分析。
14、優選的,所述數據增強技術中,隨機水平翻轉的概率為0.2,隨機旋轉角度在-5到5度之間,自動對比度調整的概率為0.2。
15、優選的,在臨床驗證的第一階段,收集的病例總數為100例,且各類別病例數量固定。
16、優選的,在臨床驗證的第二階段,研究人員收集數據的時間在內部中心為2023年7月21日到2023年8月20日,在外部中心為2023年8月21日到2023年10月31日;患者自行采集數據的時間在內部中心為2023年11月10日到2024年1月10日,在外部中心為2024年1月20日到2024年3月10日。
17、優選的,所述模型訓練中運用遷移學習算法的具體步驟如下:
18、選擇resnet50模型并將resnet50模型的參數加載到眼科疾病分類模型中,以此對眼科疾病分類模型進行初始化;
19、根據眼科圖像數據集的特點對模型進行微調;
20、所述微調的具體過程如下:
21、調整網絡結構:根據眼科圖像的特性和分類需求,對預訓練模型的網絡結構進行適當調整,發現預訓練模型的最后幾層全連接層對于眼科疾病的分類任務不太合適時,修改這些層的節點數量和結構,適應眼科疾病的有限類別;
22、重新定義損失函數:基于眼科疾病分類的準確性要求,定義專門適用于眼科圖像分類任務的損失函數,采用交叉熵損失函數來衡量模型預測結果與真實標簽之間的差異,通過最小化該損失函數來優化模型參數,使得模型在眼科圖像分類上的表現越來越好;
23、調整訓練參數:根據眼科圖像數據集的規模和復雜性,調整訓練過程中學習率、迭代次數;由于預訓練模型已經具有一定的基礎,初始學習率可以設置得相對較小,以避免在微調過程中對已經學習到的通用特征造成過大的擾動,同時根據模型在驗證集上的性能表現,逐步調整學習率,如采用學習率衰減策略。迭代次數也會根據模型在訓練集和驗證集上的收斂情況進行調整,確保模型在不過擬合的前提下充分學習到眼科圖像中的特征和分類模式;
24、數據增強適配:在應用數據增強技術時,考慮眼科圖像的特殊性。例如,在隨機旋轉角度的選擇上,由于眼部結構的相對對稱性和方向性,旋轉角度范圍可能會更謹慎地設置,以避免因過度旋轉導致眼部關鍵特征的扭曲或丟失,確保增強后的數據仍然能夠有效地反映眼科疾病的特征信息,從而更好地輔助模型學習。
25、本發明提供了一種基于大數據模型的眼科疾病圖像分類系統。具備以下有益效果:
26、該基于大數據模型的眼科疾病圖像分類系統,在開發階段測試集以及不同臨床評估階段,白內障、角膜炎和翼狀胬肉等疾病均展現出較高的分類準確率,采用yolov7進行圖像分割訓練,能夠自動將眉毛以下、顴弓以上的眼部區域精準分割出來,去除大量非眼部區域的干擾信息,使模型訓練和分類過程能更專注于眼部特征,有助于提高分類的準確性和可靠性,臨床驗證分為兩個階段且在多家中心進行,包括本中心的內部驗證和其他中心的外部驗證,并采用研究人員收集數據和患者自行采集兩種圖像采集方式,全面地模擬了不同場景下的應用情況,充分驗證了分類模型在不同條件下的準確性和穩定性,有利于模型的廣泛推廣和應用,在模型訓練階段采用五折交叉驗證方法,有效防止過擬合,確保數據集的獨立性和模型的泛化能力,應用多種數據增強技術多樣化訓練數據,進一步提升模型對不同情況眼部圖像的識別能力,使模型能夠更好地適應實際應用中的各種圖像變化,基于智能手機拍攝圖像進行分類,方便患者在居家環境下自行采集眼部圖像,結合較高的分類準確率,提高眼科醫療服務的可及性和便捷性,減輕患者前往醫院就診的負擔,同時也有助于早期疾病的發現和干預。