本技術涉及電池,尤其涉及一種垃圾分類處理模型的構建方法、裝置及電子設備。
背景技術:
1、隨著環保意識的增強和垃圾分類政策的推行,垃圾分類成為資源回收利用和生態保護的重要環節,近年來,基于圖像識別的自動垃圾分類技術因能提升分類效率和降低人工成本,得到廣泛應用。然而相關技術中,現有的一些垃圾分類模型特征提取不全面導致模型的分辨準確率較低,還有些垃圾分類模型雖然分辨準確率較高,但是依賴大模型數據集以及部署高性能的硬件支持訓練,模型結構過于復雜,訓練效率低且成本高,泛化能力不足,難以推廣使用。
技術實現思路
1、本技術旨在提供一種垃圾分類處理模型的構建方法、裝置及電子設備,旨在解決相關現有模型對垃圾類型的分類精度低的問題。
2、第一方面,本技術提出了一種垃圾分類處理模型的構建方法,包括:獲取訓練數據集中的多個訓練圖片樣本,其中,所述訓練圖片樣本標注有垃圾類型標簽;根據所述訓練圖片樣本確定對應的垃圾特征,其中,所述垃圾特征包括幾何特征、顏色特征和紋理特征;獲取訓練參數,所述訓練參數包括節點純度預設指標、最大深度、最小分裂樣本數和葉節點最小樣本數;從初始節點開始,執行第一流程:遍歷每個特征及所述特征對應的多個候選分裂閾值,基于所述垃圾類型標簽計算每組特征候選分裂閾值組合的節點純度值,并選擇最符合所述節點純度預設指標的所述節點純度值對應的特征候選分裂閾值作為第一組合,根據所述第一組合基于當前節點分裂出兩個子節點;其中,所述初始節點包含所述訓練數據集的全部訓練圖片樣本,所述特征候選分裂閾值組合包括一所述特征,以及所述特征對應的一候選分裂閾值;對于每個所述子節點重復執行上述第一流程,直至滿足所述最大深度、所述最小分裂樣本數和所述葉節點最小樣本數中的至少一項時停止,將停止時的當前節點記為葉節點,并以所述葉節點中樣本數最多的垃圾類型作為所述葉節點的輸出結果,以得到所述垃圾分類處理模型。
3、本方案通過獲取帶垃圾類型標簽的訓練圖片樣本,提取幾何、顏色、紋理三類垃圾特征,通過多維度特征融合避免單一特征的局限性,在設定訓練參數后,從初始節點開始遞歸遍歷特征及候選分裂閾值,并選擇最優分裂組合分裂節點,直至滿足停止條件并確定葉節點輸出結果,最終得到垃圾分類處理模型,由此借助自動分裂節點的方式替代人工設定分類規則,提升模型構建的效率而且能保證模型分類的穩定性,能夠降低模型構建的成本且使得模型能夠快速實現垃圾類別的精準判斷。
4、在一些實施例中,所述根據所述訓練圖片樣本確定對應的垃圾特征,包括:獲取所述訓練圖片樣本對應的灰度圖和垃圾主體輪廓;結合所述垃圾主體輪廓確定對應垃圾主體的幾何特征,所述幾何特征包括長寬比、致密度、圓形度、矩形度和輪廓復雜度;結合所述垃圾主體輪廓,基于顏色空間提取對應垃圾主體的顏色特征,所述顏色特征包括平均色調、平均飽和度、白色區域比例、高光區域比例和顏色一致性指標;結合所述灰度圖確定對應垃圾主體的紋理特征,所述紋理特征包括紋理熵和紋理對比度。
5、本方案通過獲取訓練圖片樣本的灰度圖和垃圾主體輪廓,再結合顏色空間分別提取多類特征,綜合考慮能夠反映垃圾的形狀、顏色和表面材質特性的多維特征相互補充和協同進行訓練,能夠解決單一特征無法區分相似垃圾的問題,由此提升模型對不同類型垃圾的區分能力和分類精度。
6、在一些實施例中,所述獲取所述訓練圖片樣本對應的灰度圖和垃圾主體輪廓,包括:調整所述訓練圖片樣本的尺寸至符合預設像素尺寸;對調整后的所述訓練圖片樣本進行去噪處理;獲取去除噪聲后的訓練圖片樣本的灰度圖和二值圖;對所述二值圖進行形態學優化,包括去除噪聲點并填充孔洞;基于優化后的所述二值圖中提取輪廓,并將面積最大的輪廓確定為垃圾主體輪廓。
7、本方案通過調準圖片尺寸確保輸入一致性,并對圖片進行多種優化,由此基于面積最大準則準確定位垃圾主體區域,從而獲得高質量且完整的垃圾主體輪廓,為后續各類特征的提取提供精確的圖片數據,由此提升輸入模型的訓練數據質量和模型構建的準確性。
8、在一些實施例中,所述節點純度預設指標為基尼指數,所述基尼指數的計算方式為:對于當前節點,統計每種類別樣本的占比;計算一減去各類別樣本占比的平方和,得到所述當前節點的基尼指數。
9、本方案通過計算每個候選分裂閾值對應的加權平均基尼指數,求解基尼增益并選擇基尼增益最大的特征與候選分裂閾值組合作為第一組合,其中,基尼增益能夠量化分裂前后節點純度的提升程度,選擇基尼增益最大的組合進行節點分裂,可確保每次分裂都能使節點類別純度提升最顯著,避免無效分裂,提升模型的分類精度和泛化能力,確保模型能夠準確地對垃圾進行分類。
10、在一些實施例中,所述選擇最符合所述節點純度預設指標的所述節點純度值對應的特征候選分裂閾值組合作為第一組合,包括:對于每個候選分裂閾值,計算分裂后兩個子節點的加權平均基尼指數;計算分裂前的當前節點的基尼指數與所述加權平均基尼指數的差值,得到基尼增益;選擇所述基尼增益最大的特征候選分裂閾值組合作為所述第一組合。
11、本方案通過獲取與訓練數據集類別占比一致的測試數據集,對構建完成的模型進行測試,根據測試結果調整訓練參數或補充訓練樣本,直至測試結果滿足預設要求,由此避免因測試集類別分布不均導致的測試偏差,且能及時修正模型存在的不足,解決模型過擬合、欠擬合或部分類別誤分率過高的問題,由此提升模型的實用性和魯棒性,使得模型能夠適應真實場景的垃圾分類需求。
12、在一些實施例中,所述方法還包括:獲取測試數據集中的多個測試圖片樣本,并確定每個所述測試圖片樣本對應的所述垃圾特征,其中,所述測試數據集中每種垃圾類型的測試圖片樣本的占比與所述訓練數據集中每種垃圾類型的訓練圖片樣本的占比相同;基于所述測試數據集對所述垃圾分類處理模型進行測試,以得到測試結果;在所述測試結果不滿足預設結果指標時,調整所述訓練參數或者添加新的訓練圖片樣本并再次訓練和測試所述垃圾分類處理模型,直至所述測試結果滿足預設結果。
13、本方案通過統計當前節點每種類別樣本的占比計算基尼指數,清晰量化節點的類別純度,為節點分裂提供統一的判斷標準,避免節點純度判斷的主觀性過高,使得每次節點分裂都有明確的科學依據,由此提升模型構建的規范性與合理性,以及模型分類的準確性。
14、在一些實施例中,所述候選分裂閾值的確定方式包括:對于當前垃圾特征,將當前節點中全部訓練圖片樣本的特征值進行升序排序;計算相鄰兩個特征值的中值作為當前垃圾特征的候選分裂閾值。
15、本方案通過對當前節點中訓練圖片樣本的特征值升序排序,計算相鄰兩個特征值的中值作為候選分裂閾值,由此覆蓋特征值的真實分布范圍,篩選出具有實際區分意義的候選閾值,減少對無效閾值的盲目嘗試,既能提升節點分裂的效率,又使得候選閾值能夠貼合訓練數據的分布特點,由此使得節點分裂更合理,對類型的分類更精準,進一步優化模型的構建效果。
16、第二方面,本技術還提出了一種垃圾分類處理方法,包括:獲取待分類垃圾的垃圾圖片;根據所述垃圾圖片確定對應垃圾的多個垃圾特征,其中,所述垃圾特征包括幾何特征、顏色特征和紋理特征;通過上述所述的垃圾分類處理模型,以及所述垃圾特征,對所述垃圾圖片進行類型識別,以得到所述垃圾圖片的分類結果。
17、第三方面,本技術還提出了一種垃圾分類處理模型的構建裝置,包括:第一獲取模塊,用于獲取訓練數據集中的多個訓練圖片樣本,其中,所述訓練圖片樣本標注有垃圾類型標簽;特征確定模塊,用于根據所述訓練圖片樣本確定對應的垃圾特征,其中,所述垃圾特征包括幾何特征、顏色特征和紋理特征;參數獲取模塊,用于獲取訓練參數,所述訓練參數包括節點純度預設指標、最大深度、最小分裂樣本數和葉節點最小樣本數;第一訓練模塊,用于從初始節點開始,執行第一流程:遍歷每個特征及所述特征對應的多個候選分裂閾值,基于所述垃圾類型標簽計算每組特征候選分裂閾值組合的節點純度值,并選擇最符合所述節點純度預設指標的所述節點純度值對應的特征候選分裂閾值作為第一組合,根據所述第一組合基于當前節點分裂出兩個子節點;其中,所述初始節點包含所述訓練數據集的全部訓練圖片樣本,所述特征候選分裂閾值組合包括一所述特征,以及所述特征對應的一候選分裂閾值;第二訓練模塊,用于對于每個所述子節點重復執行上述第一流程,直至滿足所述最大深度、所述最小分裂樣本數和所述葉節點最小樣本數中的至少一項時停止,將停止時的當前節點記為葉節點,并以所述葉節點中樣本數最多的垃圾類型作為所述葉節點的輸出結果,以得到所述垃圾分類處理模型。
18、第四方面,本技術還提出了一種電子設備,包括:至少一個處理器和存儲器;所述存儲器與所述處理器耦合,所述存儲器用于存儲指令或程序,當所述指令或程序被所述至少一個處理器執行時,使所述至少一個處理器執行上述所述的方法。
19、區別于相關技術的情況,本方案通過獲取帶垃圾類型標簽的訓練圖片樣本,提取幾何、顏色、紋理三類垃圾特征,通過多維度特征融合避免單一特征的局限性,在設定訓練參數后,從初始節點開始遞歸遍歷特征及候選分裂閾值,并選擇最優分裂組合分裂節點,直至滿足停止條件并確定葉節點輸出結果,最終得到垃圾分類處理模型,由此借助自動分裂節點的方式替代人工設定分類規則,提升模型構建的效率而且能保證模型分類的穩定性,能夠降低模型構建的成本且使得模型能夠快速實現垃圾類別的精準判斷。