本申請涉及人工智能,尤其涉及一種客戶攜號轉網行為預測模型訓練方法及裝置、介質、產品。
背景技術:
1、當前預測客戶攜號轉網行為的方案大多數依賴于客戶的行為特征,使用單一算法訓練客戶攜號轉網行為預測模型,單一算法導致訓練模型的預測結果不夠精準。并且,預測模型訓練使用的系統硬件資源有限,系統硬件資源資源不足,會導致增加人工介入成本、重復訓練的資源浪費和時間成本。
2、如此,現有方案客戶攜號轉網行為預測模型的訓練效率和預測準確性具有一定的局限性,難以靈活應對快速變化的市場環境。
技術實現思路
1、本申請實施例的目的是提供一種戶攜號轉網行為預測模型訓練方法及裝置、可讀存儲介質,用以解決客戶攜號轉網行為預測模型的訓練效率和預測準確性低的問題。
2、為了解決上述技術問題,本說明書是這樣實現的:
3、第一方面,提供了一種客戶攜號轉網行為預測模型訓練方法,包括:
4、基于大數據收集的歷史攜號轉網客戶數據提取客戶攜號轉網行為特征并生成訓練樣本集;
5、將所述訓練樣本集中的訓練樣本輸入用于預測客戶攜號轉網行為的目標決策樹模型,以基于系統硬件資源、訓練樣本的特征特性和訓練需求,選擇匹配的決策算法訓練決策樹,并在系統硬件資源和/或決策樹深度滿足算法切換條件時,將決策算法切換為匹配的決策算法并繼續訓練決策樹,所述目標決策樹模型為極度梯度提升決策樹xgboost模型,且配置有多種決策算法;
6、迭代執行將所述訓練樣本集中的訓練樣本輸入目標決策樹模型的步驟,并在所述目標決策樹模型的決策樹滿足收斂條件時,輸出所述目標決策樹模型。
7、可選地,將決策算法切換為匹配的決策算法之前,還包括:
8、在檢測到系統硬件資源或決策樹深度即將滿足算法切換條件時,將切換前決策算法對應處理的第一數據和切換后決策算法對應處理的第二數據緩存在預設數據過渡區并分別進行標記;
9、基于所述預設數據過渡區中的標記,將所述第一數據保持由所述切換前決策樹算法進行處理,將所述第二數據有序地傳遞給切換前后決策算法進行處理。
10、可選地,基于系統硬件資源、訓練樣本的特征特性和訓練需求,選擇匹配的決策算法訓練決策樹,包括如下至少之一:
11、如果系統硬件資源利用率不超出預設利用率閾值且訓練樣本的特征特性為特征數量大于或等于第一預設數量閾值,則選擇包括近似算法和貪心算法的組合算法為匹配的決策算法訓練決策樹;或者
12、如果系統硬件資源利用率不超出預設利用率閾值且訓練樣本的特征特性為的特征數量小于所述第一預設數量閾值且訓練需求為預測精度高,則選擇貪心算法為匹配的決策算法訓練決策樹;或者
13、如果系統硬件資源利用率不超出預設利用率閾值且訓練需求為預測精度小于預設精度閾值和/或訓練需求為訓練時間小于預設時間閾值,則選擇近似算法為匹配的決策算法訓練決策樹;或者
14、如果系統硬件資源利用率不超出預設利用率閾值且訓練樣本的特征特性為包括用作關鍵節點的特征和用作非關鍵節點的特征,則選擇貪心算法用于所述關鍵節點訓練決策樹、以及選擇近似算法用于所述非關鍵節點訓練決策樹。
15、可選地,在系統硬件資源和/或決策樹深度滿足算法切換條件時,將決策算法切換為匹配的決策算法,包括:
16、在訓練決策樹的過程中,監測系統硬件資源的利用率和/或決策樹深度;
17、如果滿足系統硬件資源的利用率超出預設利用率閾值的算法切換條件,則將決策算法切換為近似算法;
18、如果滿足決策樹深度超出預設深度閾值的算法切換條件,則將決策算法切換為近似算法;
19、如果未滿足決策樹深度超出所述預設深度閾值的算法切換條件,則在決策樹深度為0層時設置決策算法為貪心算法。
20、可選地,所述系統硬件資源包括cpu、gpu、網絡帶寬和內存中至少一項。
21、可選地,輸出所述目標決策樹模型之后,還包括:
22、如果基于所述目標決策樹模型預測目標客戶存在攜號轉網行為,且基于客戶挽留策略未成功停止所述目標客戶的攜號轉網行為,則基于制定所述客戶挽留策略的攜出原因和所述攜號轉網行為調整所述訓練樣本集中訓練樣本的特征重要性權重;
23、基于特征重要性權重調整后的訓練樣本,迭代執行將所述訓練樣本集中的訓練樣本輸入目標決策樹模型的步驟,并在所述目標決策樹模型的決策樹滿足收斂條件時,輸出所述目標決策樹模型。
24、可選地,輸出所述目標決策樹模型之后,還包括:
25、基于大數據收集的歷史攜號轉網客戶數據提取客戶攜號轉網行為特征并生成測試樣本集;
26、將所述測試樣本集中的測試樣本輸入所述目標決策樹模型,以得到預測所述測試樣本集對應客戶是否存在攜號轉網行為的預測結果;
27、基于所述預測結果的精確率和召回率對應的調和平均數,得到所述目標決策樹模型的綜合性能評價結果。
28、第二方面,提供了一種客戶攜號轉網行為預測模型訓練裝置,包括處理器和存儲器,所述存儲器存儲可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如第一方面所述的方法的步驟。
29、第三方面,提供了一種可讀存儲介質,該可讀存儲介質上存儲有程序或指令,所述程序或指令被處理器執行時實現如第一方面所述的方法的步驟。
30、在本申請實施例中,通過基于大數據收集的歷史攜號轉網客戶數據提取客戶攜號轉網行為特征并生成訓練樣本集;將所述訓練樣本集中的訓練樣本輸入用于預測客戶攜號轉網行為的目標決策樹模型,以基于系統硬件資源、訓練樣本的特征特性和訓練需求,選擇匹配的決策算法訓練決策樹,并在系統硬件資源和/或決策樹深度滿足算法切換條件時,將決策算法切換為匹配的決策算法并繼續訓練決策樹,所述目標決策樹模型為極度梯度提升決策樹xgboost模型,且配置有多種決策算法;迭代執行將所述訓練樣本集中的訓練樣本輸入目標決策樹模型的步驟,并在所述目標決策樹模型的決策樹滿足收斂條件時,輸出所述目標決策樹模型,由此允許根據預設算法切換條件自動切換合適的決策算法,以適應不同的硬件資源狀況和數據特性,可以優化算力資源與精準度之間的平衡關系,使得在有限的算力資源下訓練速度更快,能夠處理大規模數據集和高維特征,并且可以在有限的算力資源內,獲取到最佳分裂點,提升決策樹深度的同時,保證不容易過度擬合,從而更加準確地構建用于預測客戶攜號轉網行為的最佳決策樹。更加魯棒地處理實際應用中因系統硬件資源不足導致的問題,減少人工介入成本和重復訓練導致的資源浪費。
1.一種客戶攜號轉網行為預測模型訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,將決策算法切換為匹配的決策算法之前,還包括:
3.?根據權利要求1所述的方法,其特征在于,基于系統硬件資源、訓練樣本的特征特性和訓練需求,選擇匹配的決策算法訓練決策樹,包括如下至少之一:
4.根據權利要求1所述的方法,其特征在于,在系統硬件資源和/或決策樹深度滿足算法切換條件時,將決策算法切換為匹配的決策算法,包括:
5.根據權利要求1所述的方法,其特征在于,所述系統硬件資源包括cpu、gpu、網絡帶寬和內存中至少一項。
6.根據權利要求1所述的方法,其特征在于,輸出所述目標決策樹模型之后,還包括:
7.根據權利要求1或6所述的方法,其特征在于,輸出所述目標決策樹模型之后,還包括:
8.一種客戶攜號轉網行為預測模型訓練裝置,其特征在于,包括處理器和存儲器,所述存儲器存儲可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如權利要求1-7中任一項所述的方法的步驟。
9.一種可讀存儲介質,其特征在于,所述可讀存儲介質上存儲程序或指令,所述程序或指令被處理器執行時實現如權利要求1-7中任一項所述的方法的步驟。
10.一種計算機程序產品,其特征在于,所述計算機程序產品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質,所述計算機程序可操作來使計算機執行如權利要求1-7中任一項所述的方法的步驟。