本發明涉及動物育種,具體涉及一種基于系譜關系與后代預測近交系數約束的動物選配方法、系統、設備及存儲介質。
背景技術:
1、動物育種過程中,科學合理的選種選配是控制群體近交積累、維持遺傳多樣性、提高生產性能和保障種群持續改良能力的重要技術環節。在實際生產中,選配決策通常需要同時考慮個體來源、系譜關系、近交水平、候選公母數量、配比要求以及一定代數范圍內的共祖約束等多種因素。隨著育種群體規模不斷擴大和系譜記錄日益復雜,依賴人工經驗或簡單規則進行選配的方式已難以滿足精準化、批量化和高效率的應用需求。
2、現有技術中,系譜分析通??梢杂嬎阆底V中已存在個體的近交系數,用于描述該個體自身的近交程度。然而,在實際選配場景下,育種人員真正關心的往往并非候選公畜和母畜自身的近交水平,而是該公母組合未來后代可能達到的近交程度。由于該后代尚未出生,并不存在于原始系譜數據中,因此僅依賴現有個體近交系數并不能直接滿足選配篩選的實際需求。若將父母自身近交系數錯誤地替代未來后代預測近交系數,容易導致篩選依據偏差,影響選配結果的準確性。
3、另一方面,現有選配方式還常涉及前若干代共同祖先約束。例如,為避免近交風險過高,通常要求候選公母在預設代數范圍內不存在共同祖先。傳統做法往往需要逐對人工核對,或者使用效率較低的程序逐步追溯判斷,在候選公母數量較大時,計算量迅速增加。同時,當需要進一步疊加后代預測近交閾值、配比限制及不同組合排序策略時,現有方法難以形成一套統一、自動化且可解釋的篩選流程。
4、此外,現有技術中對于候選組合篩選結果的輸出通常較為粗略,往往只能得到最終配對結果,缺乏對全部候選組合的過濾原因說明,無法直觀區分某一候選組合是因前代共祖被排除,還是因未來后代近交水平超過閾值而被排除,也難以給出配對成功公畜數、成功母畜數、未使用母畜數、候選組合總體近交水平等統計匯總信息,不利于育種人員進行結果復核、策略優化和生產決策。
5、為此,我們提出一種基于系譜關系與后代預測近交系數約束的動物選配方法、系統、設備及存儲介質。
技術實現思路
1、本發明的目的在于提供一種基于系譜關系與后代預測近交系數約束的動物選配方法、系統、設備及存儲介質,以解決現有技術中存在的問題。
2、為實現上述目的,本發明采用如下技術方案:
3、本發明提供一種基于系譜關系與后代預測近交系數約束的動物選配方法,包括:
4、s1、獲取動物系譜數據、公畜個體數據和母畜個體數據,其中,所述系譜數據至少包括個體標識、父本標識和母本標識;
5、s2、對所述系譜數據進行合法性檢查和結構化處理,其中:
6、所述合法性檢查包括以下至少之一:重復個體標識檢查、父本或母本等于個體自身的檢查、父母個體缺失于系譜的檢查、拓撲異常檢查以及循環依賴檢查;
7、所述結構化處理包括建立個體標識索引、補充被子代引用但未獨立出現在系譜中的父母個體、將父母信息均未知的個體標記為始祖個體,并基于父母在前、后代在后的規則對全部個體執行拓撲排序,以構建系譜關系數據結構;
8、s3、基于所述系譜關系數據結構,計算系譜中已有個體的近交系數,獲得個體近交結果;
9、s4、針對候選公母組合,依據所述系譜關系數據結構,分別向上追溯候選公畜和候選母畜在預設代數范圍內的祖先集合,并判斷兩祖先集合是否存在交集,以確定該候選公母組合在所述預設代數范圍內是否存在共同祖先;
10、s5、對于在所述預設代數范圍內不存在共同祖先的候選公母組合,基于候選公畜與候選母畜之間的系譜關系值,計算該組合未來后代的預測近交系數,且在計算過程中無需將該未來后代預先寫入原始系譜數據;
11、s6、將所述未來后代的預測近交系數與預設近交閾值比較,篩除預測近交系數超過所述預設近交閾值的候選公母組合;
12、s7、根據預設公母配比和候選排序策略,從通過篩選的候選公母組合中生成選配結果;所述候選排序策略至少包括以下之一:公畜按輸入順序正向處理且母畜按輸入順序正向處理的第一策略;公畜按輸入順序正向處理且母畜按輸入順序反向處理的第二策略;公畜按輸入順序正向處理且母畜按隨機順序處理的第三策略;當采用所述第三策略時,進一步基于可復現的隨機種子參數生成母畜隨機順序;
13、進一步的,在步驟s7中,當采用所述第三策略時,針對不同公畜采用基礎隨機種子與公畜索引組合形成局部隨機種子,以使不同公畜對應的母畜隨機掃描順序不同,且在相同輸入數據和相同隨機種子參數條件下重復運行時得到一致的選配結果。
14、進一步的,在步驟s8中,所述輸出結果信息還包括以下至少之一:
15、候選組合篩選結果,其包括:候選公畜標識、候選母畜標識、在預設代數范圍內是否存在共同祖先、未來后代預測近交系數、是否通過篩選及篩選原因;
16、個體近交結果;
17、統計匯總結果,其包括以下至少之一:系譜個體總數、候選組合總數、因共同祖先約束被過濾的組合數、因未來后代預測近交系數超過閾值被過濾的組合數、成功配對組合數、個體近交統計值、候選組合未來后代近交統計值。
18、一種基于系譜關系與后代預測近交系數約束的動物選配系統,所述系統用于實現所述的一種基于系譜關系與后代預測近交系數約束的動物選配方法,其包括:
19、數據獲取模塊,用于獲取動物系譜數據、公畜個體數據和母畜個體數據;
20、系譜檢查與結構化模塊,用于對所述系譜數據進行如權利要求1中步驟s2所述的合法性檢查和結構化處理,以構建系譜關系數據結構;
21、個體近交計算模塊,用于計算系譜中已有個體的近交系數;
22、共祖判斷模塊,用于判斷候選公畜與候選母畜在預設代數范圍內是否存在共同祖先;
23、后代近交預測模塊,用于計算候選公母組合未來后代的預測近交系數;
24、篩選模塊,用于根據共同祖先約束和近交閾值篩選候選公母組合;
25、配對生成模塊,用于根據預設公母配比和候選排序策略生成選配結果;
26、輸出模塊,用于輸出選配結果及相關結果信息。
27、進一步的,所述系統具有本地運行形態,被配置為由本地可執行程序實現;所述本地可執行程序接收系譜文件路徑、公畜文件路徑、母畜文件路徑和運行參數,在本地計算設備上獨立完成所述方法的各步驟,并通過命令行參數控制運行模式;所述運行模式至少包括系譜檢查模式、個體近交系數計算模式、候選公母未來后代近交系數計算模式和自動選配模式。
28、進一步的,所述系統具有云平臺運行形態,被配置為包括前端交互平臺和后臺分析程序;
29、所述前端交互平臺,用于接收用戶上傳的系譜文件、公畜文件和母畜文件,獲取用戶設置的運行參數,觸發后臺分析程序執行,并展示分析結果及提供結果下載;
30、所述后臺分析程序,用于執行如權利要求1至3中任一項所述方法的計算步驟。
31、進一步的,所述后臺分析程序采用c++實現,所述前端交互平臺采用shiny平臺實現;
32、所述前端交互平臺通過命令調用方式或服務接口方式與所述后臺分析程序通信,并將上傳文件保存至工作目錄,根據分析模式及運行參數生成后臺分析程序調用命令,在后臺分析程序執行完成后讀取結果文件和運行日志并進行展示。
33、一種電子設備,包括處理器和存儲器,所述存儲器中存儲有計算機程序,所述計算機程序被所述處理器執行時,使所述電子設備執行所述的一種基于系譜關系與后代預測近交系數約束的動物選配方法。
34、一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時,實現所述的一種基于系譜關系與后代預測近交系數約束的動物選配方法。
35、與現有技術相比,本發明至少具有以下有益效果:
36、1.明確區分已有個體近交系數與候選公母未來后代預測近交系數,提高篩配依據準確性;
37、2.將共同祖先約束與后代預測近交閾值聯合應用于自動選配流程,提高選配科學性;
38、3.支持對大規模系譜和大量候選組合進行批量自動篩選,提高處理效率;
39、4.能輸出候選組合過濾原因和統計匯總結果,提高結果可解釋性和可復核性;
40、5.支持不同候選排序策略及可復現隨機機制,提高應用靈活性和工程實用性;
41、6.適于以c++后臺程序和shiny在線平臺等形式部署,便于推廣應用。