技術特征:1.一種基于元數據的數據庫外鍵關系識別方法,其特征在于,實施步驟為:
2.根據權利要求1所述的方法,其特征在于,所述標準化處理包括:
3.根據權利要求2所述的方法,其特征在于,所述異常或無效數據的處理包括:
4.根據權利要求1所述的方法,其特征在于,所述主鍵識別步驟包括:
5.根據權利要求4所述的方法,其特征在于,所述語義主鍵的判定包括:
6.根據權利要求1所述的方法,其特征在于,所述結構依賴度的計算包括:
7.根據權利要求1所述的方法,其特征在于,所述外鍵關系判定包括:
技術總結本發明公開了一種基于元數據的數據庫外鍵關系識別方法,涉及數據庫技術、數據處理及自然語言處理領域。該方法首先提取數據庫元數據并統計字段核心特征,經標準化預處理生成標準化Metadata集合;再解析該集合篩選顯式主鍵、基于元數據的統計特征與語義規則判定語義主鍵,整合生成全局主鍵集合;隨后對Metadata集合中的字符串特征進行編碼,并生成候選外鍵字段對,融合值域覆蓋率、主鍵唯一性系數、引用依賴率三大元數據衍生特征計算結構依賴度SDS;最后依據預設閾值校驗,篩選有效與疑似外鍵關系,生成標準化外鍵關系結果集。本發明無需依賴字段命名,抗數據噪聲,能精準識別數據庫外鍵關系,依托元數據實現全流程可追溯、可校驗,為數據治理、智能數據庫應用提供可靠的結構支撐。
技術研發人員:譚曾榮,陳浩,孫建華
受保護的技術使用者:湖南大學
技術研發日:技術公布日:2026/6/9