本發(fā)明涉及數(shù)據(jù)安全與數(shù)據(jù)處理交叉技術,更具體地說,它涉及一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法。
背景技術:
1、數(shù)據(jù)加工與多源數(shù)據(jù)融合是數(shù)字經(jīng)濟領域的核心技術方向,廣泛應用于金融、政務、醫(yī)療等行業(yè),其核心需求是在保障數(shù)據(jù)安全的基礎上實現(xiàn)數(shù)據(jù)價值轉化。
2、當前數(shù)據(jù)加工過程中,存在數(shù)據(jù)跨域傳輸導致的泄露風險、開發(fā)環(huán)境與生產(chǎn)環(huán)境不兼容、權限管控不足等問題。現(xiàn)有技術多采用集中式數(shù)據(jù)處理模式,需將原始數(shù)據(jù)歸集至開發(fā)端,難以滿足數(shù)據(jù)隱私保護法規(guī)要求;部分沙箱技術缺乏完善的權限校驗與脫敏機制,且未實現(xiàn)測試與生產(chǎn)環(huán)境的精準適配,導致模型部署成功率低、數(shù)據(jù)安全隱患突出。
3、為解決上述問題,本發(fā)明提出一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,通過分布式架構與全流程安全管控,實現(xiàn)數(shù)據(jù)安全與加工效率的協(xié)同優(yōu)化。
技術實現(xiàn)思路
1、針對現(xiàn)有技術存在的不足,本發(fā)明的目的在于提供一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法。
2、為實現(xiàn)上述目的,本發(fā)明提供了如下技術方案:
3、一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,具體包括以下步驟:
4、數(shù)據(jù)開發(fā)方基于多數(shù)據(jù)源融合開發(fā)需求,通過開發(fā)方連接器提交含開發(fā)場景、目標數(shù)據(jù)字段、數(shù)據(jù)使用期限的資源申請單;申請單經(jīng)提供方連接器轉發(fā)后,由其內(nèi)置權限校驗模塊對開發(fā)方主體身份及數(shù)據(jù)使用用途合規(guī)性進行初步校驗;校驗通過的申請單經(jīng)數(shù)據(jù)提供方最終審批后,提取樣本數(shù)據(jù)并進行脫敏處理,再通過加密通道回傳至開發(fā)方連接器;開發(fā)方連接器識別樣本數(shù)據(jù)格式并創(chuàng)建樣例數(shù)據(jù)表,自動構建含銷毀策略、計算資源配置的測試沙箱環(huán)境并完成初始化;數(shù)據(jù)開發(fā)方在測試沙箱中編寫加工模型,經(jīng)調(diào)試測試通過后上傳至開發(fā)方連接器,由其校驗后加密轉發(fā)至提供方連接器;提供方連接器將加工模型部署至生產(chǎn)沙箱進行適配性驗證,驗證通過后部署至正式生產(chǎn)沙箱并對接生產(chǎn)數(shù)據(jù),自動生成可開放調(diào)用的api接口;開發(fā)方獲取api接口后補充安全機制,封裝為合規(guī)數(shù)據(jù)產(chǎn)品并上架。
5、進一步的,所述的權限校驗模塊的校驗內(nèi)容包括開發(fā)方在可信數(shù)據(jù)空間內(nèi)注冊的主體身份及綁定的相關資質(zhì)信息,以及數(shù)據(jù)加工方式是否符合數(shù)據(jù)安全要求。
6、進一步的,所述的脫敏處理采用掩碼屏蔽、格式替換、隨機替換、數(shù)據(jù)截斷、可逆加密、不可逆加密、空值替換中的一種或多種組合方式。
7、進一步的,所述的測試沙箱環(huán)境初始化包括將樣本數(shù)據(jù)導入臨時數(shù)據(jù)庫表、支持用戶配置沙箱環(huán)境參數(shù)、綁定樣本數(shù)據(jù)庫表至沙箱環(huán)境,以及提供手動或自動的沙箱銷毀模式。
8、進一步的,所述的加工模型包括代碼、多計算節(jié)點組成的工作流配置數(shù)據(jù),支持界面編輯調(diào)試、拖拉拽工作流組合模式,適配多種代碼開發(fā)組件、數(shù)據(jù)處理組件及邏輯處理組件。
9、進一步的,所述的加工模型采用數(shù)據(jù)訪問隔離策略和權限控制策略,數(shù)據(jù)訪問隔離策略針對數(shù)據(jù)庫表數(shù)據(jù)源、文件數(shù)據(jù)源、對象存儲云資源分別采用對應的物理隔離方式,權限控制策略包括基于rbac的用戶權限控制和基于odrl的數(shù)據(jù)使用控制。
10、進一步的,所述的適配性驗證包括驗證加工模型是否含惡意代碼及越權數(shù)據(jù)訪問邏輯,以及模型與提供方數(shù)據(jù)環(huán)境的兼容性。
11、進一步的,所述的生產(chǎn)沙箱支持集群化部署,通過資源虛擬化技術為每個加工模型分配獨立計算資源池,計算資源池采用預設策略分配空閑沙箱環(huán)境,無空閑資源時按請求順序排隊等待。
12、與現(xiàn)有技術相比,本發(fā)明具備以下有益效果:
13、1、采用數(shù)據(jù)不出域的核心架構,結合多維度脫敏處理與加密傳輸技術,從源頭規(guī)避數(shù)據(jù)泄露風險。通過掩碼屏蔽、加密等多種脫敏方式組合處理樣本數(shù)據(jù),搭配ssl加密通道傳輸,同時生產(chǎn)數(shù)據(jù)全程留存在提供方沙箱中,僅通過api接口輸出加工結果,既滿足數(shù)據(jù)隱私保護要求,又保障數(shù)據(jù)加工的完整性,解決了傳統(tǒng)集中式處理中數(shù)據(jù)跨域傳輸?shù)陌踩[患;
14、2、構建測試沙箱-生產(chǎn)沙箱二級開發(fā)部署體系,搭配適配性驗證機制,提升模型部署可靠性。測試沙箱支持多組件編輯與靈活配置,生產(chǎn)沙箱采用集群化部署與資源虛擬化技術,為每個模型分配獨立計算資源池;通過惡意代碼檢測、環(huán)境兼容性驗證等步驟,避免模型部署沖突,解決了現(xiàn)有技術中開發(fā)與生產(chǎn)環(huán)境脫節(jié)、模型適配性差的問題,保障加工流程穩(wěn)定高效;
15、3、融合rbac與odrl雙重權限控制策略,實現(xiàn)精細化數(shù)據(jù)訪問管控。針對不同數(shù)據(jù)源采用物理隔離方式,用戶操作與數(shù)據(jù)訪問分別通過角色權限與使用規(guī)則雙重約束,有效防止越權訪問與數(shù)據(jù)濫用,解決了傳統(tǒng)加工方法中權限管控粗放、數(shù)據(jù)使用邊界模糊的問題,提升數(shù)據(jù)加工全流程的合規(guī)性。
1.一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述方法流程如下:
2.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的權限校驗模塊的校驗內(nèi)容包括開發(fā)方在可信數(shù)據(jù)空間內(nèi)注冊的主體身份及綁定的相關資質(zhì)信息,以及數(shù)據(jù)加工方式是否符合數(shù)據(jù)安全要求。
3.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的脫敏處理采用掩碼屏蔽、格式替換、隨機替換、數(shù)據(jù)截斷、可逆加密、不可逆加密、空值替換中的一種或多種組合方式。
4.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的測試沙箱環(huán)境初始化包括將樣本數(shù)據(jù)導入臨時數(shù)據(jù)庫表、支持用戶配置沙箱環(huán)境參數(shù)、綁定樣本數(shù)據(jù)庫表至沙箱環(huán)境,以及提供手動或自動的沙箱銷毀模式。
5.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的加工模型包括代碼、多計算節(jié)點組成的工作流配置數(shù)據(jù),支持界面編輯調(diào)試、拖拉拽工作流組合模式,適配多種代碼開發(fā)組件、數(shù)據(jù)處理組件及邏輯處理組件。
6.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的加工模型采用數(shù)據(jù)訪問隔離策略和權限控制策略,數(shù)據(jù)訪問隔離策略針對數(shù)據(jù)庫表數(shù)據(jù)源、文件數(shù)據(jù)源、對象存儲云資源分別采用對應的物理隔離方式,權限控制策略包括基于rbac的用戶權限控制和基于odrl的數(shù)據(jù)使用控制。
7.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的適配性驗證包括驗證加工模型是否含惡意代碼及越權數(shù)據(jù)訪問邏輯,以及模型與提供方數(shù)據(jù)環(huán)境的兼容性。
8.根據(jù)權利要求1所述的一種基于分布式數(shù)據(jù)沙箱的數(shù)據(jù)不出域加工方法,其特征在于,所述的生產(chǎn)沙箱支持集群化部署,通過資源虛擬化技術為每個加工模型分配獨立計算資源池,計算資源池采用預設策略分配空閑沙箱環(huán)境,無空閑資源時按請求順序排隊等待。