9月29日,Intel Innovation 2022在美國加州圣何塞落下帷幕,作為 Intel 專注于未來創新的年度開發者會議,Intel CEO出席并做主題演講。本次大會聚焦在 AI、5G、云計算等最新技術,會議集中展示了最前沿的科研成果,致力于與合作伙伴共建強大的生態圈。

在本次會議中,來自字節跳動安全研究團隊的Jeddak數據安全沙箱亮相,向觀眾展示了如何在保護數據隱私不泄露的情況下進行多方數據的聯合計算和分析,實現數據“可用不可見”。本次在Intel Innovation峰會是Jeddak隱私計算沙箱產品的首次對外公開。

數據的碎片化、孤島化與海量多維數據共享的需求越發矛盾,充分發揮數據價值的同時又需要確保用戶隱私安全,Jeddak數據安全沙箱能夠為多源數據融合計算提供高安全、高可用、高性能的解決方案,在公有云、私有云以及混合云計算場景下,全方位地為用戶保障數字化資產安全。
Jeddak數據安全沙箱
Jeddak數據安全沙箱是一個聚焦于可信執行環境(TEE)技術所構建的數據計算平臺,適用于跨參與方數據隱私計算的應用場景——既能夠滿足使用方聯合多源數據進行計算的需求,打通“數據孤島”;又能夠達到數據“可用不可見”的安全合規要求,保障對于數據計算過程的隱私、安全、可追溯和可擴展,為數據的可信互聯互通提供行之有效的解決方案。
沙箱為用戶提供安全的數據處理、聯合分析、聯合建模等服務,支持隱私集合求交、匿蹤查詢、機密SQL查詢、隱私保護下的TensorFlow/PyTorch建模及預測等功能。通過:
(1)一站式的管理控制臺
(2)安全執行引擎
(3)可信容器集群
(4)可信硬件的部署和實現
確保用戶能夠高效便捷完成計算任務,并保證數據機密性、完整性、以及處理邏輯的可驗證性,在云端代理計算、數據合規計算、分布式計算等多類應用場景下,為用戶創造更多價值。
強強聯合下的隱私計算能力
Jeddak數據安全沙箱結合Intel開源的BigDL Privacy Preserving Machine Learning (PPML)解決方案,為用戶提供安全、高效的數據處理及分析功能,實現在原始數據明文不暴露的前提下獲取多方數據的聯合統計、查詢結果,滿足不同機構數據分析人員針對敏感或強監管數據進行的多方聯合數據查詢的訴求,解決諸如在廣告投放領域中的投放效果分析、歸因、對賬等痛點問題。
系統在安全性方面采用加密技術保證了數據傳輸過程中的安全性,并采用KMS方案保證密鑰在存儲交換過程中的安全。在大數據處理過程中,采用Intel Attestation Service方案保證了分布式節點的可靠性和安全性。同時,Jeddak數據安全沙箱聯合分析系統采用云原生技術Kubernetes及大數據分析技術Spark/Hadoop,滿足海量數據的處理要求并保證了計算過程的穩定性和高性能。此外,系統還與區塊鏈平臺進行融合,任務計算過程中的關鍵信息都會上鏈存證。

在業務層面,Jeddak數據安全沙箱聯合分析系統以標準 SQL 為輸入,支持對數據的使用進行授權;支持數據的動態加載和更新;支持對目標 SQL 進行多方安全審核;并提供區塊鏈瀏覽器,對任務過程中的上鏈信息進行查詢和審核。系統的部分任務操作界面如下圖所示:

在執行效率上,Jeddak數據安全沙箱聯合分析系統可以在分鐘級別完成億級規模數據的聯合分析,高效滿足大部分用戶的隱私計算需求。
更多應用與實踐
在聯合營銷、政府疫情防控、生信大數據分析等場景下,Jeddak數據安全沙箱也正在助力企業安全合規地使用數據、挖掘多方數據價值。
通過自研的JeddakTEE開發框架,在開發角度,沙箱兼容LibOS、WASM在內的多種安全運行時,并適配多種異構底層TEE硬件平臺,用戶可一鍵編譯部署運行業務代碼,大大降低用戶開發部署TEE應用的門檻。
面向多元場景,沙箱構建了通用的計算引擎和算法倉庫,支持包括TensorFlow/PyTorch腳本在內的訓練和預測任務,并且具備基于聯盟鏈的狀態存證與驗證能力。沙箱融合加速引擎通過自研軟硬件一體化的執行算法,顯著提升MPC、FL等隱私計算過程的執行速度和通信效率——隱私計算求交算法相較于目前最快的MPC協議提升超12倍,縱向聯邦算法相較于純軟件方案,提升近40倍。

總結與展望
隨著逐漸完善的法律法規和日益增強的監管環境下,對于有數據使用和數據流轉的企業和組織來說,保護數據安全已經提升到了空前的高度,保護數據安全已成為企業的必選項。Jeddak數據安全沙箱團隊也將繼續攜手生態合作伙伴,共同探索隱私計算中的更多實際應用場景,致力打破“數據孤島”,在合規下發揮數據的最大價值。