如何打通生產(chǎn)中存在的數(shù)據(jù)孤島,讓數(shù)據(jù)安全有效的協(xié)作,釋放數(shù)據(jù)價(jià)值,成為所有大數(shù)據(jù)行業(yè)參與者不斷探索和思考的問(wèn)題。9月11日,在2020騰訊全球數(shù)字生態(tài)大會(huì)大數(shù)據(jù)專場(chǎng)上,騰訊云AI平臺(tái)總監(jiān)陶陽(yáng)宇透露,騰訊目前正在打造聯(lián)合安全計(jì)算平臺(tái),將安全加密技術(shù)與大數(shù)據(jù)計(jì)算、人工智能相結(jié)合,能夠有效解決跨機(jī)構(gòu)跨公司之間的數(shù)據(jù)協(xié)作問(wèn)題。

陶陽(yáng)宇介紹,騰訊很早就提出了通用意義下的聯(lián)合安全計(jì)算的概念。技術(shù)上,騰訊一方面在分布式技術(shù)之上加入安全因子,另一方面引入硬件加速解決安全加密帶來(lái)的計(jì)算量增加的問(wèn)題,最終構(gòu)建出騰訊聯(lián)合安全計(jì)算平臺(tái)。

詳細(xì)來(lái)說(shuō),騰訊聯(lián)合安全計(jì)算平臺(tái)擴(kuò)展了現(xiàn)有的大數(shù)據(jù)和AI計(jì)算框架,基于聯(lián)合計(jì)算編譯和基礎(chǔ)安全算子,將數(shù)據(jù)分析、數(shù)據(jù)建模的任務(wù),翻譯成由安全算子組成的物理執(zhí)行計(jì)劃,在多個(gè)數(shù)據(jù)源之間完成安全、協(xié)同的聯(lián)合計(jì)算。整個(gè)平臺(tái)提供聯(lián)合數(shù)據(jù)庫(kù)、安全求交、隱私安全查詢、聯(lián)合分析、聯(lián)合建模等計(jì)算能力,可以廣泛應(yīng)用在政府機(jī)構(gòu)、金融服務(wù)、廣告平臺(tái)等多種行業(yè)。
在安全方面,平臺(tái)采用了去中心化的聯(lián)邦協(xié)議,無(wú)論部署和計(jì)算,都不依賴第三方,增強(qiáng)了系統(tǒng)的安全性和實(shí)用性。系統(tǒng)采用Freedman多項(xiàng)式加密技術(shù)來(lái)確保求交時(shí)的安全性,同時(shí)還采用高強(qiáng)度同態(tài)加密運(yùn)算。所有消息在參與方之間都是加密傳輸,沒(méi)有隱私泄露。
在性能方面,騰訊聯(lián)合安全計(jì)算平臺(tái)在設(shè)計(jì)和實(shí)現(xiàn)時(shí),針對(duì)系統(tǒng)性能做了重點(diǎn)優(yōu)化。例如機(jī)器學(xué)習(xí)場(chǎng)景,支持異步并發(fā)mini-batch訓(xùn)練,加速模型收斂速度,對(duì)計(jì)算量大的同態(tài)加密也進(jìn)行了優(yōu)化,比如Paillier3加密能達(dá)到單線程每秒1萬(wàn)次加密和1千次解密的性能。系統(tǒng)支持海量數(shù)據(jù),比業(yè)界框架快5倍以上,提升效果明顯。
同時(shí),平臺(tái)在AI建模方面支持了全棧的功能,內(nèi)置LR、GBDT、DNN等多種模型。在數(shù)據(jù)分析方面,提供了多方的SQL查詢,多維表分析等功能。提供了可視化拖拽操作,大大降低了聯(lián)合計(jì)算的使用門(mén)檻。
陶陽(yáng)宇透露,騰訊聯(lián)合安全計(jì)算平臺(tái)目前還是內(nèi)部Alpha版本,正在計(jì)劃接下來(lái)在騰訊云的TI-ONE平臺(tái)上線聯(lián)合建模產(chǎn)品。事實(shí)上,平臺(tái)的兩款產(chǎn)品聯(lián)邦機(jī)器學(xué)習(xí)PowerFL和安全數(shù)據(jù)分析SuperSQL目前在金融、廣告等場(chǎng)景中實(shí)際應(yīng)用并取得了不錯(cuò)的成效。
以某金融服務(wù)場(chǎng)景為例,聯(lián)邦學(xué)習(xí)PowerFL通過(guò)平臺(tái)提供的聯(lián)合建模能力,多個(gè)數(shù)據(jù)源實(shí)現(xiàn)安全融合。10萬(wàn)樣本50維特征,雙方的原始特征不出本地,采用聯(lián)邦邏輯回歸模型,傳輸經(jīng)過(guò)同態(tài)加密后的梯度信息,最后進(jìn)行聯(lián)邦預(yù)測(cè)打分,與金融業(yè)務(wù)系統(tǒng)對(duì)接。聯(lián)邦建模相比與單側(cè)建模,其中KS從B側(cè)原來(lái)的39.9提升到46.4,提升16%,效果明顯。
另外,聯(lián)合計(jì)算大數(shù)據(jù)分析產(chǎn)品SuperSQL已經(jīng)應(yīng)用在廣告專區(qū)中,支持多方數(shù)據(jù)融合,實(shí)現(xiàn)更精準(zhǔn)更有效的廣告投放,開(kāi)啟了新的數(shù)據(jù)合作方式。聯(lián)合計(jì)算的技術(shù)還在推薦、風(fēng)控、營(yíng)銷等更多場(chǎng)景大規(guī)模應(yīng)用。
陶陽(yáng)宇表示:“騰訊聯(lián)合安全計(jì)算技術(shù)正在快速迭代中,提供典型的聯(lián)合分析、聯(lián)合建模功能。未來(lái)將聯(lián)合更多合作伙伴,實(shí)現(xiàn)更多場(chǎng)景下的數(shù)據(jù)應(yīng)用和挖掘,助力業(yè)務(wù)騰飛?!?/p>