免费久久国产&夜夜毛片&亚洲最大无码中文字幕&国产成人无码免费视频之奶水&吴家丽查理三级做爰&国产日本亚欧在线观看

訂閱
糾錯
加入自媒體

探索隱私計算的江湖:數據金礦的守護者與吹哨人

2021-04-21 08:55
IT創事記
關注

煤老板和IT精英相遇,兩個人想比比誰更富有,但都不愿告訴對方自己真正擁有多少財富,也不想讓第三方掌握原始信息。何解?

以上是圖靈獎得主姚期智院士提出的“百萬富翁假設”的通俗版演繹,里面涉及大數據發展進程中的一個核心難題:如何厘清數據的所有權和使用權。在我們日常的應用場景中,數據的所有權和使用權經常是混合在一起的,難免會遭遇顧此失彼的窘境。想象一種神奇的分離術:煤老板和IT精英擁有自身財富數據的所有權,平臺只能獲得加密數據的使用權,而經過“黑盒”的轉化,即可得出“誰更富有”的結論。這就是隱私計算的雛形,專業表述為“解決互不信任的參與方之間,在保護隱私信息以及沒有可信第三方前提下的協同計算問題”。在數據大爆發的浪潮下,隱私計算的發展一日千里。4月18日在北京舉辦的騰訊大數據高峰論壇上,第四代數智融合計算平臺“騰訊大數據-天工”橫空出世,《騰訊隱私計算白皮書》也新鮮出爐(可以在微信公眾號后臺輸入“隱私計算”下載這份白皮書)。行業龍頭的重磅出擊,標志著隱私計算在國內大數據領域已漸入佳境,實踐模式和方法論體系日趨成型。

失控的隱私與沉睡的金礦在隱私計算大行其道之前,國內大數據領域的局面是:海量數據洪水滔天,應用落地泥沙俱下。一方面,用戶數據隱私泄露問題頻繁發生。網紅奶茶店無死角攝像頭收集顧客人臉信息,線上交易平臺幾元錢就能買上千張人臉照片,如果身份信息也失守,用戶很有可能成為詐騙、洗錢、涉黑等違法犯罪的犧牲品。另一方面,有效、合規的數據資源非常稀缺,合法的數據交易與深度的數據挖掘愈發困難。數據已被定性為土地、勞動力、資本、技術之外的第五大生產要素,也成為企業和平臺最重要的核心資產。如果不能對數據進行充分的保護和合規的使用,就等于讓一座價值連城的金礦徹底沉睡。先從法律上劃定底線,也許是打破混沌格局的首要之策。

我國不久前審議的《個人信息保護法草案》規定:侵害個人信息權益的違法行為,情節嚴重的沒收違法所得,并處5000萬元以下或上一年度營業額5%以下罰款——5%的額度甚至超過了有“最嚴數據保護”之稱的歐盟GDPR。真正的長效解決方案,還得寄希望于隱私計算的持續推廣。根據國際知名調研機構Gartner的分析和預測:隱私計算將成為2021年企業重點關注的9項技術之一;到2025年,將有50%的企業使用隱私計算挖掘數據價值。

破解的路徑與有益的探索在隱私計算的江湖上,主要有三大技術流派:一是以多方安全計算(MPC)為代表,采用密碼學方案,以秘密分享(Secret Sharing)、不經意傳輸、混淆電路等專業技術實現通用性和性能提升。二是以可信執行環境(TEE)為主,構建硬件安全區域,數據僅在該區域內進行計算,在非嚴苛場景下可發揮重要價值。三是分布式機器學習技術和系統——聯邦學習,其通過同態加密、差分隱私等方式提高數據協作過程中的安全性。三大流派交織演進,相互融合,再加上防篡改、可追溯的區塊鏈技術加持,通用型隱私計算超級平臺的誕生似乎并不遙遠。

時代的吹哨人與開礦的先行者在隱私計算平臺的競爭中,“騰訊大數據-天工”無疑是其中的佼佼者。自2009年迄今,騰訊大數據平臺歷經四代更迭:第一代大數據平臺依托Hadoop生態,圍繞離線計算模式化構建出能夠穩定支撐小時/天級別的計算任務數據處理平臺;2012年前后,第二代大數據平臺通過引入Spark、Storm等實時計算處理框架,讓處理性能邁入毫秒級別;2015年,第三代大數據平臺朝著機器學習方向發展,其自研機器學習框架Angel成為國內第一個從Linux基金會畢業的AI項目;從2020年開始著手規劃的第四代數智融合計算平臺“騰訊大數據-天工”,以“數據協同、技術互通、平臺大腦”技術理念為基礎,未來將在確保數據安全的前提下,推動萬億級數據分析逐步實現“自動駕駛”。

騰訊數據平臺部總經理蔣杰在2012年剛加盟騰訊時,曾對其負責的業務領域做了一番“摸底考察”。作為一位已跟數據打了十年交道、對技術趨勢高度敏感的專家,他當時的結論是:“騰訊大數據團隊可能落后領先水準三年左右”。如今站在聚光燈下,蔣杰顯然有更多的底氣。2020年,騰訊大數據團隊憑借3072bit業界最高強度加密和TEE硬件雙保險技術,獲得了iDash 世界隱私計算大賽冠軍。這顆皇冠上的明珠,凝結著幾代工程師的心血。

“騰訊大數據-天工”在隱私計算領域并非單點突破,而是整體推進。借助自研技術,從機器學習到大數據分析,第四代數智融合平臺可以為各個應用場景提供全面保護,去中心化的架構則能避免隱私泄露風險。作為第四代數智融合計算平臺的重要組成部分,騰訊Angel PowerFL安全聯合計算平臺也頗受矚目。Angel PowerFL擁有全棧的聯邦機器學習和深度學習功能,可以提供多種隱私保護機制,在不同的應用場景里為用戶提供差異化的安全保護級別。

在跨機構的隱私計算場景里,跨公網通信是隱私計算系統的瓶頸。為了解決這一問題,Angel PowerFL平臺采用消息隊列(MQ)作為通信通道,借助MQ模塊的擁塞控制和消息持久化功能,可以進一步增強系統穩定性。在MQ的基礎上,騰訊還采用了高效的消息壓縮算法來減少通信開銷,提高多方交互效率。作為騰訊云數據安全網絡(DSN)底層引擎,Angel PowerFL堪稱金融級安全強度的隱私計算平臺,在智慧醫療、金融風控、數字政務、推薦廣告等領域已贏得眾多客戶的認可——在騰訊大數據高峰論壇上,來自民生銀行、中國電信、中國電力科學研究院等跨行業的生態伙伴齊聚一堂,即是明證。

終極目標與未竟挑戰在《騰訊隱私計算白皮書》的封面上,標題中的“數據向善”尤為搶眼。這是騰訊“科技向善”理念的延伸,也是隱私計算發展的終極目標。遠大前程并非一蹴而就。數據合規是隱私計算一直致力于解決的行業痛點,從實際運作來看,還有不小的提升空間。例如,作為底層邏輯的用戶授權同意機制,隱私計算的參與方不應以對外公開的是數據模型而非原始數據為由,規避協作環節的用戶授權,在本地服務器中建模的行為,也需要進一步規范。化解數據安全的衍生風險亦無止境。以聯邦學習為例:盡管其無需參與者直接共享原始數據,但模型更新仍然有可能泄露參與者訓練數據的相關信息,攻擊者可以采用推理判斷具體的數據點或數據屬性是否被用于訓練,或采用逆向學習的方法還原原始數據。這就要求企業在模型、輸入、訓練數據、輸出等維度建立更全面的隱私計算屏障。此外,隱私計算參與各方權利義務的邊界尚待進一步明確。

通常而言,隱私計算涉及的主體包括個人信息主體、數據持有方、計算方和結果方。目前各方之間的法律關系還有模糊地帶,數據挖掘的商業行為務求謹慎,防止出現超常規的高風險作業。凡心兩扇門,善惡一念間。技術本身是中性的,去中心化的平臺對各方都是敞開的,隱私計算向善路徑的鋪就,離不開劣幣懲戒機制的運行和良性生態的構建。陽光普照,雨露滋潤,“天工”才能“開物”。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號