庆余年第46集在线观看免费全集,麻豆蜜桃av蜜臀av色欲av,您只需打开雪飘影视网,国产精品一区二区性色av

探索隱私計算的江湖：數據金礦的守護者與吹哨人

2021-04-21 08:55

煤老板和IT精英相遇，兩個人想比比誰更富有，但都不愿告訴對方自己真正擁有多少財富，也不想讓第三方掌握原始信息。何解？

以上是圖靈獎得主姚期智院士提出的“百萬富翁假設”的通俗版演繹，里面涉及大數據發展進程中的一個核心難題：如何厘清數據的所有權和使用權。在我們日常的應用場景中，數據的所有權和使用權經常是混合在一起的，難免會遭遇顧此失彼的窘境。想象一種神奇的分離術：煤老板和IT精英擁有自身財富數據的所有權，平臺只能獲得加密數據的使用權，而經過“黑盒”的轉化，即可得出“誰更富有”的結論。這就是隱私計算的雛形，專業表述為“解決互不信任的參與方之間，在保護隱私信息以及沒有可信第三方前提下的協同計算問題”。在數據大爆發的浪潮下，隱私計算的發展一日千里。4月18日在北京舉辦的騰訊大數據高峰論壇上，第四代數智融合計算平臺“騰訊大數據－天工”橫空出世，《騰訊隱私計算白皮書》也新鮮出爐（可以在微信公眾號后臺輸入“隱私計算”下載這份白皮書）。行業龍頭的重磅出擊，標志著隱私計算在國內大數據領域已漸入佳境，實踐模式和方法論體系日趨成型。

失控的隱私與沉睡的金礦在隱私計算大行其道之前，國內大數據領域的局面是：海量數據洪水滔天，應用落地泥沙俱下。一方面，用戶數據隱私泄露問題頻繁發生。網紅奶茶店無死角攝像頭收集顧客人臉信息，線上交易平臺幾元錢就能買上千張人臉照片，如果身份信息也失守，用戶很有可能成為詐騙、洗錢、涉黑等違法犯罪的犧牲品。另一方面，有效、合規的數據資源非常稀缺，合法的數據交易與深度的數據挖掘愈發困難。數據已被定性為土地、勞動力、資本、技術之外的第五大生產要素，也成為企業和平臺最重要的核心資產。如果不能對數據進行充分的保護和合規的使用，就等于讓一座價值連城的金礦徹底沉睡。先從法律上劃定底線，也許是打破混沌格局的首要之策。

我國不久前審議的《個人信息保護法草案》規定：侵害個人信息權益的違法行為，情節嚴重的沒收違法所得，并處5000萬元以下或上一年度營業額5％以下罰款——5％的額度甚至超過了有“最嚴數據保護”之稱的歐盟GDPR。真正的長效解決方案，還得寄希望于隱私計算的持續推廣。根據國際知名調研機構Gartner的分析和預測：隱私計算將成為2021年企業重點關注的9項技術之一；到2025年，將有50％的企業使用隱私計算挖掘數據價值。

破解的路徑與有益的探索在隱私計算的江湖上，主要有三大技術流派：一是以多方安全計算（MPC）為代表，采用密碼學方案，以秘密分享（Secret Sharing）、不經意傳輸、混淆電路等專業技術實現通用性和性能提升。二是以可信執行環境（TEE）為主，構建硬件安全區域，數據僅在該區域內進行計算，在非嚴苛場景下可發揮重要價值。三是分布式機器學習技術和系統——聯邦學習，其通過同態加密、差分隱私等方式提高數據協作過程中的安全性。三大流派交織演進，相互融合，再加上防篡改、可追溯的區塊鏈技術加持，通用型隱私計算超級平臺的誕生似乎并不遙遠。

時代的吹哨人與開礦的先行者在隱私計算平臺的競爭中，“騰訊大數據－天工”無疑是其中的佼佼者。自2009年迄今，騰訊大數據平臺歷經四代更迭：第一代大數據平臺依托Hadoop生態，圍繞離線計算模式化構建出能夠穩定支撐小時／天級別的計算任務數據處理平臺；2012年前后，第二代大數據平臺通過引入Spark、Storm等實時計算處理框架，讓處理性能邁入毫秒級別；2015年，第三代大數據平臺朝著機器學習方向發展，其自研機器學習框架Angel成為國內第一個從Linux基金會畢業的AI項目；從2020年開始著手規劃的第四代數智融合計算平臺“騰訊大數據－天工”，以“數據協同、技術互通、平臺大腦”技術理念為基礎，未來將在確保數據安全的前提下，推動萬億級數據分析逐步實現“自動駕駛”。

騰訊數據平臺部總經理蔣杰在2012年剛加盟騰訊時，曾對其負責的業務領域做了一番“摸底考察”。作為一位已跟數據打了十年交道、對技術趨勢高度敏感的專家，他當時的結論是：“騰訊大數據團隊可能落后領先水準三年左右”。如今站在聚光燈下，蔣杰顯然有更多的底氣。2020年，騰訊大數據團隊憑借3072bit業界最高強度加密和TEE硬件雙保險技術，獲得了iDash 世界隱私計算大賽冠軍。這顆皇冠上的明珠，凝結著幾代工程師的心血。

“騰訊大數據－天工”在隱私計算領域并非單點突破，而是整體推進。借助自研技術，從機器學習到大數據分析，第四代數智融合平臺可以為各個應用場景提供全面保護，去中心化的架構則能避免隱私泄露風險。作為第四代數智融合計算平臺的重要組成部分，騰訊Angel PowerFL安全聯合計算平臺也頗受矚目。Angel PowerFL擁有全棧的聯邦機器學習和深度學習功能，可以提供多種隱私保護機制，在不同的應用場景里為用戶提供差異化的安全保護級別。

在跨機構的隱私計算場景里，跨公網通信是隱私計算系統的瓶頸。為了解決這一問題，Angel PowerFL平臺采用消息隊列（MQ）作為通信通道，借助MQ模塊的擁塞控制和消息持久化功能，可以進一步增強系統穩定性。在MQ的基礎上，騰訊還采用了高效的消息壓縮算法來減少通信開銷，提高多方交互效率。作為騰訊云數據安全網絡（DSN）底層引擎，Angel PowerFL堪稱金融級安全強度的隱私計算平臺，在智慧醫療、金融風控、數字政務、推薦廣告等領域已贏得眾多客戶的認可——在騰訊大數據高峰論壇上，來自民生銀行、中國電信、中國電力科學研究院等跨行業的生態伙伴齊聚一堂，即是明證。

終極目標與未竟挑戰在《騰訊隱私計算白皮書》的封面上，標題中的“數據向善”尤為搶眼。這是騰訊“科技向善”理念的延伸，也是隱私計算發展的終極目標。遠大前程并非一蹴而就。數據合規是隱私計算一直致力于解決的行業痛點，從實際運作來看，還有不小的提升空間。例如，作為底層邏輯的用戶授權同意機制，隱私計算的參與方不應以對外公開的是數據模型而非原始數據為由，規避協作環節的用戶授權，在本地服務器中建模的行為，也需要進一步規范。化解數據安全的衍生風險亦無止境。以聯邦學習為例：盡管其無需參與者直接共享原始數據，但模型更新仍然有可能泄露參與者訓練數據的相關信息，攻擊者可以采用推理判斷具體的數據點或數據屬性是否被用于訓練，或采用逆向學習的方法還原原始數據。這就要求企業在模型、輸入、訓練數據、輸出等維度建立更全面的隱私計算屏障。此外，隱私計算參與各方權利義務的邊界尚待進一步明確。

通常而言，隱私計算涉及的主體包括個人信息主體、數據持有方、計算方和結果方。目前各方之間的法律關系還有模糊地帶，數據挖掘的商業行為務求謹慎，防止出現超常規的高風險作業。凡心兩扇門，善惡一念間。技術本身是中性的，去中心化的平臺對各方都是敞開的，隱私計算向善路徑的鋪就，離不開劣幣懲戒機制的運行和良性生態的構建。陽光普照，雨露滋潤，“天工”才能“開物”。