數據孤島下的 AI 向善與聯邦遷移學習
有了這樣一種聯盟,那可以應用到什么領域呢?將聯邦學習應該到推薦系統是目前做的比較多的。我們每個人的手機上都有很多短視頻推薦系統以及新聞推薦系統,個性化的推薦使得千人千面,我們每天或多或少都會使用,而我們每個人的點擊數據都是記錄在手機上的,這個數據是非常隱私的。傳統的做法是把數據移到云端,在云端進行模型化,再把模型遷移到本地來。
而有了聯邦學習,可以讓數據不出本地,同時可以讓模型個性化。本地的推薦系統可以作為一個單獨的任務,而任務相當于對本地的一種任務分解。這種分解分為兩部分知識,一種是大家共有的知識,另一種是自己特有的本地的特征向量。如果把大家共有的向量一起做一個模型,這模型就非常的強大,同時可以既更新模型,又能夠起到在本地進行個性化服務的效果,數據也不出本地。這種聯邦的推薦架構就把數據給隔開了。

在金融領域,銀行著重于風險控制,但是缺乏系統性的風險控制技術,這取決于大數據的存在。大家比較誰的風險控制更好,比誰的數據樣本多,誰的數據種類多。而利用聯邦學習,可以把銀行、金融持牌公司、第三方公司的數據聚合在一起,獲得更多特征,取得更好的模型效果。

特別要講的是醫學,雖然醫學是機器學習很好的應用領域,但是我們發現醫學里的數據非常珍貴,非常少的,其中一個原因是用戶數據都是具有高度用戶隱私的,因此醫院和研究機構不愿意共享這些數據,所以每一個地方數據很少以至于不足以建模。那如果在醫院之間進行橫向聯邦縱向聯邦,無形中把數據總量和特征也增大了。
最近和騰訊實驗室合作,在不同地區的本地醫院用聯邦學習把腦卒中發病的病人特征做一個預測模型,根據病人的表現預測他得該病的概率有多高,最終準確率提高了 80% 以上,尤其在數據很少的小型醫院,準確率甚至能提升 20% 以上。

我們還建立了國際產業聯盟,有很多不同行業的公司和機構參與,我們希望能進行人才培養,并且對政府進行政策的建議,以及評估咨詢等。最后,再總結一下,聯邦學習是眾多人工智能和社會相結合的一個,也不是唯一的一個,我希望以后的人工智能不僅僅關心算法,而且要關心 AI 向善的問題,也就是 AI 要用在人類社會,那么用戶的隱私和數據的安全也要被考慮進來。不僅要建立算法,還得建立算法的合作機制和生態。
學術頭條原創文章。
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?



分享













