對(duì)話翼方健數(shù)羅震:天下無(wú)難用的數(shù)據(jù),如何讓“機(jī)器人醫(yī)生”更智能?
算力說(shuō)
醫(yī)療領(lǐng)域被認(rèn)為是對(duì)于隱私數(shù)據(jù)要求最高的場(chǎng)景,而在這個(gè)方向的數(shù)據(jù)若是共享,其效應(yīng)將會(huì)巨大。醫(yī)療平臺(tái)集聚個(gè)人最私密的數(shù)據(jù),共享是否意味著即失守?開(kāi)放應(yīng)用生態(tài)更成無(wú)本之木?改弦更張,嘗試用新一代智能數(shù)據(jù)技術(shù)替代傳統(tǒng)的共享方式以釋放數(shù)據(jù)價(jià)值,逐步成為發(fā)展共識(shí)。那么,新技術(shù)有哪些落地方式,又如何提升診療準(zhǔn)確度?
8月25日,翼方健數(shù) CEO 羅震 在SIGKDD·SDBD2020 第二屆智能數(shù)據(jù)和區(qū)塊鏈應(yīng)用國(guó)際研討會(huì)上帶來(lái)《隱私安全計(jì)算下的數(shù)據(jù)和算法的互聯(lián)互通》的專題分享,談?wù)勗鯓訛獒t(yī)療信息系統(tǒng)裝上智能的“最強(qiáng)大腦”。
1
你所認(rèn)知的醫(yī)療行業(yè)的數(shù)據(jù)問(wèn)題,其實(shí)在行業(yè)具有普適性
羅震介紹說(shuō),翼方健數(shù)主要在醫(yī)療行業(yè)做隱私安全計(jì)算的生根和應(yīng)用。而在行業(yè)深耕多年后,最大的體會(huì)是醫(yī)療行業(yè)中間遇到的數(shù)據(jù)安全、數(shù)據(jù)共享以及數(shù)據(jù)應(yīng)用方面問(wèn)題,并且具有普遍性,促使我們?nèi)プ龈鼮樯钊氲乃伎肌?/p>
我們身處由信息時(shí)代轉(zhuǎn)化到智能時(shí)代的變革中,兩個(gè)時(shí)代顯著的區(qū)別在于對(duì)數(shù)據(jù)的重視程度與認(rèn)知方式。
信息時(shí)代我們更關(guān)注解決具體問(wèn)題,當(dāng)我們發(fā)現(xiàn)解決過(guò)程中產(chǎn)生的數(shù)據(jù)有很大的價(jià)值與應(yīng)用空間,才逐漸開(kāi)始使用。在當(dāng)下的時(shí)代,更多的是我們擁有這樣的數(shù)據(jù),可以解決什么問(wèn)題,這是主次先后重要性的區(qū)別。我們認(rèn)為智能時(shí)代會(huì)產(chǎn)生海量的數(shù)據(jù),處理數(shù)據(jù)主角是智能模型機(jī)器,而必須有大量數(shù)據(jù)才能產(chǎn)生比較好的智能,對(duì)數(shù)據(jù)的處理方式產(chǎn)生根本性的轉(zhuǎn)變。
基于此,國(guó)家會(huì)提出數(shù)據(jù)是新的生產(chǎn)要素,并把數(shù)據(jù)和土地、資本、勞動(dòng)力等同起來(lái)。但是數(shù)據(jù)作為生產(chǎn)要素,其實(shí)與很多傳統(tǒng)的生產(chǎn)要素有許多區(qū)別。
首先數(shù)據(jù)是信息時(shí)代的遺留,由于分布在不同信息系統(tǒng)里邊,自誕生便相互隔離,是非標(biāo)準(zhǔn)化、非結(jié)構(gòu)化的,質(zhì)量有高有低。
數(shù)據(jù)作為生產(chǎn)要素有非常獨(dú)特的經(jīng)濟(jì)特征。其一是虛擬可再用的;其二是非競(jìng)爭(zhēng)性的,如果我有一份數(shù)據(jù)共享給你,你就有一份一模一樣的數(shù)據(jù);其三是產(chǎn)生數(shù)據(jù)需要高昂成本,但分享數(shù)據(jù)幾乎可以忽略成本。
數(shù)據(jù)的價(jià)值有外在性,當(dāng)我們產(chǎn)生數(shù)據(jù),很難確定數(shù)據(jù)價(jià)值幾何。此外還有數(shù)據(jù)的非經(jīng)濟(jì)特征,在每個(gè)行業(yè)里邊都有隱私保護(hù),合規(guī)數(shù)據(jù)安全等行業(yè)方面的規(guī)范,在醫(yī)療行業(yè)更加如此,因?yàn)槲覀兘佑|到的數(shù)據(jù)都是個(gè)人最隱私最保密的數(shù)據(jù)。
正是因?yàn)樗袛?shù)據(jù)特點(diǎn),恰恰是阻礙數(shù)據(jù)共享最核心的原因。從經(jīng)濟(jì)的角度我花了很多的價(jià)錢(qián),產(chǎn)生數(shù)據(jù),而后分享給你,數(shù)據(jù)將失去我的保護(hù),而你有一份同樣的財(cái)產(chǎn)。對(duì)你將來(lái)如何使用數(shù)據(jù),我將完全失控,無(wú)法得知你可能會(huì)產(chǎn)生新的價(jià)值。

從另一角度,一旦原始數(shù)據(jù)流失并產(chǎn)生傷害,這些傷害也很難被安頓。所以我們認(rèn)為數(shù)據(jù)在本質(zhì)上不能被共享。共享的方式不是將原始數(shù)據(jù)拷貝給他人,而是應(yīng)是試圖去共享數(shù)據(jù)的價(jià)值。
2
Alice與Bob誰(shuí)更多金?不僅僅是“百萬(wàn)富翁”
數(shù)據(jù)的時(shí)代特性引出我們所講的隱私安全技術(shù),或者說(shuō)隱私計(jì)算基本的理念。

舉例而言,有一家醫(yī)學(xué)統(tǒng)計(jì)公司,想做篩查效果及評(píng)估。如做完癌癥篩查后,想了解做過(guò)篩查的人后續(xù)是否有問(wèn)題。涉及到醫(yī)學(xué)統(tǒng)計(jì)中經(jīng)常會(huì)提及的兩個(gè)詞,一個(gè)叫靈敏度,一個(gè)叫特異性。
一般比較直觀的做法是在數(shù)據(jù)平臺(tái)找到所有做過(guò)篩查的人群,觀察后續(xù)發(fā)生的事情。通過(guò)原始數(shù)據(jù)和分析,最后得到評(píng)估結(jié)果。最大的問(wèn)題在于如果醫(yī)療行業(yè)原始數(shù)據(jù)一旦離開(kāi)數(shù)據(jù)平臺(tái)保護(hù),將來(lái)會(huì)產(chǎn)生問(wèn)題。而統(tǒng)計(jì)公司只想知道篩查手段的結(jié)果,即靈敏度與特異性。所以可以將計(jì)算放在安全的環(huán)境,計(jì)算完畢之后,只需拿走統(tǒng)計(jì)結(jié)果。不用看到原始數(shù)據(jù),不用將數(shù)據(jù)導(dǎo)出,通過(guò)這種計(jì)算的方式,實(shí)現(xiàn)不分享原始數(shù)據(jù),而是分享數(shù)據(jù)的價(jià)值。
實(shí)際上,隱私安全計(jì)算面臨較大的挑戰(zhàn)。首先隱私安全計(jì)算,囊括的范圍很廣泛。三個(gè)主流的安全計(jì)算方式。一個(gè)方式稱為多方安全計(jì)算或者同態(tài)加密,實(shí)際方法完全不同,但是信任假設(shè)是相同的。
假如沒(méi)有任何可以信任的第三方,如何做計(jì)算?第二個(gè)方式使用比較多的方式是聯(lián)邦學(xué)習(xí)。聯(lián)邦學(xué)習(xí)是解決模型訓(xùn)練、模型推斷的問(wèn)題,在機(jī)器學(xué)習(xí)方面來(lái)解決沒(méi)有信任的前提下,如何做聯(lián)合計(jì)算。
那么聯(lián)邦學(xué)習(xí)唯一的缺陷是指計(jì)算的方式僅僅是在機(jī)器學(xué)習(xí)的方式。如果我們有可以信任第三方,比如Alice、Bob信任第三人Charlie,他們?nèi)绻麑⒆约河卸嗌馘X(qián)告訴Charlie,Charlie就會(huì)立刻的告訴Alice、Bob你們倆誰(shuí)錢(qián)更多,就可以通過(guò)安全多方計(jì)算的方式計(jì)算過(guò)程。
安全多方計(jì)算主要防備的是應(yīng)用本身對(duì)平臺(tái)產(chǎn)生的威脅。如果說(shuō)安全沙箱做得好,對(duì)系統(tǒng)本身產(chǎn)生的風(fēng)險(xiǎn)小,就可以非常安全將它算出來(lái)。
另一方面,第三方中間有特殊的硬件叫 稱之為T(mén)EE,Trusted Execution Environment,可信任執(zhí)行環(huán)境。我們將安全沙箱計(jì)算放到TEE中算。此時(shí)可以解除對(duì)查理的信任,因?yàn)橛布梢员WC哪怕Charlie是惡意的人,也沒(méi)有辦法看到算了Alice和Bob到底有多少錢(qián)。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 7 熱點(diǎn)丨AI“瑜亮之爭(zhēng)”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤(pán):9秒刪庫(kù)跑路,全員被封號(hào),還繼續(xù)扣錢(qián)!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





