機器學習如何解決看病難?
先來看兩個場景:
場景 1:
一名 49 歲的病人注意到肩膀上起了皮疹,因為不覺得疼痛,所以也沒有尋求治療。幾個月之后,他的妻子讓他去看醫生,醫生診斷出他患了脂溢性角化癥。后來,當該患者在做腸鏡篩查時,護士注意到他的肩膀上有黑色斑點,于是建議他去檢查一下。又過了一個月,這位患者去看皮膚科醫生,醫生從病變的地方取了一些活檢樣本。結果顯示這是一種非癌性色素沉淀病變。醫生還是很擔心,建議二次檢測活檢樣本,最終診斷出了侵襲性黑色素瘤。之后,腫瘤科醫生用全身化療的方法治療這位患者。一位醫生朋友問病人為什么不接受免疫治療。
場景 2:
一名 49 歲的病人用手機 app 拍了一張肩膀上皮疹的照片,app 建議他立即預約皮膚科醫生。他的保險公司自動批準直接轉診,app 幫他在兩天內預約了附近一名經驗豐富的皮膚科醫生,該預約和患者的個人行程自動交叉核對過了。皮膚科醫生對病變處進行了活檢,病理學家在計算機輔助下診斷出 Ⅰ 期黑色素瘤,然后皮膚科醫生進行了摘除手術。
對比場景 1 和場景 2,我們可以發現,在同樣的一個病例中,場景 2 的醫療流程實現了以下優化:1)患者可以直接用手機拍攝病變照片,由 app 進行初級診斷,系統可以根據 app 提供的建議合理分配醫療資源;2)皮膚科醫生和病理學家實現了有效的協作,相當于讓一位普通病人也得到了專家會診,提高了診斷和治療方法的準確性。這就是 Jeff Dean 等人為我們描繪的機器學習在醫療領域的應用藍圖。
如果重癥監護人員或社區醫療人員每做出一個醫療決定,立刻就會有相關領域的專家組成的團隊對這條決定進行審查,判斷這條決定是否正確并對其進行指導,那會是什么樣呢?最新診斷出沒有并發癥的高血壓患者將會接受現有最有效也最對癥的治療,而不是診斷者最熟悉的治療方法。這樣可以很大程度上消除用藥過量和處方錯誤的問題。患有神秘且罕見疾病的患者可以直接由相關領域的知名專家會診。
這樣的系統似乎離我們很遠。因為沒有足夠的專家可以配合這樣的系統。就算有,對專家們來說,不僅要花很長時間了解患者的病史,而且與隱私相關的問題可能也會成為阻礙。但這就是用于醫療領域的機器學習的前景——幾乎所有臨床醫生所做的診斷決定以及數十億患者的診斷結果組成的智慧結晶應該為每一位患者的醫療護理提供指導。也就是說,應該根據患者所有已知的實時信息和集體經驗得出個性化的診斷、管理決策以及治療方案。
這種框架強調機器學習不僅是像新藥或者新的醫療器械這樣全新的工具,而是一種基礎技術,這種技術可以高效處理超出人類大腦負荷的數據。這種巨大的信息存儲涉及到龐大的臨床數據庫,甚至單個患者的數據。
50 年前的一篇專題文章指出,計算將「強化,在有些情況下可以很大程度上取代醫生的智慧」。但到 2019 年初,由機器學習驅動的醫療保健幾乎還沒有取得什么進展。我們在此不再贅述之前報道過的無數通過測試的概念驗證模型(回顧性數據),而是要說一些醫療健康領域的核心結構變化及范式轉變,這對于實現機器學習在醫療領域的前景來說是必需的。
機器學習解釋
傳統上講,軟件工程師通過清晰的計算機代碼形式提取知識,從而指導計算機如何處理數據并做出正確的決策。例如,如果病人血壓升高,而且沒有接受抗高血壓藥物的治療,那正確編程的計算機可以提出治療建議。這類基于規則的系統具有邏輯性和可解釋性,但正如 1987 年的一篇文章中所說,醫療領域「太過廣泛也太過復雜,因此難以(如果可能的話)在規則中捕獲相關信息」。
傳統方法和機器學習之間的關鍵區別在于,在機器學習中,模型是從樣本中學習而不是按規則編程的。對于給定任務,樣本給定輸入(特征)和輸出(標簽)。例如,將病理學家讀取的數字化切片轉換為特征(切片像素)和標簽(上面的信息表明切片是否包含指示癌變的證據)。用算法從觀測值中學習,然后計算機決定如何從特征映射到標簽,從而創建泛化模型,這樣就可以在未曾見過的輸入上正確執行新任務(例如,從未被人讀取過的病理學切片)。圖 1 總結了這一過程,這就是所謂的有監督的機器學習。還有其他形式的機器學習。表 1 列出了用于臨床的案例,這些模型的輸入輸出映射基本上都是基于同行評審研究或現有機器學習的擴展。
圖 1:有監督機器學習的概念性概述
表 1:推動機器學習應用的輸入數據和輸出數據類型示例
在實際應用中,預測準確性至關重要,模型在數百萬特征和樣例中找出統計模式的能力絕對可以超過人類的表現。但這些模式不一定適應基本的生物學鑒定方式,也不一定能識別支持新療法的開發過程中可修改的危險因素。
機器學習模型和傳統的統計模型之間并非涇渭分明,最近有一篇文章總結了這兩者之間的關系。但復雜的新型機器學習模型(比如「深度學習」(一種利用人工神經網絡的機器學習算法,它可以學習到特征和標簽之間極其復雜的關系,在諸如圖像分類等任務上的表現已經超越了人類))很適合學習現代臨床病例中產生的復雜、異構數據(比如醫生寫的醫療記錄、醫學圖像、來自傳感器的連續監控數據以及基因組數據),從而做出醫學相關的預測。表 2 提供了簡單和復雜的機器學習模型分別適用于什么樣的情況。
表 2:決定要用哪種模型時要問的關鍵問題
人類學習和機器學習之間的關鍵區別在于人類可以從少量數據中得到普適且復雜的關系。例如,小孩不用看太多樣本就能區分獵豹和貓。在學習相同任務的情況下,和人相比機器需要更多的樣本,而且機器不具備常識。但從另一個角度上講,機器可以從大量數據中學習。用數千萬患者存儲在 EHR(Electronic Health Records,電子健康記錄)中的數據來訓練機器學習模型是完全可行的,這些數千億的數據點完全沒有任何重點,而人類醫生在整個職業生涯中都很難接診數萬名患者。
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?



分享













