打擊偏見,外部審計正成高風險AI決策的必需品
今天的人工智能系統在貸款、醫療診斷和假釋等方面的決策中扮演了重要角色。而由于它們也是不透明的系統,所以使得它們容易受到偏見影響。在缺乏透明度的情況下,我們永遠不會知道為什么一名41歲的白人男性和一名18歲的黑人女性犯下類似的罪行,會被AI軟件分別評估為“低風險”與“高風險”。
出于商業和技術原因,目前無法對大多數人工智能決策進行自動生成的高保真解釋。這就是為什么我們應該推動負責高風險決策的AI系統的外部審計。大規模的自動審計可以系統地探測AI系統,并發現偏見或其他不良行為模式。
最臭名昭著的黑匣子AI偏見例子是美國司法系統中使用的軟件,該軟件用于推薦量刑和罰款數額等。ProPublica對用于假釋決策的、最廣泛使用的再犯算法之一的分析揭示了潛在的重大偏見和不準確性。在探測更多信息時,創建者拒絕分享其專有算法的細節。這種保密使被告難以在法庭上質疑這些決定。
其實媒體也報道了在其他許多情況下存在的人工智能偏見,比如一個令人畏懼的機器人,告訴亞洲人在護照取證時“睜開眼睛”;比如面部識別系統在識別黑皮膚和女性面孔方面不太準確;比如人工智能招聘工具歧視女性等。
作為回應,監管機構試圖通過所謂的“可解釋人工智能”來強制實現透明度。例如,在美國,拒絕個人貸款申請的貸方必須為不利決定提供“具體原因”。在歐盟,GDPR要求所有高風險自動決策的“解釋權”。
不幸的是,可解釋AI的挑戰是艱巨的。首先,解釋可以揭露專有數據和商業秘密。解釋在大數據集上訓練的復雜非線性神經網絡模型的行為也非常困難。我們如何解釋從數千個輸入的加權非線性組合得出的結論,每個輸入都為整體判斷提供了微觀的百分點?因此,我們通常會在自動解釋AI決策時在保真度和準確度之間進行權衡。
例如,Netflix試圖根據你之前觀看過的一個節目來解釋其推薦算法。實際上,它的建議基于眾多因素和復雜算法。盡管Netflix建議背后的簡化說明是無害的,但在高風險情況下,這種過度簡化可能是危險的。
即使是簡單的預測模型也可能表現出違反直覺的行為。AI模型容易受到稱為辛普森悖論的普遍現象的影響,其中行為由潛在的未觀察變量所驅動。在最近的一個案例中,研究人員發現,哮喘病史會降低患者肺炎死亡的風險。對于醫療保健從業者和哮喘患者來說,這種天真的解釋會產生誤導。實際上,這一發現歸因于那些有哮喘病史的人更有可能立即得到護理。
這不是一個孤立的事件,這些錯誤的結論不能用更多的數據輕易解決。盡管我們付出了最大的努力,但人工智能的解釋仍然很難理解。
為了提高透明度,我們倡導可審計的人工智能,這是一種可以通過假設案例進行外部查詢的人工智能系統。這些假設情況可以是合成的也可以是真實的——允許對模型進行自動、即時、細粒度的詢問。這是監控AI系統偏見或脆弱跡象的簡單方法:如果我們改變被告的性別會怎樣?如果貸款申請人居住在歷史上的少數民族社區,會發生什么?
與可解釋的AI相比,可審計的AI有幾個優點。讓中立的第三方調查這些問題比使用算法創建者控制的解釋更好地檢查偏見。其次,這意味著軟件的生產者不必暴露其專有系統和數據集的商業秘密。因此,人工智能審計可能會面臨較小的阻力。
審計是對解釋的補充。事實上,審計可以幫助調查和驗證(或無效)AI解釋。比如Netflix推薦《陰陽魔界》,因為我看過《怪奇物語》。它還會推薦其他科幻小說恐怖節目嗎?它是否向所有觀看過《怪奇物語》的人推薦《陰陽魔界》?
可審計人工智能的早期用例已經產生了積極的影響。ACLU最近透露,亞馬遜可審計面部識別算法的準確度幾乎是錯誤識別的兩倍。越來越多的證據表明,公共審計可以提高代表性不足群體的模型準確性。
在未來,我們可以設想一個強大的審計生態系統,提供對AI的見解。我們甚至可以想象“AI監護人”,一個基于審計建立AI系統的外部模型。監管機構可以堅持要求用于高風險決策的AI系統提供審計接口,而不是要求AI系統提供低保真度的解釋。
可審計的AI不是靈丹妙藥。如果AI系統正在進行癌癥診斷,患者仍然需要準確且易于理解的解釋,而不僅僅是審計。這些解釋是正在進行的研究主題,并且有望在不久的將來為商業用途做好準備。但與此同時,可審計的人工智能可以提高透明度,并打擊偏見。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













