看IBM的AI辯論家項目(Project Debater)有多可怕
IBM的辯論家項目(Project Debater)打造了一個對話類AI,旨在和一個人類辯手進行正式辯論。盡管Project Debater在最后一場辯論中落敗于人類辯手,但是在這次失敗之前,它一直霸占著最佳辯手的位置。它的亮點很多,而且確鑿無疑地進入了自然語言處理(NLP)系統的“恐怖谷”,它的表現非常接近人類,它的失誤水準令人尷尬。
IBM這個項目的亮點在于,它是在一系列舊硬件上訓練并交付“辯論家”的,并沒有使用GPU等硬件加速器。鑒于現在市場上已經存在很多可用的深度學習硬件加速器,所以“辯論家”的會話AI功能肯定會在未來的幾年內具有很大的提升空間。當然,這也可能會加劇社會不滿,因為人們越來越搞不清楚他們是在和人類交談還是和人工智能對話。
“辯論家”項目的初始提案脫胎于2011年出現的單個PPT幻燈片。由于提交內容有限,而且挑戰項目的難度比較大,IBM管理層經過了大約一年的仔細考慮時間才最終批準了該項目。2012年,IBM研究院建立了一個項目團隊,正式啟動“辯論家”項目開發。實際上,該項目的實質性工作時在2014年展開的。
怎么訓練一組深度學習模型,使它可以進行辯論呢?要知道,展開一場辯論要比進行一次簡單的采訪復雜多了。IBM研究院將這項訓練任務劃分成了三個子任務:聽力理解、建模人類的爭論、由數據驅動的演講稿生成和表達。
聽力理解
IBM將聽力理解定義為“從一長串連續的口語中提取隱藏在其中的關鍵概念和聲明的能力”。IBM教“辯論家”針對隨機選擇的主題進行辯論,但是它的前提是,所選主題必須涵蓋在在系統里面多達4億篇文章(100億句話)中得到過充分報道的話題中,其中大部分文章來自于知名報紙和雜志。
“辯論家”實現高水平聽力理解能力的一個關鍵要素是它的聲明檢測引擎。該聲明檢測引擎能夠在一個句子中找到個別聲明的確切邊界(如果給定的句子里確實給出過聲明的話。IBM的聲明檢測引擎中有三個級聯的深度學習模型:
1、查找帶有聲明的句子;
2、在該句子中找到聲明的邊界;
3、確定存在聲明和已經找到合適的聲明邊界的可信度。
建模人類的爭論
IBM創建了所謂的“獨特知識圖表”,以幫助“辯論家”模擬人類爭論和面臨困境的世界。一旦給“辯論家”提供了一個辯論主題,它就會在其知識圖表中展開搜索,尋找最為相關的原則論據來支持或者反對這項主題。知識圖表模型使得“辯論家”可以建模出許多不同辯論之間的共性。
數據驅動的演講稿生成和表達
“辯論家”從知識圖表中找出相關論據后,將所選擇的這些論點組合成一個帶有說服性的完整敘述,這些論述的長短符合為其分配的發言時間。然后,它會寫出一個演講稿,并在適當的時候清晰地、針對性地(也可以加入一些幽默成分)表達出來。
IBM強調,自然語言處理中的演講稿生成和表達是“辯論家”的顯著特征。不過,我們相信,理解人類的言語才將是將AI限制在不可思議的“恐怖谷”中或者超越它的關鍵技術。
請注意,OpenAI的文本預測模型在某一個方面和IBM的“辯論家”執行了相似的角色,它們都寫了文稿,不過它們也有一定的區別。OpenAI的所有新聞報道都是以完成為目的,“辯論家”則是支持或反駁某個觀點,此外,OpenAI沒有正式辯論賽的時間限制。
復雜的模型集合
IBM研究院表示,“辯論家”由數十種深度學習和機器學習模型組成,具體數量取決于對模型的分類和計算方式。他們表示,在辯論期間使用的模型總數遠遠低于100個。
“辯論家”的開發遇到了機器學習領域的經典挑戰。由于需要把那么多基礎底層的AI模型編排組合在一起,集合的復雜性增加了。每個AI模型都要經過經過自己的訓練過程,許多模型使用的配置和設置方法都各自不同。一些模型使用監督式學習技術,其它模型使用無監督學習技術。IBM研究院沒有談到訓練所有這些模型累計花費了多少時間。
“辯論家”項目的大部分研究和開發工作都是在IBM研究院位于以色列海法的實驗室中完成的。IBM表示,為了訓練“辯論家”,IBM通過其平臺負載共享設施(LSF)軟件協調調用了10臺聯想系統x3650 M5服務器。在研究的過程中,IBM研究院還在海法使用了一個GPFS集群進行數據存儲。該本地存儲運行在一個雙節點的IBM頻譜可視化(SVC)集群上,使用了IBM的SAN64B-6存儲網絡。
IBM還沒有公開討論他們在訓練“辯論家”模型時使用的機器學習和深度學習框架。IBM曾經表示,一旦可以把這項技術商業化到可以供客戶使用的程度,他們將發布更多的軟件和硬件細節信息。
需要注意的是,訓練“辯論家”的復雜模型集合的工作時是在四分之一個未加速的x86服務器機架上進行的,該服務器機架包含了大約200個處理器內核。這也表明,人工智能研究通常并不需要使用最新最好的硬件,技術上的創新和研發時間可以抵消大部分巨額預算。
“辯論家”的復雜性-對辯論的重新審視
“辯論家”的反駁論據是由獨立的深度學習模型創建出來的,而不是在辯論中創建出這種開放性的論點。在這個完整的反駁論據集合中會用到幾種模型。反駁論證系統通常是一個比創建開放性論據使用的模型集合更長的級聯模型。
“辯論家”會為辯論雙方都實施聲明檢測。這使得系統能夠自動構建出兩組論據,并確定辯論對手可能會使用那些論據聲明。然后,系統會在辯論期間交叉性地檢查對手可能使用的聲明和實際使用的聲明。下面是該流程的一部分說明:
確定每個聲明是否反對或者支持“辯論家”當前的觀點;
確定對手是否在最近的反駁中使用了任何自動檢測到的聲明;
尋找論據來反駁對手已經表達過的聲明主張;
找到支持自己當前論點的證據;
將這些證據進一步整合成表達正確且有說服力的陳述中;
確定是否已經在辯論的早期階段聲明了某個論據。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













