Ilya Sutskever —— AI最偉大的“推動者”,也是其最深刻的“對峙者”
2025年11月26日,Safe Superintelligence (SSI) 創始人、前 OpenAI 首席科學家伊利亞·蘇茨克維(Ilya Sutskever) 在接受知名科技播客主持人德瓦克什·帕特爾(Dwarkesh Patel )訪談節目中,又做出了震驚業界的預判:“那個單純依賴數據和算力堆疊的‘Scaling Law(2020-2025年)時代’已經結束,我們正重新回歸到一個需要探索全新算法與數據配方的‘研究時代’。”

Ilya Sutskever(左)和Dwarkesh Patel (右)
并且,在2024年的NeurIPS 會議演講中,他就提出了類似的結論:預訓練依賴于海量數據,而互聯網數據存在上限,預訓練時代終將結束。

預訓練時代即將結束(2024年NeurIPS 會議演講PPT)
這一預判之所以極具分量,并引發業界廣泛深思和討論,是因為Ilya Sutskever 恰恰是在十幾年前就一直堅信“Scaling Law”定律,并在后來親自在GPT-3模型上成功證明給世界看的那個男人。
甚至可以說,Ilya Sutskever已經將“Scaling Law”變成了業界的一種思維范式,并被許多人奉為圭臬。然而,正是這位“Scaling Law”最有力的證明者,如今開始洞察到它的局限性并提出了新的思考。
然而,這一深刻的洞察和預判,并非Ilya Sutskever立場的動搖,實則是其思維特質的必然體現:他始終依循一套深刻的“自上而下”的信念體系來推演技術未來。
Ilya Sutskever信念體系的核心是追求對“智能本質”的正確理解,而非盲從任何具體技術。他早期對Scaling Law的堅信,源于他認為“擴大規模”是觸及智能本質的正確方向。
當Scaling Law發展到極致,他觀察到模型出現了無法用“擴大規模”來解決的根本性矛盾:卓越的基準測試表現與脆弱的真實世界泛化能力之間的巨大脫節。這背離了他對“真正智能”的理解。
此時,Ilya Sutskever“自上而下”的思維特質開始發揮作用。他不會為了維護舊有路徑而忽視根本矛盾,而是根據更高層級的信念(“何為真正的智能”)來重新評估當前路徑。這促使他轉向尋求新的、更接近智能本質的研究范式。故而,最近他又得出新結論:單純依賴擴大規模的Scaling Law路徑正在觸及天花板,而與之結合的主流強化學習方法不僅算力消耗巨大,更在實現真正的智能泛化上存在本質缺陷。
Ilya Sutskever被廣泛視為一位擁有罕見“研究者品位”的純粹科學家,兼具卓越的工程直覺與深刻的哲學思維方式。正如其導師杰弗里·辛頓(Geoffrey Hinton)所評價,他擁有“驚人的原始直覺”,且從不輕信,總是致力于將新信息融入自身堅實的世界觀框架中。
這種深刻的頂級贊譽,不禁讓人對Ilya Sutskever 產生了濃厚興趣。接下來,我們將追溯他的成長與求索之路,以期更深入地理解這位始終能夠站在AI技術浪潮之巔,凝視著更遠未來的思想者。
一、 學術深耕(2003-2013):叩開AI大門,拜師 "深度學習教父" 辛頓
Ilya Sutskever1986年12月出生于俄羅斯下諾夫哥羅德(原前蘇聯的高爾基市),5歲隨家人移民以色列,16歲遷居到加拿大,并在多倫多大學開啟求學之路。
他先后獲多倫多大學數學學士(2005 年)、計算機科學碩士(2007年)及博士學位(2013)。在多倫多大學的求學之路,為Ilya Sutskever未來在AI領域的深耕奠定了堅實基石。
而這段學術生涯中,最具轉折意義的,是他與"深度學習之父" 杰弗里辛頓的相遇。據說,早在 2003 年,還是本科低年級學生的Ilya Sutskever,因對神經網絡的癡迷,鼓起勇氣主動敲響了辛頓辦公室的大門。這份純粹的求知欲與初生牛犢的勇氣,打動了這位學術泰斗,兩人自此開啟了深度合作的師徒情誼。
學生時期的Ilya Sutskever,其最具標志性的成果莫過于點燃了深度學習革命的AlexNet。
2012年,仍在杰弗里·辛頓教授指導下攻讀博士學位的Ilya Sutskever與同門師兄弟Alex Krizhevsky(亞歷克斯·克里熱夫斯基)合作,在辛頓教授的整體指導下,共同開發了劃時代的深度卷積神經網絡——AlexNet。
Alex Krizhevsky是網絡架構的主要設計者與實現者。而Ilya Sutskever的核心貢獻在于工程實現,他編寫了高度優化的GPU代碼,并親自采購和搭建了由多塊GTX 580 GPU組成的計算系統,為訓練龐大的AlexNet提供了至關重要的算力基礎。
最終,AlexNet在2012年ImageNet圖像識別競賽中以壓倒性優勢奪冠,其成績遠超傳統方法。這一勝利被公認為深度學習革命的起點,徹底扭轉了學界對神經網絡的懷疑態度,并開啟了人工智能的新時代。
二、谷歌時期(2013-2015):重塑NLP與機器學習基礎
2012年底,在AlexNet取得突破性成功之后,杰弗里·辛頓教授與他的兩位研究生Ilya Sutskever和Alex Krizhevsky共同創立了DNNResearch公司。成立之初,這家公司既無實際產品,也沒有生產計劃,其核心資產正是這三位深度學習先驅的頂尖才智與專有技術。
為最大化公司價值,杰弗里·辛頓為其創辦的公司開展了一場小型競價交易。該活動迅速吸引了當時對AI前沿最為敏銳的四方力量:谷歌、微軟、百度,以及當時尚未被谷歌收購的明星初創公司DeepMind。
最終,谷歌在2013年3月以約4400萬美元的價格勝出,完成了對DNNResearch的收購。此舉被廣泛視為一場經典的“人才收購”。
通過此次收購,谷歌獲得了該團隊在深度學習領域的專有技術。同時,辛頓教授以顧問身份為谷歌提供指導,而Ilya Sutskever和 Alex Krizhevsky則作為全職員工加入。其中,Ilya Sutskever被任命為谷歌大腦(Google Brain)團隊的研究科學家。
在Google Brain期間,Ilya Sutskever分別主導和深度參與了兩項影響深遠的重大項目:一項革新了自然語言處理的核心框架,另一項則為整個AI社區奠定了工程基礎。
1)Seq2Seq:突破序列建模的范式革命
在Seq2Seq出現之前,神經網絡處理像翻譯這樣的任務非常棘手,因為模型要求輸入和輸出必須是固定長度。2014年,Ilya Sutskever與Oriol Vinyals(奧里奧爾·維尼亞爾斯)和Quoc Viet Le合作開發了序列對序列(Seq2Seq)學習算法。
該算法的核心創新在于其編碼器-解碼器架構:編碼器神經網絡將任意長度的輸入序列壓縮成一個固定維度的上下文向量(語義摘要);解碼器則以該向量為初始狀態,結合每一步已生成的內容,自回歸地逐詞生成目標序列,從而首次實現了端到端的變長序列轉換。
Seq2Seq擺脫了傳統方法對 “固定長度輸入/輸出” 的限制,并通過 “隱藏狀態” 傳遞輸入序列的語義信息,為后續神經模型處理復雜序列任務提供了核心框架。
2)TensorFlow:奠定深度學習的工程范式
TensorFlow是Google Brain團隊于2015年推出的開源機器學習框架。TensorFlow的推出,將強大的機器學習能力變成了易用的工具。它讓全球的研究者和工程師能更輕松地構建、訓練和部署包括Seq2Seq在內的復雜模型,極大地加速了AI技術的民主化和工業化進程。
Ilya Sutskever作為Google Brain的研究科學家,是該項目早期的深度參與者與重要貢獻者。比如,谷歌在2016年發表的關于TensorFlow的核心系統論文《TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems》中,Ilya Sutskever就是核心作者之一。
三、OpenAI 時期(2015-2024):Open AI 背后的“真正大腦”
1. 聯合創立Open AI ,并擔任首席科學家
2015年底,Ilya Sutskever做出了一個令業界矚目的決定:放棄谷歌的高薪職位,與Elon Musk(埃隆·馬斯克)、Sam Altman(薩姆·奧爾特曼)、Greg Brockman(格雷格·布羅克曼)等人共同創立了OpenAI,并擔任首席科學家。
Ilya Sutskever離開谷歌、選擇共同創立OpenAI,是一個由清晰信念驅動的決定。他旨在建立 一個“技術不被壟斷” 的平臺,根本目標是確保強大的人工智能能夠以安全、負責任的方式發展,最終造福全人類。
故而,OpenAI自創立之初便確立了 “非營利組織” 的根本性質,這正是Sutskever理念的制度化體現:將對人類整體的責任置于商業利益之上。
然而,也正是這種對AI安全與公益的不可妥協的堅持,與Sam Altman所代表的、更側重技術迭代與市場應用的發展路徑之間,產生了必然的張力,成為他與Sam Altman日后公開分歧的深層根源。
2. 主導了GPT-1/2/3以及DALLE系列模型的研發
作為OpenAI的聯合創始人兼首席科學家,Ilya Sutskever是驅動GPT系列從概念變為現實的最高技術領導者與核心架構決策者。在他的領導下,OpenAI完成了一系列標志性的模型迭代:
GPT-1(2018年):是GPT系列乃至生成式預訓練語言模型的奠基之作。它首創了 “無監督預訓練 + 有監督任務微調” 的兩階段范式:首先在海量無標注文本上通過預測下一個詞進行預訓練,掌握通用語言規律;然后針對不同的下游任務(如文本分類、問答等)使用少量標注數據進行微調。這一范式使單一模型在多項自然語言理解任務上取得了突破性進展,為后續發展奠定了核心方法論基礎。
GPT-2(2019年):作為GPT-1的突破性迭代,其參數規模提升至15億(1.5B),并使用了更大的WebText數據集進行訓練。它首次通過大規模實驗證明:僅通過“預測下一個詞”訓練的語言模型,無需微調就能在零樣本下執行翻譯、問答等多種任務,從而確立了“語言模型即通用任務求解器”的新范式,為后續的規模擴展研究奠定了基礎。
GPT-3(2020年):是大語言模型發展史上的一個里程碑。它在規模和性能上實現了質的飛躍:擁有1750億個參數,使用高達45TB的數據進行訓練。GPT-3的成功確立了Scaling Law的核心路徑,直接催生了“提示工程”的興起,并引發了業界對AI能力邊界及其社會影響的深刻思考。
DALL-E 1(2021):是一個由AI驅動的圖像生成模型。它并非GPT的衍生品,而是同樣基于Transformer核心思想,在架構上進行了關鍵創新,將文本和圖像統一表示為離散標記,并使用一個自回歸Transformer模型對它們進行聯合建模與生成,首次證明了神經網絡能夠從純文本描述直接生成復雜且富有創意的圖像。
ChatGPT (2022):OpenAI推出的對話式人工智能系統。其核心技術是針對 GPT-3.5 模型進行專門優化,以實現與人類意圖和價值觀的“對齊”。它取得突破的關鍵在于引入了 “基于人類反饋的強化學習” 訓練范式。該范式并非簡單的“微調”,而是一個包含三步驟的系統工程:1) 利用人類編寫的對話進行有監督微調;2) 訓練一個模擬人類偏好的獎勵模型;3) 通過近端策略優化算法,以獎勵模型為引導,大規模優化語言模型。
GPT-4 (2023):OpenAI 發布的第四代大規模多模態預訓練模型,標志著大模型在推理能力與跨模態交互上的范式級躍遷。它是 GPT 系列中首個支持文本與圖像雙輸入、并輸出精準文本的模型,具備深度跨模態推理能力 —— 既能解析圖表數據、識別圖像中的邏輯矛盾,也能理解漫畫的諷刺內核與視覺幽默。同時,其在專業學術基準(如模擬律師考試躋身前 10%)、長文本處理(支持 2.5 萬字輸入)和多語言理解上取得了較大突破。
3. 領導“超級智能對齊”項目
2023年7月,OpenAI宣布成立“超級智能對齊”團隊,由Ilya Sutskever與Jan Leike共同領導。該項目設定了一個極其雄心勃勃的目標:在四年內(2027年前),攻克如何確保比人類更聰明的超級人工智能系統與人類意圖保持一致的核心技術挑戰。
該項目團隊認為,目前依賴人類反饋的AI對齊技術(如RLHF)無法擴展到監督超級智能。為此,團隊提出了一個關鍵的技術路徑:首先訓練一個“人類水平的自動對齊研究器”,然后利用這個AI研究器,輔以大量計算資源,去解決更高級別的超級智能對齊問題。OpenAI為此承諾投入其總計算資源的20%。
在Ilya Sutskever的理念中,控制AI的潛在風險優先于其發展速度。他擔心AI能力增長遠超控制力,可能帶來不可預測的災難性風險。這一安全至上的理念,與公司內部追求快速產品迭代和商業化的壓力形成了根本性張力。
該項目的設立本身,即是對“在資本驅動下,長期安全研究可能被邊緣化”這一產業現實的前瞻性回應。最終,這種理念上的沖突在2023年11月演變為公開的董事會危機。
4. 逼宮CEO薩姆·奧爾特曼(Sam Altman)下臺
2023年11月,OpenAI爆發了震驚科技界的治理危機,其核心是首席科學家Ilya Sutskever與CEO Sam Altman在AI發展路線上的根本分歧。
以 Ilya Sutskever 為代表的部分董事會成員堅持,OpenAI 必須恪守非營利初心,將防范 AGI 的潛在風險、確保“通用人工智能造福全人類”作為首要使命,嚴防商業利益侵蝕核心目標;而 Sam Altman 一方則主張公司的當務之急是加速產品化、尋求巨額融資并持續投入研發,以在激烈的競爭中確保生存并維持技術領先地位。
2023年11月初,雙方的矛盾因一系列具體事件達到頂峰。Ilya Sutskever與當時的首席技術官Mira Murati (米拉·穆拉蒂) 秘密合作,整理了一份長達數十頁的PDF備忘錄,詳細列舉了Sam Altman在多方面(包括產品安全審批流程、內部基金歸屬等事務)對董事會“缺乏一貫坦誠”的證據,并通過“閱后即焚”郵件發送給三位獨立董事。
在獨立董事的支持下,董事會于2023年11月17日(公開宣布日)突然行動,以“溝通不坦誠”為由,投票罷免了Sam Altman的CEO職務,并解除了聯合創始人Greg Brockman(格雷格·布羅克曼) 的董事會主席職務。這一決定由Ilya Sutskever和三位獨立董事(共4票)做出,Sam Altman和Greg Brockman投了反對票(共2票)。
Sam Altman被罷免引發了公司內外的海嘯。超過95%(超過700名)的OpenAI員工簽署聯名信,威脅董事會去請回Sam Altman,否則他們將集體加入微軟。以微軟為首的主要投資方也施加了巨大壓力。
面對公司即將分崩離析的局面,Mira Murati和整個高管團隊迅速倒戈,站到了Sam Altman一邊。在巨大壓力下,Ilya Sutskever于11月20日在社交平臺公開表示“對自己參與董事會行動深感后悔”,并簽署了員工聯名信。
經過數日激烈談判,Sam Altman于2023年11月21日成功回歸,條件是徹底重組董事會,除Adam D’Angelo外的所有原董事(包括其他獨立董事和Ilya Sutskever)均退出了董事會。

Sam Altman回歸后,董事會進行重組
回歸后,Sam Altman鞏固了權力,組建了以商業領袖為主的新董事會,并加速了商業化進程。而Ilya Sutskever雖然保留了“首席科學家”頭銜,但已被徹底邊緣化,最終于2024年5月正式從OpenAI離職。
四、SSI時期(2024 - 至今):AI安全的堅定踐行者
Ilya Sutskever離開OpenAI后,并于2024 年 6 月與 Daniel Gross(蘋果前AI高管、Y-Combinator的合伙人)和 Daniel Levy (前OpenAI技術團隊成員)共同創立公司Safe Superintelligence Inc(簡稱SSI)。
公司的使命非常純粹且唯一:直接開發安全的超級智能,并明確表示,公司不會受到產品周期或短期商業壓力的干擾。
SSI創立早期,公司采用高度聚焦的精英模式,團隊僅有約10名員工,在加州帕洛阿爾托和以色列特拉維夫設有辦公室。
成立約3個月后,SSI于2024年9月初宣布完成10億美元的現金融資,估值超過50億美元。投資者包括紅杉資本、a16z、DST Global、SV Angel、NFDG等頂級風投。到2025年4月,SSI在完成20億美元融資后,估值已飆升至320億美元。
然而,在2025年6月底,聯合創始人兼CEO Daniel Gross 被Meta挖走,離開了SSI。Ilya Sutskever隨即宣布親自接任CEO,并表示SSI拒絕了Meta的收購,將繼續專注于原有使命。
原文標題 : Ilya Sutskever —— AI最偉大的“推動者”,也是其最深刻的“對峙者”
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?



分享













