剛剛,斯坦福大學計算機科學客座教授、前百度 AI 和前谷歌大腦負責人吳恩達老師在社交媒體平臺 X 上發布了一篇 2025 人工智能領域年度總結。
除此之外,他建議所有人于假期期間抽出時間學習和開發軟件,這不僅能幫助大家精進舊技能、學習新知識,還能助力在科技領域的職業發展。
吳恩達給出三點建議:
參加人工智能課程
實踐構建人工智能系統
(可選)閱讀研究論文
他舉出幾個例子來說明這三點的重要性。例如,開發人員要么重新發明了標準的 RAG 文檔分塊策略,要么復制了現有的智能體 AI 評估技術,要么最終寫出了混亂的 LLM 上下文管理代碼。
“如果他們參加過一些相關的課程,就能更好地理解現有的構建模塊。他們當然可以從頭開始重建這些模塊,甚至可能創造出比現有解決方案更優的方案,但他們可以避免數周不必要的工作,” 吳恩達表示。
技術基石躍遷
2025 年 AI 工業化的首要特征,是核心技術獲得了可靠且強大的工業級屬性。其中最具代表性的突破,是推理模型從一項需要提示(Prompt)的技巧,進化為大型語言模型(LLM)內生的基礎能力。
早期,研究者通過指令模型“一步一步思考”(Think step by step)來激發其推理潛能。而到了 2025 年,如 OpenAI 的 o1、DeepSeek 的 R1 等新一代模型,已將復雜的推理流程內化為標準操作。這種轉變主要得益于基于強化學習(RL)的精細微調,即通過獎勵模型產生正確輸出的過程,訓練它先“思考”再“回答”。
其帶來的性能飛躍是現象級的。例如,OpenAI 的 o1-preview 在競賽級數學問題(AIME 2024)上的表現,較之前非推理的 GPT-4o 高出 43%;在博士級科學問題(GPQA Diamond)上高出 22%。在編程能力上,它甚至能在 Codeforces 平臺上擊敗 38% 的人類競技程序員,而 GPT-4o 僅能超越 11%。
推理能力的提升,直接催化了更高級別的 AI 應用形態——智能體(Agents)和機器人——的成熟。當模型學會調用計算器、搜索引擎等外部工具時,其解決問題的能力再上臺階。例如,配備工具的 OpenAI o4-mini 在一項涵蓋 100 個領域的多模態理解測試中,準確率提升了 3% 以上。
推理模型正在成為自主進化系統和科學研究的核心。例如,AlphaEvolve 項目利用谷歌 Gemini 模型反復生成、評估和修改代碼,最終為現實世界問題創造了更高效的算法。
人才與算力決定未來格局
2025 年,AI 頂尖人才的薪酬達到了令人瞠目的水平。這場風波的標志性事件是 Meta 為組建超級智能實驗室(Meta Superintelligence Labs)而發起的大規模挖角。
據《華爾街日報》等媒體報道,Meta 為從 OpenAI、谷歌、Anthropic 等公司吸引頂尖研究員,開出了為期四年、總額高達數億美元的薪酬包,其中包括巨額現金獎金以及為補償其離開原公司所放棄股權的額外支付。
Meta CEO 馬克·扎克伯格甚至親自上門游說,并成功招攬了 OpenAI 推理模型研究的核心人員 Jason Wei 和 Hyung Won Chung。這場爭奪戰迅速推高了整個行業的人才價格。
為應對挖角,OpenAI 等公司被迫采取加速股權授予、發放高達 150 萬美元的留任獎金等反擊措施。吳恩達在回顧這一現象時指出,對于計劃投資數千億美元建設數據中心的公司而言,將其中一小部分用于確保最頂尖的人才,是完全理性的商業決策。
工業時代離不開龐大的基礎設施。2025 年,AI 算力需求的爆炸式增長,僅一年時間整個 AI 行業的資本支出就超過了 3000 億美元。咨詢公司麥肯錫預測,到 2030 年,為滿足 AI 訓練和推理的算力需求,相關投資總額可能達到 5.2 萬億美元。
OpenAI 啟動了與甲骨文、軟銀等合作的“星門”(Stargate)項目,計劃投資 5000 億美元,并最終在全球建設高達 20 吉瓦(GW)的數據中心容量;Meta 則在美國路易斯安那州規劃了一個耗資 270 億美元、容量 5 吉瓦的超大型數據中心。
這些設施的能源需求堪比中型城市,其建設已不僅是商業行為,更成為影響地區經濟發展和全球能源格局的戰略性投資。這場基建競賽表明,AI 的競爭已從算法和模型的軟實力層面,全面延伸至資本、能源和土地等硬實力層面。
參考資料:
https://www.deeplearning.ai/the-batch/issue-333/
https://x.com/AndrewYNg
·