AI 巨頭,走入黑暗森林

大劉在《三體》中寫過一個(gè)后來被無數(shù)次引用的意象——黑暗森林。每個(gè)文明都是帶槍的獵人,誰先暴露自己,誰先死。森林里不是沒有人,是每個(gè)人都知道亮燈會(huì)招來子彈,所以大家都熄燈。
2026年春天,頂級(jí)AI實(shí)驗(yàn)室們,走入了這樣的黑暗森林。
4月16日,Anthropic 率先發(fā)布 Claude Opus 4.7。同一天,他們做了一個(gè)反常的動(dòng)作——公開承認(rèn) Opus 4.7 的性能并不及一個(gè)尚未發(fā)布的模型 Mythos,理由是 safety concerns。(安全考量)
4月23 日,OpenAI 在官網(wǎng)掛出 GPT-5.5。同一天,Anthropic 又在官方博客發(fā)了一篇叫 “An update on recent Claude Code quality reports” 的事故復(fù)盤報(bào)告,承認(rèn)過去一個(gè)多月 Claude Code 確實(shí)變笨了——一個(gè)放新牌,一個(gè)補(bǔ)認(rèn)錯(cuò)。但這位“新晉王者”幾乎是在炫耀:我們承認(rèn) Claude 暫時(shí)變笨——但你別忘了,我們手里還藏著一把 Mythos 沒出。
4月24 日,“神秘的東方力量” DeepSeek V4 Preview 上線,梁文鋒團(tuán)隊(duì)第一次把模型和華為昇騰 950PR 深度綁定做官宣;但所有人都看明白了——真正“滿血”的 V4 Pro Max,要等昇騰 950 超節(jié)點(diǎn)下半年量產(chǎn)之后才能放出來。
三家公司,三個(gè)動(dòng)作。表面是各自的產(chǎn)品節(jié)奏,但拼在一起看,一件事浮出來:
每一家手里都握著至少一把“槍”——一個(gè)比公開版本更強(qiáng)的模型、一個(gè)還沒輪到公眾的下一代架構(gòu)、一片還沒大規(guī)模鋪開的芯片超節(jié)點(diǎn)。但沒有一家敢先把這把槍舉起來。

因?yàn)樵谶@個(gè)行業(yè)里,“先亮”的代價(jià)從來都不止泄密那么簡單。先亮,意味著把自己的能力上限親手交給對手做參照系;意味著率先承擔(dān)安全審視、監(jiān)管收緊、輿論壓力的全部火力;意味著把自己變成下一輪所有競對都要瞄準(zhǔn)的那個(gè)移動(dòng)靶子。森林里沒有英雄主義——每一個(gè)先開槍的人,都把自己變成了下一個(gè)被瞄準(zhǔn)的人。
所以獵人們最理性的選擇,是熄燈、屏息、把武器藏在背后。
這就是博弈的最優(yōu)解。
Anthropic的有恃無恐
Claude 這一邊,在過去的一個(gè)月,幾乎上演了最糟糕的一次版本發(fā)布。
早早更新完 Opus 4.7,Anthropic 仍舊霸榜各種榜單,而且手里還藏著只提供給企業(yè)客戶的 Mythos——儼然一副不緊不慢的姿態(tài)。
但 Opus 4.7 的這一周期,幾乎是 Claude 用戶體驗(yàn)最差的一次,“差評如潮”。
3 月初,Anthropic 改了 Claude Code 的默認(rèn)推理深度,從 high 調(diào)到 medium。這個(gè)決定的出發(fā)點(diǎn)可以理解:high 模式下 UI 經(jīng)常看起來像卡死了一樣,響應(yīng)慢得讓付費(fèi)用戶抓狂。但問題是,他們當(dāng)時(shí)沒有公布。
3 月底,又上線了一個(gè)“效率優(yōu)化”——如果 Claude Code 會(huì)話空閑超過一小時(shí),系統(tǒng)就會(huì)清掉舊的 reasoning block。按設(shè)計(jì),這是為了省算力。實(shí)際跑起來的效果,是每一輪對話之后 Claude 都像失憶,把上下文忘得干干凈凈。開發(fā)者社區(qū)那幾周涌進(jìn)大量吐槽:“Claude 開始不記得我上一輪讓它干什么了。”
直到近期,第三件事發(fā)生了——在系統(tǒng)提示里加了一條壓縮 verbosity 的指令。按 Anthropic 后來自己承認(rèn)的說法,這條指令讓 Claude Code 的編碼質(zhì)量直接跌了 3%。
三件事疊在一起,才有了 AMD 的一位 senior director 在 GitHub 上寫下的那句話——“Claude has regressed to the point it cannot be trusted to perform complex engineering”(Claude 已經(jīng)退化到無法再被信任去完成復(fù)雜工程類任務(wù))。Axios 4 月 16 日那篇 “Anthropic's AI downgrade stings power users” 把它抬到了主流視野。
然后 Anthropic 才承認(rèn),確實(shí)有點(diǎn)問題。

4月7 日,他們悄悄回滾了 reasoning effort 的調(diào)整;4 月 10 日修掉了 cache 的 bug;4 月 20 日撤掉了壓縮 verbosity 的系統(tǒng)提示。但真正的事故復(fù)盤報(bào)告,等到了 4 月 23 日才發(fā)出來——而這恰好是 GPT-5.5 公開發(fā)布的當(dāng)天。
這種帶著一絲“哦,我的工程策略有點(diǎn) bug,修復(fù)就好了”的輕蔑感,和 OpenAI 的重量級(jí)發(fā)布只在前后腳之間。很難說這是巧合。
更耐人尋味的是, Opus 4.7 發(fā)布的時(shí)候,Anthropic 順帶做了一個(gè)反常的動(dòng)作:公開承認(rèn) Opus 4.7 的性能不及一個(gè)尚未發(fā)布的模型——Mythos。這很明顯是一種“戰(zhàn)略性退守”——Anthropic 把最強(qiáng)能力留在企業(yè)端、不急于推向大眾,因?yàn)閳F(tuán)隊(duì)還沒準(zhǔn)備好把 Mythos 放出去。
這個(gè)說法可以信。但從商業(yè)敘事的角度看,另一半同樣真實(shí):Anthropic 等了六周才公開承認(rèn) Claude Code 在退化,等到 OpenAI 要放新牌的那一天才把問題端出來。如果不是同行壓力足夠大,如果不是 Opus 4.7 已經(jīng)證明了“我們還有后手”,這份聲明可能永遠(yuǎn)都不會(huì)到來。
在 Claude 這一側(cè),擠牙膏不是指刻意閹割能力,而是:能力的釋放節(jié)奏、對問題的披露節(jié)奏,都跟著競對的節(jié)奏走。
拿出自己最前沿的能力,注定會(huì)被當(dāng)做靶子打。又或者說,在 Anthropic 看來,4.6 對競爭對手造成的壓力都還沒散去——既然如此,更強(qiáng)的牌沒必要現(xiàn)在就打出來。
OpenAI 的故技重施
如果 Anthropic 是“藏著一個(gè) Mythos 不發(fā)”,那 OpenAI 這一側(cè)的擠牙膏更隱蔽——它把能力的釋放權(quán),留在了自己服務(wù)器的負(fù)載曲線和一個(gè)叫 auto-router 的分檔機(jī)制里。
4月23 日 GPT-5.5 發(fā)布的同一天,Simon Willison(Django 框架共同創(chuàng)始人、AI 圈知名獨(dú)立評測者)在自己的博客里寫了一句審慎的話:“It's not a dramatic departure from what we've had before.”(這不是一次戲劇性的飛躍)。

他順手補(bǔ)了一條信息很關(guān)鍵:GPT-5.5 是自 GPT-4.5 之后 OpenAI 第一次完全重訓(xùn)的基礎(chǔ)模型;也就是說,過去半年發(fā)出去的 5.1、5.2、5.3、5.4,全部只是增量更新。換言之,過去的四次小版本更新,OpenAI 都是收著力氣發(fā)布的——因?yàn)樗麄儾磺宄偁帉κ謺?huì)放出什么東西。
“收著勁兒更新”有一個(gè)更容易理解的說法:擠牙膏。
但更值得記住的一幕發(fā)生在 GPT-5.5 上線幾個(gè)小時(shí)之后。Codex 用戶在 GitHub 提了 Issue #19241,投訴 Fast mode 一開始真的很快,等更多用戶被放進(jìn)來之后肉眼可見變慢,而計(jì)費(fèi)還按 Fast 檔結(jié)算。措辭很熟悉:“請 OpenAI 調(diào)查 GPT-5.5 Fast mode 是否在高負(fù)載下被降級(jí)。”
這幾乎就是 2025 年 8 月 7 日 GPT-5 首發(fā)當(dāng)天那一幕的精確重演——那一次,Reddit r/ChatGPT 把 “GPT-5 is horrible” 頂?shù)?4600+ upvotes,Sam Altman 第二天在 AMA 上親口承認(rèn) “the autoswitcher broke... GPT-5 seemed way dumber”——承認(rèn)了 router 在幕后替用戶做了降檔這件事。
同一個(gè)劇本,八個(gè)月后再度上演。
更戲謔的是,在 GPT-5.5 正式發(fā)布的前一天,OpenAI 的 Codex 把內(nèi)部 staging 環(huán)境誤推到了生產(chǎn)環(huán)境,被幾個(gè) Pro 用戶截圖截了下來,幾分鐘之內(nèi)修掉,但泄漏的內(nèi)容已經(jīng)四處流傳。當(dāng)時(shí)出現(xiàn)在選擇器里的,除了 GPT-5.5 本身,還有一個(gè)叫 Glacier 的系列(tooltip 寫著 “Intelligence that moves continents”)、一個(gè)叫 Heisenberg 的生命科學(xué)模型、一個(gè)叫 Arcanine 的未知用途模型,以及代號(hào) oai-2.1 等多個(gè)版本。
也就是說,就在 OpenAI 把 GPT-5.5 作為“下一代”放出來的同一時(shí)間,內(nèi)部至少跑著 5 到 6 條平行的產(chǎn)品線,每一條都還沒輪到公眾。
OpenAI 自己倒是認(rèn)了。在 2026 年官方的年度路線圖里,他們用了一個(gè)學(xué)術(shù)圈討論已久的詞——capability overhang——承認(rèn)當(dāng)前大模型的真實(shí)能力和用戶實(shí)際能用出的效果之間,存在一個(gè)巨大的 gap。
熟悉嗎?和 Anthropic 對待 Mythos 的話術(shù)幾乎是同一句話。就算 4 月 22 日那次 Codex 泄露真的是誤操作,OpenAI 主動(dòng)把 capability overhang 這個(gè)詞放進(jìn)路線圖,傳遞的信號(hào)已經(jīng)寫得很清楚——我們手里還多得很,你們看著辦。
你手里有遠(yuǎn)多于賣給用戶的東西,你才有的擠。GPT-5.5 的 24 小時(shí),把這個(gè)前提再一次變成了現(xiàn)場直播。
Deepseek 的耐心等待
DeepSeek 這一邊,“擠”的方式徹底變了——它不是在藏能力,而是在等一個(gè)更合適的交付時(shí)機(jī)。
1.6T MoE、1M 上下文、Pro/Flash 雙規(guī)格,定價(jià) 3.48 per 1M tokens——是 GPT-5.5 的幾十分之一,是 Opus 4.7 的量級(jí)差。海外獨(dú)立評測者給出的結(jié)論是兩句話:性能貼近但略低于 GPT-5.4 / Gemini 3.1-Pro,價(jià)格“把前沿實(shí)驗(yàn)室的經(jīng)濟(jì)學(xué)打穿了”。
但放在 DeepSeek 自己的坐標(biāo)系里,V4 Preview 已經(jīng)比 V3 那種“便宜到詭異”的價(jià)格貴了不止一點(diǎn)。所有人都知道——這不是滿血版。
DeepSeek V4 的完整故事,不以發(fā)布為終點(diǎn),更不以發(fā)布為起點(diǎn)。
要從 2025 年 R2 那次沒發(fā)出來的發(fā)布講起。R2 原定于 2025 年 5 月發(fā)布,但最終被延后到秋冬。整個(gè)中國Deepseek 的基礎(chǔ)設(shè)施遷向華為的 CANN 生態(tài)。對于任何一個(gè)實(shí)驗(yàn)室實(shí)驗(yàn)室,這都不可能是一個(gè)季度能完成的工程——編譯器、算子、通信庫、推理框架、MoE 路由,全部要重寫。
而 V4 這一次,是 DeepSeek 第一次把昇騰正式寫進(jìn)訓(xùn)練硬件清單。V4 是混合訓(xùn)練的第一個(gè)版本——昇騰首次入場。
但專門為大規(guī)模訓(xùn)練優(yōu)化的下一代芯片昇騰 950DT,按華為路線圖要 2026 年 Q4 才量產(chǎn)。也就是說,V4 訓(xùn)練能跑起來,是用上一代的 950PR 拼出來的;要讓 V4 Pro Max 這種 1.6T MoE 的滿血版本既能訓(xùn)得徹底又能大規(guī)模推得起來,還要等下一代到位。
真正的工程難點(diǎn)不是“V4 能不能訓(xùn)出來”——已經(jīng)訓(xùn)出來了——而是“V4怎樣在昇騰上跑得滿、跑得穩(wěn)、跑得便宜”。
昇騰 950PR 在 2026 年 Q1 量產(chǎn),F(xiàn)P4 算力 1.56 PFLOPS、片上內(nèi)存 112GB,紙面規(guī)格對標(biāo)并超過英偉達(dá) H20。但從一顆芯片跑得起,到一整片超節(jié)點(diǎn)能穩(wěn)定服務(wù)數(shù)百萬 token/秒的推理請求,是兩回事。V4 Pro Max 的滿血版,鎖的就是這個(gè)“超節(jié)點(diǎn)”——昇騰 950 系列的大規(guī)模集群版本,2026 年下半年陸續(xù)到位。
這構(gòu)成了一個(gè)和前兩家完全不同的策略。Anthropic 和 OpenAI 擠牙膏的邏輯,是我手里有更強(qiáng)的,先不給你;DeepSeek 擠牙膏的邏輯,是我滿血的那一版,要等一個(gè)讓價(jià)格再下一個(gè)臺(tái)階的時(shí)刻。
這個(gè)差別很重要。
DeepSeek 真正的殺手锏從來不是“性能最前沿”,而是“在性能夠用的前提下,把 token 價(jià)格砍到別人不敢砍的位置”。V4 Preview 在英偉達(dá)卡和昇騰 950PR 上做了適配,但要做到量產(chǎn)規(guī)模的滿血推理,必須等超節(jié)點(diǎn)到位。一旦等到那一刻,兩件事會(huì)同時(shí)發(fā)生:一是 V4 Pro Max 的能力可以釋放到頂;二是推理成本、API 定價(jià)會(huì)再落一階——對一家靠價(jià)格打穿市場的公司,后者比前者更致命。
人們真正期待的、在 2025 年初發(fā)生過的那個(gè)“DeepSeek 時(shí)刻”,沒有在這次發(fā)布里再次上演。而 V4 Preview 的發(fā)布其實(shí)是一段預(yù)告片,真正的重頭戲,是下半年的“DeepSeek + 華為昇騰”時(shí)刻。
從這個(gè)角度看,梁文鋒團(tuán)隊(duì)現(xiàn)在做的不是被迫的“藏”,而是一次商業(yè)上克制的“選擇”——選擇把最強(qiáng)版本的首發(fā),交到一個(gè)它最有話語權(quán)的場景里:國產(chǎn)超節(jié)點(diǎn)大規(guī)模部署后的第一天。在那之前,先用 V4 Preview 把性價(jià)比的敘事再鞏固一輪。

DeepSeek 背負(fù)的從來不是讓國產(chǎn)大模型在某個(gè)榜單上拔到第一的“長板敘事”,而是讓芯片、訓(xùn)練、推理、定價(jià)四條線同時(shí)跑通的“系統(tǒng)性敘事”——后者比前者重要得多。
就在前幾天,黃仁勛在 Dwarkesh Patel 的播客上說,如果 DeepSeek 在華為芯片上首發(fā),“那對我們美國來說是個(gè)可怕的結(jié)果”(“a horrible outcome for our nation”)。
現(xiàn)在英偉達(dá)還把控著頂尖算力。但按照黃仁勛自己拋出的那塊“AI 五層蛋糕”——能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用——國產(chǎn)大模型產(chǎn)業(yè)在每一層都已經(jīng)有了能跑通的國產(chǎn)方案,差距正在以肉眼可見的速度縮小。補(bǔ)上芯片這塊最后的拼圖,DeepSeek 的開源大模型故事,才是一個(gè)比美國大模型更大的故事:這是一場不用消耗過多成本、讓全球?qū)崿F(xiàn)智能平權(quán)的重要一步。
讓全世界都可以繞過某些被霸權(quán)掌控的先進(jìn)算力,走入高效的智能社會(huì)。
尾聲
Anthropic 的“藏”——是主動(dòng)的。他們有 Mythos,沒發(fā),理由是 safety。
OpenAI 的“藏”——是結(jié)構(gòu)的。他們有 Pro 檔,不常給你,理由是 infrastructure 和價(jià)格分層。
DeepSeek 的“藏”——是必要的。它關(guān)乎一整套社會(huì)智能躍遷的敘事范本。
但從另一個(gè)側(cè)面來看,這又像極了大劉描繪的黑暗森林:在這片漆黑的智能森林里,每一個(gè)頂尖獵人都不會(huì)率先開出自己的那一槍。
暴露意味著毫無保留,意味著沒有底牌,會(huì)成為另一個(gè)獵人的活靶子。
沒人知道誰會(huì)率先打出最致命的一槍。但可以確定的是,今天你用的每一個(gè)模型,都不是它真正的樣子。
原文標(biāo)題 : AI 巨頭,走入黑暗森林
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來了
-

OpenAI發(fā)布的AI瀏覽器,市場為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬
-

長安汽車母公司突然更名:從“中國長安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進(jìn)展總結(jié)
- 5 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 6 熱點(diǎn)丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號(hào),還繼續(xù)扣錢!
- 8 2026,人形機(jī)器人只贏了面子
- 9 DeepSeek降價(jià)90%:價(jià)格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





