AI付費潮來襲,算力租賃躺贏

誰在驅(qū)動這波前所未有的算力需求熱潮?答案可以簡單地歸結(jié)為Token調(diào)用量的指數(shù)級爆炸。
根據(jù)OpenRouter的最新測算,截至2026年4月初,全球AI大模型詞元總調(diào)用量已達(dá)27萬億,環(huán)比增長18.9%,而中國AI大模型詞元調(diào)用量已連續(xù)五周超越美國。越多的Token消耗,就意味著越多的服務(wù)器在工作,越多的GPU在發(fā)熱,越多的電力在燃燒——而這些“越多”的背后,就是算力租賃這門生意最底層的增長邏輯。
“以租代買”的觀念正在大量中小企業(yè)中迅速普及。單張NVIDIA A100顯卡售價約10萬至15萬元,H100更高達(dá)20萬至30萬元,對于一家初創(chuàng)公司而言,僅硬件采購成本就足以將其壓垮。而通過租賃,企業(yè)可以大幅降低70%以上的初期投入,還能根據(jù)需求隨時更換最新一代的硬件設(shè)備。在中國的一些電腦設(shè)備租賃企業(yè),高性能機型甚至出現(xiàn)了“上架即秒光”的火爆行情。這一現(xiàn)象證明,算力租賃的核心價值已經(jīng)不再僅僅是“省錢”,而是提供了一條讓中小企業(yè)能夠以更低成本、更低風(fēng)險跟緊技術(shù)迭代步伐的可行路徑。
01
國內(nèi)外玩家,齊發(fā)力
如果說旺盛的需求描繪了算力租賃的廣闊前景,那么近期接連爆出的幾筆交易,則直接告訴市場:這個賽道的水遠(yuǎn)比想象中更深,參與者也遠(yuǎn)比想象中更多元、更重量級。
5月4日,字節(jié)跳動旗下的AI應(yīng)用豆包在App Store新增付費版本服務(wù)聲明,在免費版的基礎(chǔ)上推出了三檔增值服務(wù):標(biāo)準(zhǔn)版連續(xù)包月68元/月、加強版連續(xù)包月200元/月、專業(yè)版連續(xù)包月500元/月。付費功能主要聚焦于PPT生成、數(shù)據(jù)分析、影視制作等高復(fù)雜度生產(chǎn)力場景。
豆包為什么在這時候選擇收費?三個關(guān)鍵數(shù)字足以說明問題:豆包的日均Token消耗量已達(dá)120萬億,相比2024年5月首次發(fā)布時增長了1000倍,僅在2026年頭三個月就翻了一番;字節(jié)跳動2026年規(guī)劃的約1600億元資本開支中,預(yù)計有一半將投向AI芯片采購;而據(jù)業(yè)內(nèi)測算,推理算力需求已經(jīng)是訓(xùn)練階段的10-15倍。也就是說,付費用戶越多、使用頻率越高、任務(wù)越復(fù)雜,算力消耗就越快——而這套邏輯閉環(huán)的終端傳導(dǎo)效應(yīng),就是算力租賃廠商接單到手軟。
如果說豆包付費體現(xiàn)的是AI用戶和商業(yè)化的需求倒逼,那Anthropic跟SpaceX這筆算力租賃大單,就實打?qū)嶓w現(xiàn)了算力供給格局正在重新洗牌。5月6日,AI獨角獸Anthropic官宣正式租下了SpaceX旗下位于美國田納西州孟菲斯的Colossus 1數(shù)據(jù)中心的全部算力。
這是一個什么概念?Colossus 1配備了超過22萬塊英偉達(dá)GPU,涵蓋H100、H200乃至下一代GB200加速器,總功耗達(dá)到300兆瓦——相當(dāng)于一個約20萬至30萬戶家庭的中型城市的全部居民用電。該數(shù)據(jù)中心從規(guī)劃到建成僅用了122天,充分體現(xiàn)了SpaceX在工程建設(shè)和芯片采購上的驚人統(tǒng)籌能力。對Anthropic而言,這筆協(xié)議意味著在短短一個月內(nèi)即可獲得超過300兆瓦的新增算力,使其總算力水平從不足10萬張H100當(dāng)量一舉追平甚至超越OpenAI、Google DeepMind等主要競爭對手。對SpaceX而言,這更是一石多鳥的精妙商業(yè)布局:原本為xAI訓(xùn)練Grok而建的Colossus 1在xAI解散并入SpaceX并更名為SpaceXAI后處于閑置狀態(tài),租給Anthropic后不僅實現(xiàn)了閑置頂級算力的直接變現(xiàn),還為即將到來的IPO貢獻(xiàn)了一個極具說服力的現(xiàn)金流故事。兩家公司甚至已經(jīng)在探討合作開發(fā)“數(shù)吉瓦級的軌道AI算力”,將數(shù)據(jù)中心部署至近地軌道的工程化步伐正在加速。
值得注意的是,Anthropic并非只在SpaceX這一棵樹上“租算力”。就在此前的一個月,Anthropic已分別與亞馬遜和谷歌/博通簽訂了總計約5吉瓦的算力供應(yīng)協(xié)議,據(jù)估算僅與谷歌的5吉瓦協(xié)議就相當(dāng)于在5年內(nèi)投資近2000億美元。再疊加此前與微軟Azure簽訂的300億美元算力合同,Anthropic在算力承諾上的總規(guī)模已達(dá)數(shù)千億美元。巨額的數(shù)字背后,揭示了一個現(xiàn)實:頂尖AI模型的競爭不僅是一場算法和數(shù)據(jù)的競賽,更是一場純粹的算力消耗戰(zhàn)。而在這場消耗戰(zhàn)中,最有實力的并不是模型廠商本身,而是那些手握海量GPU資源、具備超強供應(yīng)鏈整合能力的“算力王者”。
將視角拉回國內(nèi),算力租賃市場的玩家版圖同樣在迅速成型。核心玩家大致可分為三類典型路徑:第一類是深度綁定核心客戶的IDC/AIDC廠商,如光環(huán)新網(wǎng)、潤澤科技、奧飛數(shù)據(jù)等,憑借節(jié)點儲備和擴張能力站穩(wěn)腳跟;第二類是具備全球調(diào)度、納管與自建結(jié)合能力的云服務(wù)商,阿里、百度、騰訊等均已宣布AI算力產(chǎn)品多輪提價,漲幅在5%至34%之間;第三類則是擁有差異化資源整合能力、正處于業(yè)績加速兌現(xiàn)階段的算力租賃及跨界轉(zhuǎn)型標(biāo)的,協(xié)創(chuàng)數(shù)據(jù)就是一例——2026年第一季度實現(xiàn)歸母凈利潤7.5億元,同比增長343%;利通電子同期實現(xiàn)歸母凈利潤2.7億元,同比增長821%;東陽光則在2026年5月5日公告,其控股子公司簽署的算力服務(wù)采購框架合同訂單總金額達(dá)到160億至190億元。而放眼海外,新興云廠商CoreWeave的資本開支計劃從103億美元跳升至300億至350億美元,在手訂單規(guī)模已逼近960億美元;甲骨文與OpenAI達(dá)成的4.5GW算力租賃協(xié)議,更將其2026年資本開支直接上調(diào)至500億美元以上。
02
從“賣算力”到“賣Token”,商業(yè)模式變了
算力租賃之所以從“邊緣生意”迅速躍升為“核心資產(chǎn)”,關(guān)鍵在于其商業(yè)邏輯本身發(fā)生了根本性的代際進(jìn)化。五年前,這類生意還接近于簡單的“服務(wù)器轉(zhuǎn)租”——平臺采購一批GPU,掛在網(wǎng)上按小時計價,客戶按需使用,更像一個自動售貨機式的標(biāo)準(zhǔn)商品交易。然而今天,這個行業(yè)正在經(jīng)歷一場深刻的模式躍遷。
一個最直觀的變化來自價格端。據(jù)行業(yè)監(jiān)測數(shù)據(jù)顯示,H100 GPU的一年期租賃合同價格從2025年10月每卡每小時1.70美元的低點,急升至2026年3月的2.35美元,漲幅接近40%。與此同時,英偉達(dá)H200、H100等高端GPU的租金環(huán)比普遍上漲15%至30%——H200時租金達(dá)7.5元至8.0元/卡時,月租金6萬至6.6萬元,漲幅25%至30%;H100月租漲至5.5萬至6.0萬元,漲幅15%至20%。更說明問題的是,交付周期已經(jīng)大幅延長至2027年第二季度(H200)和第一季度(H100),這種時間軸的拉長本身就是市場緊張程度最真實的信號。
價格上漲的背后,是一個更根本的需求結(jié)構(gòu)轉(zhuǎn)換——算力租賃正在從“賣算力”轉(zhuǎn)向“賣Token”。這是一個看似簡單、實則影響深遠(yuǎn)的轉(zhuǎn)變。過去,用戶購買的是GPU的“運行時間”,企業(yè)按小時付費,實際使用率完全取決于用戶自身。而如今,隨著AI應(yīng)用全面進(jìn)入推理驅(qū)動階段,大量開發(fā)者、企業(yè)和個人在調(diào)用大模型時,實質(zhì)上是在“消費Token”——每一次API調(diào)用、每一次智能體交互、每一次復(fù)雜任務(wù)推理,都會消耗規(guī)模浩大的Token量。需求方不再關(guān)心自己用了多少小時的GPU,只關(guān)心模型能生成多少Token、完成多少任務(wù)。相應(yīng)地,算力租賃廠商的服務(wù)交付方式也開始從“裸算力出租”升級為“模型服務(wù)即算力”乃至“Token分成模式”。
然而,商業(yè)邏輯的光鮮面背后,也隱藏著不容忽視的隱憂。有人用當(dāng)前每小時2.35美元的H100租金屬性和樂觀的100%出租率假設(shè)倒推出“4個月回本”的神話,這種計算對于初創(chuàng)型和邊緣型玩家來說往往暗藏陷阱。業(yè)內(nèi)人士指出,更真實的賬本是:GPU資產(chǎn)大約在2.5年內(nèi)完全收回成本。2.5年回本,放在重資產(chǎn)行業(yè)里已然相當(dāng)可觀,但前提是——你拿得到當(dāng)下最緊缺的高端GPU采購訂單,你的數(shù)據(jù)中心有足夠的電力容量和冷卻能力,你的客戶關(guān)系不是一次性交易而是3至5年的長期鎖定期合同。在全球四大科技公司(Meta、Alphabet、微軟、亞馬遜)2026年合計7250億美元AI資本支出的大背景下,中小型算力租賃參與者在供應(yīng)鏈博弈中天然處于劣勢。可以預(yù)見的是,算力租賃賽道的資源和訂單將進(jìn)一步向少數(shù)頭部玩家集中,“贏家通吃”的格局輪廓正在悄然浮現(xiàn)。
03
算力要破局,答好三道必答題
如果說前三個部分討論的是算力租賃的“現(xiàn)在”,那么真正決定這個行業(yè)未來走向的,則是三個更深層、更長遠(yuǎn)的結(jié)構(gòu)性問題。
第一個問題是技術(shù)代際競賽的加速。英偉達(dá)正以驚人的節(jié)奏更新其產(chǎn)品路線圖:Blackwell平臺之后,Vera Rubin平臺已承諾在今年下半年出貨,性能功耗比將達(dá)前代產(chǎn)品的10倍;Rubin Ultra預(yù)計2027年問世,F(xiàn)eynman計劃于2028年推出。每一代GPU的算力躍升都意味著舊代服務(wù)器的賬面價值可能快速縮水,這對于投入數(shù)千億購置固定資產(chǎn)的算力租賃企業(yè)而言,意味著折舊風(fēng)險和資產(chǎn)減值風(fēng)險不可忽視。但也恰恰因此,租賃模式體現(xiàn)出了更強的商業(yè)韌性——唯有通過大批量、快速迭代的集群運營,才能將硬件更新的成本平滑分散到大量客戶身上,將技術(shù)迭代的負(fù)面沖擊轉(zhuǎn)化為靈活性和規(guī)模優(yōu)勢。梅賽德斯-奔馳的F1車隊不會因為明年要換新引擎就不參加今年的錦標(biāo)賽;同樣的邏輯,AI企業(yè)不會因為明年的算力硬件更強就不租用今天已有的GPU。在技術(shù)不斷加速的情況下,算力租賃不虧反賺——租戶無需擔(dān)心資產(chǎn)貶值,出租方則可以靠規(guī)模效應(yīng)消化迭代成本。
第二個問題是“算力鴻溝”與國產(chǎn)化的博弈。一個頗具黑色幽默意味的現(xiàn)實正在中國部分智算中心上演:安裝了英偉達(dá)GPU的機柜出租率超過90%,國產(chǎn)GPU服務(wù)器的出租率卻很低。核心瓶頸不是硬件本身——而是軟件生態(tài)。CUDA沉淀了十?dāng)?shù)年的開發(fā)者工具鏈和生態(tài)優(yōu)勢,國產(chǎn)GPU在框架適配、編譯優(yōu)化上仍有明顯差距。華泰證券判斷2026年是“國產(chǎn)超節(jié)點元年”,試圖通過超節(jié)點架構(gòu)的系統(tǒng)級重構(gòu)彌補單芯片差距,降低通信開銷以將理論算力轉(zhuǎn)化為可用吞吐。但這條路注定需要時間,算力租賃行業(yè)在享受大模型需求爆發(fā)的紅利的同時,也必須面對“缺芯少魂”的結(jié)構(gòu)性煩惱。工信部已經(jīng)印發(fā)了《關(guān)于開展普惠算力賦能中小企業(yè)發(fā)展專項行動的通知》,圍繞“算力銀行”“算力超市”等創(chuàng)新業(yè)務(wù)作出部署,支持中小企業(yè)存入閑置算力資源。這一政策導(dǎo)向旨在打破算力的重資產(chǎn)壁壘,但如果基礎(chǔ)算力底座仍然以海外高端芯片為主,那么所謂的“普惠算力”在深層供給上仍將受制于外部供應(yīng)鏈的不確定性。
第三個問題是算力租賃與實體產(chǎn)業(yè)AI轉(zhuǎn)型之間的協(xié)同。當(dāng)前的市場熱潮主要由互聯(lián)網(wǎng)大模型企業(yè)的需求推動,Token的指數(shù)級增長也多集中在云端應(yīng)用和智能體賽道。但真正的算力大航海時代遠(yuǎn)遠(yuǎn)沒有到來——如果智能制造、醫(yī)療影像、自動駕駛、數(shù)字孿生等實體行業(yè)真正全面擁抱AI,屆時算力需求的井噴量級將再翻數(shù)倍。在此背景下,算力租賃行業(yè)面臨一個選擇:是繼續(xù)沿襲當(dāng)前追逐頭部大客戶的流量路徑,僅在互聯(lián)網(wǎng)大廠之間做算力的“軍火商”;還是主動下沉,與各行業(yè)深度合作,讓算力真正成為國民經(jīng)濟的公共基礎(chǔ)設(shè)施。二者的結(jié)果將大不相同。前者是“賺快錢”,后者是“賺大錢”——但賺大錢的路徑需要耐心、產(chǎn)業(yè)認(rèn)知和跨領(lǐng)域的協(xié)同能力。
AI的免費時代正在加速終結(jié),而算力作為AI世界里最剛需、最稀缺的生產(chǎn)資料,它的“租賃者”正在成為這場產(chǎn)業(yè)浪潮中確定性最強的受益者。不是所有人都能從大模型的算法突破中分一杯羹,也不是每家公司都燒得起千億美元級的自建算力集群,但幾乎每一家想要落地AI應(yīng)用的企業(yè),都繞不開“按月付費、按Token計費、按需擴容”的算力租賃路徑。當(dāng)AI付費潮從C端應(yīng)用向B端基礎(chǔ)設(shè)施層層傳導(dǎo),算力租賃便不再是某個細(xì)分賽道的邊緣生意,而是整個AI產(chǎn)業(yè)商業(yè)閉環(huán)中不可或缺的“水電煤”。
原文標(biāo)題 : AI付費潮來襲,算力租賃躺贏
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 7 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













