大模型們別擠了,沒啥機會了

文|鄭亦久
上半年還沒過去,第一個被大公司收購的國內AI大模型創業公司就出現了——光年之外。
創始人王慧文因為生病住院而無法繼續帶領創業公司繼續向前,無疑是一場不幸的意外。最終由早期投資人王興和美團全權接管這家原本的明星AI大模型創業公司,似乎又在意料之中。
美團官方給出的說法也非常直接:“收購有助于加強美團在AI行業的競爭力”。
不知道美團的本地生活業務有多少需要依靠尚未落地的AI大模型來提高效率,但對于互聯網巨頭而言,AI大模型業務在目前始終都是證明自己依然保持著科技敏感度與先進性的重要一環,有好過無。

圖源:網絡
事實上,在光年之外啟動之后,國內的AI大模型創業也一度成為了紅海。
除了巨頭扎堆入場之外,王小川、李開復、閆俊杰等知名企業家也都加入了這場競賽,根據騰訊科技的統計,超過十家AI大模型創業公司都已經入場,既要爭奪人才,又要搶融資渠道,當然還要持續考慮算力的問題。
以上這些都還只是有著各種光環加持的明星創業公司,根據另一份統計,今年以來國內官宣做大模型的公司數量已達到了70多家,其中不乏對標OpenAI的初創者和巨頭公司。
這種極致內卷的環境顯然已經許久未見。
01想好靠山了嗎?
不過一個很吊詭的事實是,光年之外作為這一波大模型浪潮融資金額最多、估值最高的公司之一,從2月高調宣布入局到現在,始終處在媒體關注的前沿,但直到目前也沒有官宣任何大模型或者應用產品,外界更多的關注依然還在組局人王慧文身上。
反倒是四月才正式官宣起步的百川智能,在6月15日發布了首個70億參數量的中英文預訓練大模型——baichuan-7B。
4月下旬,出門問問宣布推出AI大模型“序列猴子”后,緊接著就向港交所申請了上市,即便其大模型在招股書中并沒有任何商業化進展。縱觀上半年的國內大模型賽道,一個非常典型的現象便是大公司依然具有相當巨大的身位優勢。
不論是百度還是阿里,都在很快的時間里既拿出了訓練參數不低的大模型,也在第一時間做出了面向消費市場的文心一言、通義千問等通用類產品。光是這一點其實就不難看出,在這個賽道上,從零開始的創業公司與手握大把資源巨頭們的差距。
OpenAI那個小而美團隊的成功,讓人看到了一種可能。但硬幣的另一面是,OpenAI背后其實有著微軟全方位的支持和協作,不論是數據、算力、云服務,全世界都很難再找到比微軟實力更雄厚的提供方,更不用說動輒百億美元的資金支持。
因此,OpenAI絕非典型意義上的創業公司,更像是早早就被巨頭看中的技術孵化器。
當國內的大模型創業公司表示自己要對標OpenAI時,它們是否確定自己已經找到了一個能夠為其解決大量資源問題的靠山?
02無法實現算力競爭,那談什么?
除了人才和資金之外,一個更現實的問題則是訓練算力,這幾乎直接決定了AI大模型的效果。
算力二字對應到現實中等同于擁有的英偉達商用數據中心GPU的數量,在AI大模型的訓練與參數調教上,現在英偉達旗下A100、H100及其中國定制減配版A800、H800幾乎沒有現成的替代品,不僅僅是國產替代沒有,即便是AMD、英特爾也拿不出同等檔次的硬件。
更不用說,還有英偉達在CUDA軟件生態上長期以來建立的護城河,都使得真正想要在短時間內實現大模型訓練的創業公司,無法選擇其他產品。這也是英偉達過去一個月里股價狂飆的原因,別無分店的“賣鏟子”實在太掙錢了。
問題在于,不論是A100、H100還是A800、H800,并不是有錢就能買到,在這波大模型浪潮開啟之后,GPU的爭奪早就白熱化。
根據《晚點 LatePost》之前的報道,今年春節后,擁有云計算業務的中國各互聯網大公司都向英偉達下了大單。
字節今年向英偉達訂購了超過10億美元的GPU。而一個真正能夠面向消費市場的AI大模型以及應用,需要多少算力支持呢?
技術咨詢機構 TrendForce在6月發布報告稱,OpenAI需要約3萬塊A100來持續優化和商業化ChatGPT,算力不夠也成為GPT-4遲遲無法大規模開放使用的瓶頸。
做一個簡單的計算不難看出,國內大模型創業公司在第一輪融到的錢,甚至很難獲得太多算力層面的競爭力。
同時,最近的一則消息則讓情況雪上加霜,根據《華爾街日報》的消息,美國商務部正考慮的新限制將禁止在沒有許可證的情況下銷售A800芯片,相關規定可能在下個月出臺。
這意味著即便是性能閹割的A800、H800,以后可能也是有價無市。

向中國出售的A100(“閹割版”A800)與A800對比甚至包括直接向中國AI公司出租云服務進行大模型訓練的規避方式也被納入了限制的范圍,這一局面只會讓國內的AI大模型創業在本就收益不明的情況,額外增加大量成本。
不論是通過租用國內現有算力維持,還是尋找更低效的國產替代,都將會直接影響大模型訓練和通用產品進度,在幾乎以天進化的AI創業賽道里,時間不等人。
從這個角度來看,光年之外率先被美團收購或許不是什么壞事,畢竟國內的互聯網巨頭就這么幾個,接下來等著被收購的AI大模型創業公司卻可能遍地都是,這條賽道留給小玩家的機會幾乎聊勝于無。
原文標題 : 大模型們別擠了,沒啥機會了
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













