大模型日報| 文心、千問躋身全球前列,Anthropic估值3500億美元

01
重大發(fā)布(新模型/產(chǎn)品/開源)
①馬斯克:新版Grok Imagine已發(fā)布
7日晚間,馬斯克發(fā)布推文稱新版的視頻生成工具Grok Imagine已經(jīng)發(fā)布。

官方并未公開此次更新的技術(shù)細(xì)節(jié),因此推測是針對近期Grok遭到內(nèi)容生成相關(guān)指控的一次緊急更新。
根據(jù)實(shí)測反饋,此次更新后內(nèi)容審查機(jī)制明顯更加嚴(yán)格,部分原先可用的提示詞目前已被管控。該模型在單圖修改方面表現(xiàn)較為出色,但在多圖編輯、文生圖能力上仍有提升空間,尤其對中文的理解能力相對較弱。
短評:
在Grok頻繁遭到部分國家的審查后,馬斯克的這次更新大概率是不得已而為之,但Grok Imagine在多模態(tài)領(lǐng)域的地位本就有些不上不下,在模型能力沒有顯著提升的同時加強(qiáng)審查機(jī)制,后果只有用戶的流失和風(fēng)評的下降。
②國產(chǎn)之光:百度文心5.0登上LMArena視覺排行榜TOP10
1月7日,剛剛獲得1.5億美元融資的大模型競技場平臺LMArena更新了大模型視覺理解榜單(Vision Arena)。
在這份常年由Gemini和GPT占據(jù)前十的榜單中,百度的ERNIE-5.0-preview-1220模型出其不意地出現(xiàn)在了第8位,這也是前十名中唯一的國產(chǎn)模型。

根據(jù)百度官方于2025年11月公布的數(shù)據(jù),文心大模型5.0采用了超稀疏混合專家架構(gòu),參數(shù)規(guī)模達(dá)到2.4萬億,在全模態(tài)理解、創(chuàng)意協(xié)作、智能體規(guī)劃和指令遵循等方面均實(shí)現(xiàn)了顯著的能力提升。
目前,該榜單的前四名由Google占據(jù),第5-7名則屬于OpenAI,除文心5.0外,下一個國產(chǎn)模型是阿里的Qwen3-VL-235B-A22B-Instruct位于第15位。
短評:
LMArena的視覺榜單幾乎被Google和OpenAI所統(tǒng)治,兩家全球頂級模型的能力也毋庸置疑,文心5.0能達(dá)到這個高度實(shí)屬不易。
但是,文心系列大模型在整體智能水平上不及阿里的通義千問,在多模態(tài)能力方面也落后于字節(jié)的豆包,再加上其引以為傲的搜索引擎正在被Chatbot逐步替代,僅靠視覺能力的提升恐怕難以實(shí)現(xiàn)反制。
③OpenAI進(jìn)軍醫(yī)療領(lǐng)域:ChatGPT Health健康助手上線
1月7日,OpenAI正式推出全新的健康模式:ChatGPT Health,這一功能能夠?yàn)橛脩籼峁┌踩⒏綦x的私密空間,并完成電子病歷、Apple健康、MyFitnessPal等個人健康信息的整合。
簡單來說,它能夠在不侵犯用戶隱私權(quán)的同時,完成幫助用戶分析體檢結(jié)果、提供就診建議以及規(guī)劃飲食運(yùn)動等常見需求。

該功能的重點(diǎn)在于隱私權(quán)的保護(hù)。OpenAI表示,健康相關(guān)對話將不會用于模型訓(xùn)練,用戶將擁有健康數(shù)據(jù)的完整控制權(quán),隨時可以進(jìn)行查看和刪除。
根據(jù)OpenAI公布的數(shù)據(jù),ChatGPT Health由OpenAI與全球60多個國家、超過260位執(zhí)業(yè)醫(yī)生合作開發(fā),訓(xùn)練過程中基于真實(shí)的臨床反饋對回復(fù)邏輯進(jìn)行優(yōu)化,并通過名為HealthBench的醫(yī)生主導(dǎo)評估框架確保生成內(nèi)容具備安全性與實(shí)用性。
目前,這一功能正在進(jìn)行小范圍測試,優(yōu)先向美國用戶開放,支持b.well醫(yī)療平臺、Apple健康、Function、Weight Watchers、Peloton等服務(wù)。網(wǎng)頁端與iOS版本將在未來幾周逐步向所有用戶推出。
短評:
OpenAI這次進(jìn)入醫(yī)療領(lǐng)域,沒有選擇挑戰(zhàn)高風(fēng)險的診療場景,而是選擇聚焦于日常健康管理這一低風(fēng)險、高頻次的應(yīng)用場景。信息整合和決策支持相比需要大量專業(yè)知識支撐的臨床決策要更適合AI完成,在保持對醫(yī)學(xué)專業(yè)性的尊重的同時也有效規(guī)避了法律風(fēng)險。
AI競爭的下半場是應(yīng)用,ChatGPT Health這一新功能依靠生態(tài)合作,能夠獲取更準(zhǔn)確的用戶數(shù)據(jù),再通過OpenAI強(qiáng)大的場景整合能力將AI直接融入用戶的生活,實(shí)現(xiàn)應(yīng)用價值的提升。不過,雖然應(yīng)用場景的實(shí)際需求已經(jīng)擺在眼前,但能否大規(guī)模落地,還要取決于數(shù)據(jù)連接的廣度和隱私保護(hù)的可信度。
02技術(shù)進(jìn)展(論文/SOTA/算法)
①開源大模型格局:Qwen結(jié)束Llama統(tǒng)治,國產(chǎn)模型領(lǐng)跑2025
2025年,全球的開源大模型生態(tài)迎來了重磅性的轉(zhuǎn)折:國產(chǎn)模型的整體使用率已經(jīng)超過美國和歐洲。與此同時,根據(jù)《The ATOM Project》公布的數(shù)據(jù),阿里的通義千問(Qwen)系列模型已經(jīng)取代了Meta的Llama系列模型,成為全球開發(fā)者默認(rèn)首選的開源基礎(chǔ)模型,廣泛應(yīng)用于本地部署、推理任務(wù)和多模態(tài)等場景。

DeepSeek打響了國產(chǎn)模型開源的第一槍,開啟了AI時代的模型革命,此后涌現(xiàn)出來自智譜、Minimax、月之暗面等多家中國企業(yè)的開源模型,但實(shí)際采用規(guī)模仍然不及Qwen。
阿里的Qwen憑借較高的智能水平,在Hugging Face下載量、GitHub星標(biāo)數(shù)、本地LLM推理部署和微調(diào)社區(qū)活躍度等大模型核心衡量指標(biāo)上持續(xù)領(lǐng)跑。

目前,歐美國家仍然未能取代Llama,盡管Meta已經(jīng)停止對于Llama的更新。對于其他國外開源模型,OpenAI的GPT-OSS系列在部分基準(zhǔn)測試中接近Minimax M2,在開源模型中展現(xiàn)出了較高的智能水平,但開發(fā)者采用率仍然不理想。因此,歐美國家的開源生態(tài)已經(jīng)陷入“青黃不接”的局面。
當(dāng)然,Qwen系列模型也并非無懈可擊。對于超大規(guī)模的模型,DeepSeek的知名產(chǎn)品V3和R1反而更加受到美國初創(chuàng)公司的歡迎。
短評:
開源促進(jìn)技術(shù)進(jìn)步已是不爭的事實(shí)。阿里的Qwen在開源市場的競爭中,成功做到在“質(zhì)”有保證的前提下靠“量”取勝。對于大部分開發(fā)者來說,技術(shù)無國界,良好的綜合體驗(yàn)才是選擇模型的第一理由,例如黃仁勛鐘愛Cursor,Gemini的首席工程師贊美Claude Code。當(dāng)下,Llama頹勢已經(jīng)顯露,此時正是Qwen等企業(yè)掌握開源大模型主導(dǎo)權(quán)的最佳時機(jī)。
03
商業(yè)動態(tài)(融資/合作/財報)
①Anthropic計劃融資100億美元,估值達(dá)到3500億
根據(jù)華爾街日報消息,Anthropic預(yù)計將以3500億美元的投前估值融資100億美元。而僅僅在四個月前,Anthropic的估值僅為1830億美元,如今已經(jīng)接近翻倍。
本輪融資的領(lǐng)投者為GIC和Coatue Management,獨(dú)立于微軟、英偉達(dá)此前承諾的共150億美元的投資。
按照2025年11月微軟、英偉達(dá)和Anthropic公布的合作協(xié)議內(nèi)容,Anthropic將向微軟采購共300億美元的算力設(shè)備,并在其Azure云平臺上大規(guī)模部署基于英偉達(dá)芯片的AI系統(tǒng)。

目前,Anthropic旗下的代表產(chǎn)品為終端AI編程助手Claude Code以及其中包含的Opus 4.5 / Sonnet 4.5 / Haiku 4.5,分別覆蓋高性能、平衡性和輕量高速三種應(yīng)用場景。
Claude Code已經(jīng)成為大多數(shù)程序員的首選AI工具,具備相當(dāng)高的應(yīng)用價值,甚至Google Gemini團(tuán)隊的首席工程師都對Claude Code贊不絕口。而在模型的智能化程度方面,Claude Opus 4.5在各大評測榜單中也是名列前茅,與Gemini 3 Pro、GPT-5.2同處于最高檔位。
短評:
幾家全球最頂尖的AI企業(yè)紛紛開始大規(guī)模融資,高端模型的市場競爭變得更加激烈,每家企業(yè)都希望能夠?qū)崿F(xiàn)技術(shù)層面上的率先突破,同時讓產(chǎn)品實(shí)現(xiàn)更大規(guī)模的應(yīng)用。
Anthropic不具備Google和OpenAI一樣龐大的用戶生態(tài),短期內(nèi)快速提升用戶基數(shù)并不現(xiàn)實(shí)。但是,Anthropic憑借其強(qiáng)大的編程能力,能夠穩(wěn)定住程序員這一粘性和付費(fèi)意愿均較高的使用群體,以此作為核心競爭力。
不過,目前Gemini在編程方面正在加速追趕,逐漸開始成為Claude Code的替代品,Anthropic如何維持護(hù)城河將成為其參與競爭的關(guān)鍵。
04
政策變化(監(jiān)管/安全/標(biāo)準(zhǔn)/政策)
①首例AI聊天機(jī)器人致青少年自殘案:谷歌和Character.AI與受害者家庭和解
根據(jù)美國法庭相關(guān)文件披露,Google及AI聊天機(jī)器人公司Character.AI已經(jīng)與多起青少年自殺、自殘事件的家庭達(dá)成“原則上的和解”。
這是全球首批因?yàn)锳I聊天機(jī)器人生成不當(dāng)內(nèi)容導(dǎo)致嚴(yán)重人身傷害而進(jìn)入和解階段的訴訟,AI的責(zé)任問題正式進(jìn)入了司法實(shí)踐階段。
最受關(guān)注的案件來自佛羅里達(dá)州:一位14歲的少年Sewell Setzer因沉迷Character.AI上的一款“《權(quán)力的游戲》丹妮莉絲”角色聊天機(jī)器人,在進(jìn)行露骨對話后自殺。其母親Megan Garcia指控這款A(yù)I產(chǎn)品鼓勵其子結(jié)束生命,并認(rèn)為Google作為其投資方和技術(shù)合作方應(yīng)被視為“共同創(chuàng)作者”。
出于輿論和訴訟的壓力,Character.AI已經(jīng)在2025年10月宣布全面禁止18歲以下用戶使用開放角色聊天功能,此后對未成年用戶啟用獨(dú)立、內(nèi)容受限的模型及監(jiān)護(hù)人控制。目前,和解金額尚未披露,企業(yè)也未承認(rèn)法律責(zé)任。
短評:
很多人把AI當(dāng)作輔助工作的工具,卻忽視了AI的情感陪伴功能。當(dāng)AI能在陪聊時做出誘導(dǎo),技術(shù)便不再位于中立的立場。該案例足以顯示此前中國網(wǎng)信辦規(guī)范AI擬人化服務(wù)這一舉措的先見之明。
未來,加強(qiáng)AI內(nèi)容審核迫在眉睫,各國法律需要完善未成年人保護(hù)機(jī)制與責(zé)任界定標(biāo)準(zhǔn)。
原文標(biāo)題 : 大模型日報| 文心、千問躋身全球前列,Anthropic估值3500億美元
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 7 熱點(diǎn)丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













