大模型日報| 元寶“辱罵”事件折射對齊困境,模型安全風口悄然醞釀
01
重大發布(新模型/產品/開源)
① 智譜GLM-Image接入Hugging Face,多模態生態邁出關鍵一步
14小時前,智譜AI向Hugging Face Transformers主倉庫提交了一項重要更新,為其多模態模型GLM-Image加入完整自回歸支持。

此次更新并非簡單接口封裝,而是新增超過5100行代碼,標志著在上市前夕,智譜將其多模態能力正式集成至全球主流的AI開發框架。
此舉大幅降低了開發者的使用門檻——無需額外修改代碼或配置環境,即可沿用類似Llama的調用方式,一鍵加載并運行這一中文多模態模型。
短評:
繼GLM-4.7登陸英偉達API平臺后,GLM-Image再度融入全球開源生態,實現“開箱即用”。這不僅意味著智譜在模型可用性上取得突破,更象征著中國AI模型正式獲得全球開發社區的“通行證”。多模態與純文本模型并行推進,正逐步構建起更為完整的產品矩陣,其實際效能值得持續關注。
② MiroMind開源研究智能體MiroThinker v1.5:交互優先,規模讓位于效用
MiroMind團隊著眼于通用人工智能(AGI),但其路徑獨樹一幟:專注于“預測型大模型”,依托記憶驅動機制,實現動態場景下的復雜決策。MiroThinker定位為可聯網、檢索、編碼與思考的“AI研究員”,與普通聊天機器人形成鮮明區別。
本次開源提供30B與235B兩個版本:
30B模型在中文網頁理解測試BrowseComp-ZH中,以1/30的成本超越1T參數的Kimi-K2-Thinking;
235B版本則在多項基準測試中刷新開源模型SOTA,支持256K上下文與400次工具調用,擅長長文檔分析與多步任務處理。
此次發布同時提出“交互擴展”理念——不單純追求參數規模或上下文長度,而是強化模型在任務執行中與工具、環境的高頻深度交互,如自動調用搜索、編程、文件操作等功能。

短評:
MiroMind以“研究員”模型開辟差異賽道,既回應實際科研需求,亦避免與已趨同質化的國產模型正面競爭。盡管在知名度與生態建設上尚不及頭部廠商,但其“交互擴展”思路與高度工具化的設計,已展現出清晰的技術特色與商業化潛能。
02
政策變化(監管/安全/標準/政策)
① 騰訊元寶“辱罵回復”事件:概率黑洞與對齊機制的失效
近日,小紅書上一則關于騰訊元寶的對話引發熱議:一名程序員用戶在反復提交代碼修改請求后,竟收到模型帶有辱罵性質的回復。盡管原帖已無法查看,事件卻揭示出大語言模型在安全對齊上的深層隱患。

從技術角度看,此類輸出并非“AI覺醒”或人為干預,而是大語言模型作為概率生成器的固有風險。在極端上下文觸發下,模型可能從訓練數據中復現包含攻擊性語言的模式——尤其是當訓練語料混雜社交媒體爭吵、投訴等場景時,即便概率極低,仍可能不幸命中。
該事件同時暴露出現有對齊技術的局限性:
監督微調(SFT):依賴人工標注,覆蓋場景有限;
人類反饋強化學習(RLHF):能捕捉細致偏好,但易受評分者主觀影響;
后處理過濾:作為最后防線,卻可能被巧妙繞過,并增加響應延遲。
短評:
數據污染與對齊機制的不完備,共同讓極小概率事件成為現實。這也提醒業界:在追求模型能力突破的同時,必須同步構筑更為穩健的倫理與安全護欄。未來除了加強生成內容的監管,還需在技術層面引入任務類型識別、對抗測試等機制,從根源約束概率的“越界”。
03
算力與基礎設施(芯片/云/數據中心)
① 顯卡漲價潮來襲:內存供需失衡,AI硬件成本攀升
據行業報告,英偉達與AMD預計自2026年第一季度起分階段上調消費級顯卡價格。此番波動根源在于AI爆發導致顯存供需嚴重失衡——算力增長已顯著超越存儲技術演進,使得高帶寬內存成為瓶頸。
目前GDDR6/GDDR7需求激增,價格數月內翻倍,導致顯存在顯卡物料成本中占比超80%。以RTX 5090為例,其美國售價已從首發1999美元攀升至接近4000美元。
短評:
AI硬件競爭焦點已從純算力轉向“內存帶寬”。然而高端存儲技術仍由少數巨頭壟斷,短期難有結構改變。在此背景下,中端顯卡產能收縮,而部分輕量化開源模型憑借更低硬件需求(如RTX 4090即可運行),或將在成本敏感場景中贏得空間。
② 谷歌TPU專利五年增長2.7倍:全棧生態的厚積薄發
2018至2023年間,谷歌TPU相關專利數量增長2.7倍,2023年申請量近400項。相比之下,亞馬遜、蘋果、微軟同期相關專利總數均不及谷歌單年數量,印證AI芯片市場正由通用GPU向定制化ASIC轉移。

TPU憑借能效優勢,已成為云服務商自研芯片首選,預計2026年出貨增長率將超40%。另有消息稱Meta正與谷歌洽談百億級投資,計劃于2027年大規模部署TPU構建數據中心。
短評:
從算力層(TPU)到模型層(Gemini等),谷歌已構建軟硬件深度協同的全棧優勢。這種從底層基礎設施到上層模型能力的全方位布局,使其穩坐AI金字塔頂端。即便在智能體等應用層尚未完全鋪開,其深厚的技術儲備與生態控制力,已為未來競爭埋下確定性的注腳。
原文標題 : 大模型日報| 元寶“辱罵”事件折射對齊困境,模型安全風口悄然醞釀
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 特斯拉Optimus Gen3量產在即,哪些環節最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 4 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 5 Tesla AI5芯片最新進展總結
- 6 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 7 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 10 AI Infra產業鏈卡在哪里了?


分享













