據《華爾街日報》報道,Meta 正在推進一系列新一代人工智能模型的研發,覆蓋圖像、視頻以及文本等多個方向。
多位知情人士透露,Meta 內部目前正在開發一款代號為 Mango 的全新圖像與視頻生成模型,同時也在打磨下一代以文本為核心的大型語言模型,相關成果預計將在 2026 年上半年對外發布。
戰略升級
在最近一次公司內部的問答交流中,Meta 首席人工智能官 Alexandr Wang 與首席產品官 Chris Cox 向員工介紹了這些模型的整體規劃。
Wang 提到,新一代文本模型代號為 Avocado,其核心目標之一是顯著提升編程與代碼生成能力,以更好服務開發者和企業級用戶。
Avocado 的開發方向可能標志著 Meta 在 AI 開源策略上的調整。過去 Meta 一度大力推廣開源模型(例如 LLaMA 系列),但有報道指出,“Avocado” 很可能采用閉源或收費訪問的模式,這是對公司過去策略的一次重要修正。
與此同時,Meta 也已開始探索更前沿的研究方向——“世界模型”。這類 AI 通過持續吸收視覺信息來理解和建模周圍環境,被認為是通向更高階通用智能的重要一步。
Wang 表示,該方向目前仍處于早期研究階段,但已被視為公司長期 AI 戰略的一部分。
今年夏天,Meta 對其 AI 組織架構進行了大幅調整,成立了新的 Meta Superintelligence Labs(超級智能實驗室),并由 Wang 負責領導。
Meta 首席執行官 Mark Zuckerberg 親自參與核心人才招募,從多家頭部 AI 機構吸引了二十多名研究人員,并組建了一支超過 50 人的跨學科研發團隊,涵蓋模型研究、工程實現及產品化等多個環節。
Meta 的 AI 布局
在過去一兩年間,AI 技術尤其是生成式模型領域的競爭愈發白熱化。圖像與視頻生成技術已成為大型 AI 公司爭奪用戶注意力和產品差異化的重要戰場之一。
2025 年 9 月,Meta 與初創公司 Midjourney 合作推出了 AI 視頻生成工具 Vibes;幾乎在同一周,OpenAI 也發布了自己的視頻生成應用 Sora,顯示出各大廠商在這一細分領域的快速布局。
競爭不僅限于產品功能,還體現在用戶增長層面。谷歌推出的圖像生成工具 Nano Banana 成功推動其 Gemini AI 的月活躍用戶數從約 4.5 億增長至超過 6.5 億,凸顯了視覺 AI 的用戶吸引力與商業潛力。
OpenAI 在發布 Gemini 第三版模型后,首席執行官 Sam Altman 曾公開強調圖像生成是消費者最關注的 AI 功能之一,是提高用戶黏性的重要因素。
在多方競逐之下,圖像、視頻與文本能力的融合,正逐漸成為衡量下一代 AI 模型實力的關鍵指標。Meta 此次在多模態模型與基礎研究上的同步投入,也被外界視為其試圖在新一輪 AI 競爭中重新確立技術優勢的重要一步。其策略關鍵在于:
快速迭代產品能力——通過 Mango、Avocado 提供更強的生成與理解能力;
戰略人才與組織建設——吸引行業頂尖人才,建立面對未來的研發架構;
平衡開源與商業化路徑——在開放創新與商業模式之間尋找最佳策略點;
深化應用場景融合——將 AI 能力嵌入社交、創作、開發者工具等核心業務。
參考資料:
https://www.wsj.com/tech/ai/meta-developing-new-ai-image-and-video-model-code-named-mango-16e785c7?mod=hp_lead_pos2
https://news.futunn.com/post/66395046/meta-is-reportedly-set-to-release-new-ai-models-for?utm_source=chatgpt.com&level=1&data_ticket=1766116194545042