LLM
-
智譜GLM-5V-Turbo“擦槍走火”,國產多模態智能體戰爭一觸即發
在國產大模型的激烈競爭中,智譜的GLM系列一直掌握著一張極具商業價值的王牌:極強的代碼能力。 隨著AI的主要形式從大語言模型轉向智能體,行業競爭進入下半場,開發者和開發生態是付費意愿最強的群體。 但是
-
什么是VLM?為什么它對自動駕駛很重要?
VLM,即視覺語言模型,簡單理解下,其就是把“看見的東西”和“說出來的話”放在同一個腦子里理解的模型。我們平時把相機拍到的畫面交給視覺模型去做檢測、分割、深度估計這些任務,語音或文本交給語言模型去處理
-
GLM-5架構細節浮出水面:DeepSeek仍是繞不開的門檻
離春節不到一周,過去兩年的經驗告訴我們,國產AI新產品的爆發期又要來了。 Kimi K2.5在OpenRouter上一騎絕塵,Minimax也在官網上隱隱約約透露出M2.2的版本代號。 大家等得很焦急
-
視頻理解大模型覺醒!Video-o3發布:像偵探一樣主動搜尋關鍵幀,登頂Video-Holmes!
作者:Xiangyu Zeng等 解讀:AI生成未來 亮點直擊 Video-o3,一個創新的框架,它通過迭代地發現顯著的視覺線索、對關鍵片段進行細致檢查以及在收集到足夠證據時自適應終止搜索過程,解決了
-
已有VLM,自動駕駛為什么還要探索VLA?
自動駕駛技術正處于發展的轉折點。過去十幾年間,行業長期依賴模塊化的技術路徑,即將駕駛任務拆解為感知、預測、規劃和控制四個獨立環節。這種結構雖然清晰,但在面對突發狀況時(長尾場景),會因規則覆蓋不足而表
-
智譜敲鐘,唐杰亮劍:GLM-5 將至,全面回歸基座
月 8 日,全球首家以通用人工智能(AGI)基座模型為主營業務的上市公司——?智譜AI(股份代號:02513.HK)在香港聯合交易所主板掛牌。 其發行價 116.20 港元,開盤價 120 港元,收市
智譜敲鐘 2026-01-09 -
阿里通義開源圖像編輯模型 Qwen-lmage-Edit-2511:提升生成人物的一致性
剛剛,阿里通義宣布開源 Qwen-Image-Edit-2511。 這是在 Qwen-Image-Edit-2509 基礎上的增強版本,包含多項改進: 減輕圖像漂移 提升人物一致性 集成 LoRA 能
阿里通義 2025-12-25 -
為國爭光!智譜GLM-4.7橫掃全球開源模型,超越GPT5.2
智譜又為國爭光了!智譜正準備在港交所上市,即將成為全球大模型第一股。同時,發布了「GLM-4.7」模型。GLM-4.7最驚艷的是編程能力,在國產模型中排名第一。放眼全球,也是橫掃所有開源模型,甚至評分
智譜GLM-4.7 2025-12-25 -
智譜新一代編碼模型 GLM-4.7 來襲:樹立開源新標準
近日,智譜 AI 發布新一代旗艦 AI 模型 GLM-4.7。 就在前不久,智譜推出的 GLM-4.5 在智能體、推理和編碼(ARC)任務中均取得了優異的性能,在 TAU-Bench、AIME 24
智譜 2025-12-23 -
智譜 AutoGLM 開源:推動 AI 手機變革
12 月 9 日,智譜 AI 開源其核心 AI Agent 模型 AutoGLM,能夠“看懂”手機屏幕、模擬真人進行點擊、滑動和輸入操作。 此時距離字節跳動“豆包手機”引爆市場僅過去一周,那款能跨應用
智譜 2025-12-11 -
Anthropic 論文指出:少量樣本會使任何規模的 LLM “中毒”
近日,Anthropic Alignment Science 團隊發現,只需 250 份惡意文檔即可在大語言模型(LLM)中產生 “backdoor“ 漏洞——無論是多大的模型規模或訓練數據。 盡管
Anthropic 2025-11-17 -
Meta 與牛津大學合作論文:從語言預訓練中揭開 LLM 視覺先驗的起源
大型語言模型 (LLM) 盡管僅基于文本進行訓練,卻意外地能夠發展出豐富的視覺先驗。這些先驗使得模型能夠利用相對少量的多模態數據來解鎖潛在的視覺能力,從而完成視覺任務。在某些情況下,甚至無需任何圖像即
Meta 2025-11-17 -
LLM 在字符級文本處理方面越來越好
近日,一篇博客講述了 LLM 在處理字符級文本時的能力提升。 作者表示,他一直在測試最新一代大型語言模型處理自然語言的能力,特別是字符計數、句子中的字符操作以及編碼和密碼解析。令人驚訝的是,與前幾代
LLM 2025-11-14 -
Anthropic 新論文:LLM 涌現出的內省跡象
了解人工智能系統是否真正具備內省能力,這將有助于理解其推理過程并調試行為問題。 Anthropic 的最新研究表明,目前的 Claude 模型具備一定程度的內省意識,并且能夠控制自身的內部狀態。雖然種
Anthropic 2025-11-14 -
首個基于LLM的開源音頻大模型!階躍星辰重磅開源Step-Audio-EditX:P聲音如此簡單!
作者:Chao Yan等 解讀:AI生成未來 亮點直擊 首個開源的 LLM 音頻編輯模型:Step-Audio-EditX,首個基于大語言模型(LLM)的開源音頻模型,不僅擅長表現力豐富和可迭代的音頻
-
字節 Seed 團隊發布循環語言模型 Ouro:LoopLM 架構引人注目
部署擁有數千億參數的模型需要龐大的基礎設施,這會增加延遲和成本,并限制其可用性。 這個時候,參數效率就變得至關重要。研究人員探討,如何在固定的參數預算內實現更優的模型性能。 為了實現這種參數效率,目前
字節跳動 2025-11-04 -
自動駕駛中常提的VLM是個啥 ?與VLA有什么區別?
自動駕駛車輛要在復雜多變的道路環境中安全行駛,不僅需要“看見”前方的車輛、行人和路面標志,還需要“讀懂”交通標識上的文字提示、施工告示牌和乘客的語言指令。之前和大家討論過VLA(相關閱讀:自動駕駛中常
-
聊聊MoA(混合智能體架構):如何激發LLM潛力并掀起語言模型協作革命?
全文約 3500 字,預計閱讀時間約 9 分鐘 近年來,大型語言模型(LLMs)在自然語言處理領域掀起了一場風暴,從對話生成到復雜任務推理,它們的表現令人驚嘆。然而,單個模型的性能總有瓶頸,訓練成本高昂且資源需求巨大
-
OpenAI推出新一輪企業級功能,強化GPT-4 Turbo LLM和其他模型
(本篇文章共884字,閱讀時間約1分鐘) 圖源:互聯網 OpenAI宣布了其面向API客戶的企業級功能擴展,進一步豐富了其Assistants API,并引入了新工具,旨在增強安全性和管理控制,以及更有效地管理成本
-
技術創新:蘋果在閃存上存儲大型語言模型(LLM)引領未來AI發展
(本篇文篇章共1135字,閱讀時間約1分鐘) 2023年12月22日,據多家媒體報道,蘋果正積極探索在閃存上存儲大型語言模型(LLM)的技術創新,并計劃將其引入iPhone、iPad和Mac等設備,以在資源有限的環境中提高人工智能(AI)的運行效率
-
數據泄露成LLM應用最大障礙,看實在智能如何用AI Agent破解謎題
大語言模型數據泄露堪憂,超自動化Agent成解決之道 數據泄露成LLM應用最大障礙,看實在智能如何用AI Agent破解謎題 從實在RPA Agent智
-
從谷歌推出Gecko到高通引入Llama 2,端側部署成為LLM落地重要方向
▲ 圖片由AI生成 LLM強勢挺進端側,AI大語言模型端側部署如何影響超自動化? 端側部署對大語言模型落地有什么好處?對超自動化有什么影響? 產業上下游齊發力LLM挺進端側,
-
【OFweek維科杯】Nullmax紐勱參與人工智能行業評選
維科杯·OFweek 2023(第八屆)物聯網與人工智能行業年度評選(OFweek 8th IoT & AI Awards 2023)是由高科技行業門戶OFweek維科網主辦,OFweek物聯網、OF
Nullmax紐勱 2023-06-30 -
大模型時代來臨,基于LLM的生成式AI正在快速變革RPA人機交互
▲ 圖片由AI生成 從“人+RPA”到“人+生成式AI+RPA”,LLM如何影響RPA人機交互? 換個角度,從人機交互看LLM如何影響RPA
-
realme驍龍888旗艦在路上 副總裁:顏值爆表
12月18日消息,realme副總裁徐起表示,realme驍龍888旗艦已經在飛奔而來的路上了,敬請期待。據悉,realme首款驍龍888旗艦代號為“Race”。徐起表示,這款產品的潮玩設計非常亮眼,顏值潮玩爆表,手感非常特別,體驗感超級賽高
-
MOTOR AI創始人Roy Uhlmann參評“OFweek 2019‘維科杯’人工智能行業突出貢獻人物獎”
“OFweek2019‘維科杯’(第四屆)中國人工智能行業年度評選”活動由中國高科技行業門戶OFweek維科網、高科會主辦,OFweek人工智能網承辦。
-
標致與Almotive合作 推時速達130km的Level4自動駕駛汽車
據悉,6日,標致汽車制造商PSA集團宣布與Almotive公司合作,并且將在法國高速公路上進行基于AI的四級自動駕駛測試。其中,Almotive公司是一家總部位于匈牙利,致力于開發自動駕駛車輛技術的創業公司。

