VLM
-
智譜GLM-5V-Turbo“擦槍走火”,國產(chǎn)多模態(tài)智能體戰(zhàn)爭一觸即發(fā)
在國產(chǎn)大模型的激烈競爭中,智譜的GLM系列一直掌握著一張極具商業(yè)價(jià)值的王牌:極強(qiáng)的代碼能力。 隨著AI的主要形式從大語言模型轉(zhuǎn)向智能體,行業(yè)競爭進(jìn)入下半場,開發(fā)者和開發(fā)生態(tài)是付費(fèi)意愿最強(qiáng)的群體。 但是
-
什么是VLM?為什么它對(duì)自動(dòng)駕駛很重要?
VLM,即視覺語言模型,簡單理解下,其就是把“看見的東西”和“說出來的話”放在同一個(gè)腦子里理解的模型。我們平時(shí)把相機(jī)拍到的畫面交給視覺模型去做檢測、分割、深度估計(jì)這些任務(wù),語音或文本交給語言模型去處理
-
GLM-5架構(gòu)細(xì)節(jié)浮出水面:DeepSeek仍是繞不開的門檻
離春節(jié)不到一周,過去兩年的經(jīng)驗(yàn)告訴我們,國產(chǎn)AI新產(chǎn)品的爆發(fā)期又要來了。 Kimi K2.5在OpenRouter上一騎絕塵,Minimax也在官網(wǎng)上隱隱約約透露出M2.2的版本代號(hào)。 大家等得很焦急
-
視頻理解大模型覺醒!Video-o3發(fā)布:像偵探一樣主動(dòng)搜尋關(guān)鍵幀,登頂Video-Holmes!
作者:Xiangyu Zeng等 解讀:AI生成未來 亮點(diǎn)直擊 Video-o3,一個(gè)創(chuàng)新的框架,它通過迭代地發(fā)現(xiàn)顯著的視覺線索、對(duì)關(guān)鍵片段進(jìn)行細(xì)致檢查以及在收集到足夠證據(jù)時(shí)自適應(yīng)終止搜索過程,解決了
-
已有VLM,自動(dòng)駕駛為什么還要探索VLA?
自動(dòng)駕駛技術(shù)正處于發(fā)展的轉(zhuǎn)折點(diǎn)。過去十幾年間,行業(yè)長期依賴模塊化的技術(shù)路徑,即將駕駛?cè)蝿?wù)拆解為感知、預(yù)測、規(guī)劃和控制四個(gè)獨(dú)立環(huán)節(jié)。這種結(jié)構(gòu)雖然清晰,但在面對(duì)突發(fā)狀況時(shí)(長尾場景),會(huì)因規(guī)則覆蓋不足而表
-
智譜敲鐘,唐杰亮劍:GLM-5 將至,全面回歸基座
月 8 日,全球首家以通用人工智能(AGI)基座模型為主營業(yè)務(wù)的上市公司——?智譜AI(股份代號(hào):02513.HK)在香港聯(lián)合交易所主板掛牌。 其發(fā)行價(jià) 116.20 港元,開盤價(jià) 120 港元,收市
智譜敲鐘 2026-01-09 -
阿里通義開源圖像編輯模型 Qwen-lmage-Edit-2511:提升生成人物的一致性
剛剛,阿里通義宣布開源 Qwen-Image-Edit-2511。 這是在 Qwen-Image-Edit-2509 基礎(chǔ)上的增強(qiáng)版本,包含多項(xiàng)改進(jìn): 減輕圖像漂移 提升人物一致性 集成 LoRA 能
阿里通義 2025-12-25 -
為國爭光!智譜GLM-4.7橫掃全球開源模型,超越GPT5.2
智譜又為國爭光了!智譜正準(zhǔn)備在港交所上市,即將成為全球大模型第一股。同時(shí),發(fā)布了「GLM-4.7」模型。GLM-4.7最驚艷的是編程能力,在國產(chǎn)模型中排名第一。放眼全球,也是橫掃所有開源模型,甚至評(píng)分
智譜GLM-4.7 2025-12-25 -
智譜新一代編碼模型 GLM-4.7 來襲:樹立開源新標(biāo)準(zhǔn)
近日,智譜 AI 發(fā)布新一代旗艦 AI 模型 GLM-4.7。 就在前不久,智譜推出的 GLM-4.5 在智能體、推理和編碼(ARC)任務(wù)中均取得了優(yōu)異的性能,在 TAU-Bench、AIME 24
智譜 2025-12-23 -
智譜 AutoGLM 開源:推動(dòng) AI 手機(jī)變革
12 月 9 日,智譜 AI 開源其核心 AI Agent 模型 AutoGLM,能夠“看懂”手機(jī)屏幕、模擬真人進(jìn)行點(diǎn)擊、滑動(dòng)和輸入操作。 此時(shí)距離字節(jié)跳動(dòng)“豆包手機(jī)”引爆市場僅過去一周,那款能跨應(yīng)用
智譜 2025-12-11 -
Anthropic 論文指出:少量樣本會(huì)使任何規(guī)模的 LLM “中毒”
近日,Anthropic Alignment Science 團(tuán)隊(duì)發(fā)現(xiàn),只需 250 份惡意文檔即可在大語言模型(LLM)中產(chǎn)生 “backdoor“ 漏洞——無論是多大的模型規(guī)模或訓(xùn)練數(shù)據(jù)。 盡管
Anthropic 2025-11-17 -
Meta 與牛津大學(xué)合作論文:從語言預(yù)訓(xùn)練中揭開 LLM 視覺先驗(yàn)的起源
大型語言模型 (LLM) 盡管僅基于文本進(jìn)行訓(xùn)練,卻意外地能夠發(fā)展出豐富的視覺先驗(yàn)。這些先驗(yàn)使得模型能夠利用相對(duì)少量的多模態(tài)數(shù)據(jù)來解鎖潛在的視覺能力,從而完成視覺任務(wù)。在某些情況下,甚至無需任何圖像即
Meta 2025-11-17 -
LLM 在字符級(jí)文本處理方面越來越好
近日,一篇博客講述了 LLM 在處理字符級(jí)文本時(shí)的能力提升。 作者表示,他一直在測試最新一代大型語言模型處理自然語言的能力,特別是字符計(jì)數(shù)、句子中的字符操作以及編碼和密碼解析。令人驚訝的是,與前幾代
LLM 2025-11-14 -
Anthropic 新論文:LLM 涌現(xiàn)出的內(nèi)省跡象
了解人工智能系統(tǒng)是否真正具備內(nèi)省能力,這將有助于理解其推理過程并調(diào)試行為問題。 Anthropic 的最新研究表明,目前的 Claude 模型具備一定程度的內(nèi)省意識(shí),并且能夠控制自身的內(nèi)部狀態(tài)。雖然種
Anthropic 2025-11-14 -
首個(gè)基于LLM的開源音頻大模型!階躍星辰重磅開源Step-Audio-EditX:P聲音如此簡單!
作者:Chao Yan等 解讀:AI生成未來 亮點(diǎn)直擊 首個(gè)開源的 LLM 音頻編輯模型:Step-Audio-EditX,首個(gè)基于大語言模型(LLM)的開源音頻模型,不僅擅長表現(xiàn)力豐富和可迭代的音頻
-
字節(jié) Seed 團(tuán)隊(duì)發(fā)布循環(huán)語言模型 Ouro:LoopLM 架構(gòu)引人注目
部署擁有數(shù)千億參數(shù)的模型需要龐大的基礎(chǔ)設(shè)施,這會(huì)增加延遲和成本,并限制其可用性。 這個(gè)時(shí)候,參數(shù)效率就變得至關(guān)重要。研究人員探討,如何在固定的參數(shù)預(yù)算內(nèi)實(shí)現(xiàn)更優(yōu)的模型性能。 為了實(shí)現(xiàn)這種參數(shù)效率,目前
字節(jié)跳動(dòng) 2025-11-04 -
自動(dòng)駕駛中常提的VLM是個(gè)啥 ?與VLA有什么區(qū)別?
自動(dòng)駕駛車輛要在復(fù)雜多變的道路環(huán)境中安全行駛,不僅需要“看見”前方的車輛、行人和路面標(biāo)志,還需要“讀懂”交通標(biāo)識(shí)上的文字提示、施工告示牌和乘客的語言指令。之前和大家討論過VLA(相關(guān)閱讀:自動(dòng)駕駛中常
-
聊聊MoA(混合智能體架構(gòu)):如何激發(fā)LLM潛力并掀起語言模型協(xié)作革命?
全文約 3500 字,預(yù)計(jì)閱讀時(shí)間約 9 分鐘 近年來,大型語言模型(LLMs)在自然語言處理領(lǐng)域掀起了一場風(fēng)暴,從對(duì)話生成到復(fù)雜任務(wù)推理,它們的表現(xiàn)令人驚嘆。然而,單個(gè)模型的性能總有瓶頸,訓(xùn)練成本高昂且資源需求巨大
-
OpenAI推出新一輪企業(yè)級(jí)功能,強(qiáng)化GPT-4 Turbo LLM和其他模型
(本篇文章共884字,閱讀時(shí)間約1分鐘) 圖源:互聯(lián)網(wǎng) OpenAI宣布了其面向API客戶的企業(yè)級(jí)功能擴(kuò)展,進(jìn)一步豐富了其Assistants API,并引入了新工具,旨在增強(qiáng)安全性和管理控制,以及更有效地管理成本
-
技術(shù)創(chuàng)新:蘋果在閃存上存儲(chǔ)大型語言模型(LLM)引領(lǐng)未來AI發(fā)展
(本篇文篇章共1135字,閱讀時(shí)間約1分鐘) 2023年12月22日,據(jù)多家媒體報(bào)道,蘋果正積極探索在閃存上存儲(chǔ)大型語言模型(LLM)的技術(shù)創(chuàng)新,并計(jì)劃將其引入iPhone、iPad和Mac等設(shè)備,以在資源有限的環(huán)境中提高人工智能(AI)的運(yùn)行效率
-
數(shù)據(jù)泄露成LLM應(yīng)用最大障礙,看實(shí)在智能如何用AI Agent破解謎題
大語言模型數(shù)據(jù)泄露堪憂,超自動(dòng)化Agent成解決之道 數(shù)據(jù)泄露成LLM應(yīng)用最大障礙,看實(shí)在智能如何用AI Agent破解謎題 從實(shí)在RPA Agent智
-
從谷歌推出Gecko到高通引入Llama 2,端側(cè)部署成為LLM落地重要方向
▲ 圖片由AI生成 LLM強(qiáng)勢挺進(jìn)端側(cè),AI大語言模型端側(cè)部署如何影響超自動(dòng)化? 端側(cè)部署對(duì)大語言模型落地有什么好處?對(duì)超自動(dòng)化有什么影響? 產(chǎn)業(yè)上下游齊發(fā)力LLM挺進(jìn)端側(cè),
-
【OFweek維科杯】Nullmax紐勱參與人工智能行業(yè)評(píng)選
維科杯·OFweek 2023(第八屆)物聯(lián)網(wǎng)與人工智能行業(yè)年度評(píng)選(OFweek 8th IoT & AI Awards 2023)是由高科技行業(yè)門戶OFweek維科網(wǎng)主辦,OFweek物聯(lián)網(wǎng)、OF
Nullmax紐勱 2023-06-30 -
大模型時(shí)代來臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互
▲ 圖片由AI生成 從“人+RPA”到“人+生成式AI+RPA”,LLM如何影響RPA人機(jī)交互? 換個(gè)角度,從人機(jī)交互看LLM如何影響RPA
-
realme驍龍888旗艦在路上 副總裁:顏值爆表
12月18日消息,realme副總裁徐起表示,realme驍龍888旗艦已經(jīng)在飛奔而來的路上了,敬請(qǐng)期待。據(jù)悉,realme首款驍龍888旗艦代號(hào)為“Race”。徐起表示,這款產(chǎn)品的潮玩設(shè)計(jì)非常亮眼,顏值潮玩爆表,手感非常特別,體驗(yàn)感超級(jí)賽高
-
MOTOR AI創(chuàng)始人Roy Uhlmann參評(píng)“OFweek 2019‘維科杯’人工智能行業(yè)突出貢獻(xiàn)人物獎(jiǎng)”
“OFweek2019‘維科杯’(第四屆)中國人工智能行業(yè)年度評(píng)選”活動(dòng)由中國高科技行業(yè)門戶OFweek維科網(wǎng)、高科會(huì)主辦,OFweek人工智能網(wǎng)承辦。
-
標(biāo)致與Almotive合作 推時(shí)速達(dá)130km的Level4自動(dòng)駕駛汽車
據(jù)悉,6日,標(biāo)致汽車制造商PSA集團(tuán)宣布與Almotive公司合作,并且將在法國高速公路上進(jìn)行基于AI的四級(jí)自動(dòng)駕駛測試。其中,Almotive公司是一家總部位于匈牙利,致力于開發(fā)自動(dòng)駕駛車輛技術(shù)的創(chuàng)業(yè)公司。
最新活動(dòng)更多 >
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測試
- 高級(jí)日語客戶開發(fā)專員 艾美特電器(深圳)有限公司
- 功能維修 深圳市維爾晶科技有限公司
- 材料研發(fā)工程師 廣州黑格智造信息科技有限公司
- 激光技術(shù)項(xiàng)目總監(jiān) 嘉興艾可鐳光電科技有限公司
- 嵌入式工程師 深圳綠米聯(lián)創(chuàng)科技有限公司
- 業(yè)務(wù)開發(fā)經(jīng)理(J10472) 伯恩光學(xué)(惠州)有限公司
- 管培生 深圳市迪瑞達(dá)自動(dòng)化有限公司
- 銷售業(yè)務(wù)員 永盛昌科技(深圳)有限公司
- 軟測DQE工程師 深圳奧尼電子股份有限公司
- 儲(chǔ)干(技術(shù)類) 珠海科德電子有限公司

