“你不溫柔,我不主動”,人機關系究竟要怎么改變呢?
在日常生活之外,多模態交互設備也在應用于工業設備中。比如通過給機器設備搭載機器視覺+傳感器提供安全警告,以及利用機器視覺+故障信號的方式判斷設備問題等。
把不同信號模態整合在一起,實現設備的多維感知,今天正在以比較快的速度來到應用市場。
高精度判斷用戶命令,輸出主動服務;提供實時化、彈性化的體驗,可以說是AI帶來的多模態交互技術放進物聯網世界中的一張鬼牌。
當然了,還是有幾道難關……
按照慣例,最后我們還是要正視任何技術都存在不足。剛剛有一點萌芽的多模態交互+物聯網當然也不例外。
最核心的一個問題,是我們到底靠什么實現多模態協同?
目前來看,無論是家電還是工業設備,實現多模態混合的主要方式還是把不同的傳感源輸入到設備處理中心,啟動一定程序來開啟相應服務。
換句話說,AI模型本身是沒法理解多模態信號的,只是不同的算法啟動不同的開關而已。這種“偽AI多模態”的設備也不是不行,只是在實時化和復雜的推理判斷上會有心無力。
解決方案可能是一種叫做“多模態深度學習”的技術,讓AI智能體本身能夠理解多模態信號,從算法本身就容納聽覺、視覺、傳感信號進行統一思考。這樣可以保證設備高度實時化,并且可以讓設備進行多模態協同學習,真正地“聰明”起來。
這要求在算法上對多維度數據的各自表示、融合、對齊有新的突破,今天我們還只能等待學術界的好消息。
另外一個問題,是今天的多模態交互缺少有效的開發平臺,開發者和企業很難復制這一模式,來進行獨立的物聯網解決方案開發。當然,目前來看這應該僅僅是個時間問題。
與之相對應的,是在缺乏行業標準、開發基礎的前提下,今天開發一個多模態物聯網項目需要大量的人才成本和綜合開發成本。并且缺少芯片、專用傳感器等后端硬件的支撐。這個領域國內有一些芯片和算法公司,但似乎大部分處在做PPT的畫餅階段。
綜合來看,AI帶來的多模態想象力,大概確實可以完成一些物聯網很早就希望實現的東西。但方興未艾的產業局勢,還需要巨頭搭建平臺、優質案例出現、開發者路徑明確等幾個環節才能開啟下一輪風口。
但無論如何,耳聰目明的機器,已經在跑步過來的路上了……
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













