手機(jī)也可以訓(xùn)練視頻識(shí)別模型?麻省理工給您答案!

近日,麻省理工學(xué)院和IBM沃森人工智能實(shí)驗(yàn)室的研究人員開發(fā)了一種新技術(shù),可以在處理能力非常有限的手機(jī)或其他設(shè)備上訓(xùn)練視頻識(shí)別模型。用戶可以上傳任何照片,并編輯建筑物、植物群和固定裝置外觀的工具。視覺識(shí)別作為深度學(xué)習(xí)的最強(qiáng)技能,已經(jīng)成為了計(jì)算機(jī)視覺算法可用來分析醫(yī)學(xué)圖像,使自動(dòng)駕駛汽車成為可能,并驅(qū)動(dòng)人臉識(shí)別的發(fā)展。

通常算法將視頻分割成圖像幀,并在每個(gè)幀上運(yùn)行識(shí)別算法。然后通過觀察對(duì)象在隨后的幀中的變化,將視頻中顯示的動(dòng)作拼接在一起。該方法要求算法“記住”它在每一幀中看到的內(nèi)容,以及它看到這些內(nèi)容的順序。新方法中,算法提取每一幀對(duì)象的基本草圖,并將它們疊加起來。算法可以觀察草圖中物體在空間中的移動(dòng),而不是記住什么時(shí)候發(fā)生了什么。在測(cè)試中,研究人員發(fā)現(xiàn),這種新方法訓(xùn)練視頻識(shí)別模型的速度是現(xiàn)有方法的三倍。它還能通過一臺(tái)小型電腦和照相機(jī)來識(shí)別手勢(shì),這些設(shè)備的電量?jī)H夠給自行車燈照明用。
這項(xiàng)新技術(shù)有助于減少現(xiàn)有計(jì)算機(jī)視覺商業(yè)應(yīng)用中的延遲和計(jì)算成本。它可以通過加速自動(dòng)駕駛汽車對(duì)傳入視覺信息的反應(yīng),讓它們變得更安全。還可以解鎖以前無法實(shí)現(xiàn)的新應(yīng)用,比如讓手機(jī)幫助診斷病人或分析醫(yī)學(xué)圖像。
麻省理工學(xué)院和IBM沃森人工智能實(shí)驗(yàn)室的研究是這一日益增長(zhǎng)的趨勢(shì)的一部分,這種趨勢(shì)將最先進(jìn)的模型縮小到更易于管理的規(guī)模,也為計(jì)算機(jī)視覺領(lǐng)域找到了更多的落地方向。
當(dāng)前計(jì)算機(jī)視覺的應(yīng)用場(chǎng)景主要有以下幾個(gè)方向:
人臉識(shí)別
相關(guān)數(shù)據(jù)顯示人臉識(shí)別是人工智能計(jì)算機(jī)視覺領(lǐng)域中最熱門的應(yīng)用。人臉識(shí)別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析,我國(guó)的人臉識(shí)別產(chǎn)業(yè)的需求旺盛,需求推動(dòng)導(dǎo)致企業(yè)敢于投入資金。目前,該技術(shù)已具備大規(guī)模商用的條件,未來三到五年將高速增長(zhǎng)。而今年,這一技術(shù)有望在金融與安防領(lǐng)域迎來大爆發(fā)。
代表企業(yè):曠視科技、依圖科技、商湯科技、極鏈科技、云從科技等。
視頻監(jiān)控
視頻監(jiān)控分析是人工智能計(jì)算機(jī)視覺領(lǐng)域中第二大熱門應(yīng)用。 人工智能技術(shù)可以對(duì)結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進(jìn)行快速檢索、查詢。這項(xiàng)應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動(dòng)的交通樞紐,該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。
視頻監(jiān)控領(lǐng)域盈利空間廣闊,商業(yè)模式多種多樣,既可以提供行業(yè)整體解決方案,也可以銷售集成硬件設(shè)備。將技術(shù)應(yīng)用于視頻及監(jiān)控領(lǐng)域在人工智能公司中正在形成一種趨勢(shì),這項(xiàng)技術(shù)應(yīng)用將率先在安防、交通甚至零售等行業(yè)掀起應(yīng)用熱潮。
代表企業(yè):商湯科技、曠視科技、依圖科技等。
圖片識(shí)別分析
靜態(tài)圖片識(shí)別應(yīng)用熱度在視覺與圖像領(lǐng)域中排名第三。將人工智能技術(shù)單純用于圖片識(shí)別分析的應(yīng)用企業(yè)數(shù)量并不如預(yù)想的多,可能有以下幾個(gè)方面原因:
1、目前視頻監(jiān)控方向的盈利空間大,眾多企業(yè)的注意力都放在了視頻監(jiān)控領(lǐng)域。
2、人臉識(shí)別屬于圖片識(shí)別的一個(gè)應(yīng)用場(chǎng)景,做人臉識(shí)別的大多數(shù)企業(yè)同時(shí)也在提供圖片識(shí)別服務(wù),但是銷售效果不佳,主要贏利點(diǎn)還在于人臉識(shí)別。
3、圖片識(shí)別大多商用場(chǎng)景還屬于藍(lán)海,潛力有待開發(fā)。
4、圖片數(shù)據(jù)大多被大型互聯(lián)網(wǎng)企業(yè)所掌握,創(chuàng)業(yè)公司數(shù)據(jù)資源稀少。
代表企業(yè):曠視科技、極鏈科技、碼隆科技等。
無人駕駛
隨著汽車的普及,汽車已經(jīng)成為人工智能技術(shù)非常大的應(yīng)用投放方向,但就目前來說,想要完全實(shí)現(xiàn)自動(dòng)駕駛/無人駕駛,距離技術(shù)成熟還有一段路要走。不過利用人工智能技術(shù),汽車的駕駛輔助的功能及應(yīng)用越來越多,這些應(yīng)用多半是基于計(jì)算機(jī)視覺和圖像處理技術(shù)來實(shí)現(xiàn)。
代表企業(yè):縱目科技、Waymo、圖森科技、馭勢(shì)科技、佑駕創(chuàng)新、中天安馳等。
工業(yè)視覺
機(jī)器視覺可以快速獲取大量信息,并進(jìn)行自動(dòng)處理。在自動(dòng)化生產(chǎn)過程中,人們將機(jī)器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域。機(jī)器視覺系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。運(yùn)用在一些危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場(chǎng)合;此外,在大批量工業(yè)生產(chǎn)過程中,機(jī)器視覺檢測(cè)可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。
代表企業(yè):創(chuàng)想智控、凱視佳、拓視覺、帆聲圖像、華睿科技等。
隨著越來越多的人工智能研究被轉(zhuǎn)化為應(yīng)用,對(duì)更小模型的需求將會(huì)增加。國(guó)內(nèi)也在計(jì)算機(jī)視覺領(lǐng)域加大了技術(shù)投資力度,誕生了諸如商湯科技、曠視科技、依圖科技、極鏈科技等優(yōu)秀的人工智能初創(chuàng)企業(yè)。未來,這些優(yōu)秀的人工智能企業(yè)也會(huì)尋找到更多的落地場(chǎng)景,繼續(xù)推動(dòng)計(jì)算機(jī)視覺這一技術(shù)在應(yīng)用場(chǎng)景快速落地。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專題
- 1 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進(jìn)展總結(jié)
- 5 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 6 熱點(diǎn)丨AI“瑜亮之爭(zhēng)”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號(hào),還繼續(xù)扣錢!
- 8 2026,人形機(jī)器人只贏了面子
- 9 DeepSeek降價(jià)90%:價(jià)格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





