Holopix50k發(fā)布: 最多最豐富的雙目數(shù)據(jù)集大幅提升多個(gè)相關(guān)任務(wù)性能?
由于這一數(shù)據(jù)集主要集中于針對(duì)水平排列相機(jī)的立體視覺(jué),而在垂直方向上的視差會(huì)影響立體視覺(jué)匹配算法的性能,需要去除具有垂直視差的圖像。在這樣的篩選后剩下約60k的圖像對(duì)。

垂直視差造成的匹配性能下降,c和d分別是垂直方向上有2像素和5個(gè)像素視差下的匹配結(jié)果。
由于絕大多數(shù)照片是由Hydrogen One拍攝的,其后攝基線只有12mm前攝則為5mm,場(chǎng)景中包含的視差信息應(yīng)該是處于有限范圍內(nèi)的,所有研究人員通過(guò)視差分析模型去除了包含極端誤差的圖像和立體特征較差的圖像對(duì),最終得到了約50k的立體視覺(jué)圖像對(duì)。
為了探索數(shù)據(jù)集的分布,研究人員利用在coco數(shù)據(jù)集上預(yù)訓(xùn)練的Mask-RCNN目標(biāo)檢測(cè)器對(duì)每一對(duì)圖像的左圖來(lái)進(jìn)行檢測(cè)分析,結(jié)果表明其中包含了大量豐富的常見(jiàn)物體,由于這是社交媒體平臺(tái),所以其中會(huì)包含很多的人物,共檢測(cè)到了約21k個(gè)人體實(shí)例。此外數(shù)據(jù)集中還包含了風(fēng)景和肖像攝影,為數(shù)據(jù)集貢獻(xiàn)了可觀的多樣性。

Holopix中物體的詞云分布包含了很多常見(jiàn)的物體
定量測(cè)評(píng)
為了展現(xiàn)數(shù)據(jù)集的優(yōu)勢(shì),研究人員利用熵、BRISQUE、SR-metric和ENIQA等指標(biāo)比較了Holopix與現(xiàn)有的數(shù)據(jù)集,結(jié)果如下表所示 :

除了數(shù)據(jù)集的數(shù)量顯著高于其他數(shù)據(jù)集外,可以看到其具有最高的SR指標(biāo),意味數(shù)據(jù)集的質(zhì)量在人類(lèi)感知下是最高的、熵值第二高意味著圖像中包含的信息也很豐富。
研究人員將數(shù)據(jù)集按照分辨率分為了HD(720p)和SD(360p)兩個(gè)子集,其指標(biāo)在數(shù)據(jù)集比較中都處于top2的范圍內(nèi)。
除了數(shù)據(jù)集本身的比較外,研究人員還利用這一數(shù)據(jù)集重新訓(xùn)練了幾個(gè)關(guān)鍵的立體視覺(jué)任務(wù)模型,都得到了大幅的性能提升。
針對(duì)圖像超分辨任務(wù),采用了PASSRNet模型進(jìn)行4x圖像超分辨,在Holopix50k數(shù)據(jù)集上訓(xùn)練的結(jié)果與Flickr1024上的結(jié)果相比具有非常大的性能提升。下表顯示了隨著訓(xùn)練數(shù)據(jù)集的增加,得到的模型在不同測(cè)試集上的結(jié)果也有著顯著提升。

下圖可以看到基于這一大型數(shù)據(jù)集訓(xùn)練的結(jié)果要明顯優(yōu)于Flickr1024數(shù)據(jù)集的結(jié)果,細(xì)節(jié)得到更為豐富的重建:

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專(zhuān)題
- 1 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進(jìn)展總結(jié)
- 5 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 6 熱點(diǎn)丨AI“瑜亮之爭(zhēng)”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤(pán):9秒刪庫(kù)跑路,全員被封號(hào),還繼續(xù)扣錢(qián)!
- 8 2026,人形機(jī)器人只贏了面子
- 9 DeepSeek降價(jià)90%:價(jià)格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





