南京新一代人工智能研究院孫明俊:AI芯片評測非一日之功,需要AI企業多參與
AI芯片評測工具,引導規范專用芯片市場
“為專用的芯片設立一個基準測試是非常重要的工作”孫明俊在鎂客網的采訪中再三強調了測試平臺在整個AI產業發展中的重要性和關鍵性。“這是產業鏈中不可或缺的一個環節。特別是在產業發展的初期,技術路線尚未明確的情況下,一個好的基準測試應該做到的是樹立清晰的指標技術競爭體系,這即可以幫助企業快速進步,同時也客觀反映當前產品現狀,一個行業如果充斥著太多魚龍混雜的產品,就很難走下去。”
所以,必須有個第三方中立的機構去防止這個領域出現劣幣驅逐良幣的現象。
據孫明俊介紹,AIIA DNN benchmark V0.5測試主要面向端側,旨在客觀反映具有深度神經網絡加速能力的處理器在完成推斷任務時的性能。V0.5版本的評估工具基于Android/Linux系統,支持測評的機器學習訓軟件框架包括TensorFlow/Caffe等,已經完成的移動端適配環境有HiAI /MACE/ SNPE/TensorFlow Lite/Tengine。
在今年3月舉辦的“AI in 5G——引領新時代論壇”上,研究院發布了首輪的評估結果,包含四大典型場景和兩大類評測指標。評測場景包括圖像分類、目標檢測、超分辨率、分割網絡;評測指標則包括速度(fps)和算法性能,算法性能指標涉及如top1 、top5、mAP、mIoU、PSNR等。
談及當前的AI基準測試,除了AIIA之外,阿里、寒武紀以及百度均有動作:阿里在去年的云棲大會上推出了AI Matrix;中科院計算所、寒武紀、科大訊飛、京東、銳迪科、AMD等六家則是攜手推出BenchIP。國外的MLPerf也于去年5月由谷歌牽頭聯合全球各大科技公司與高校開展相關基準測量工具研究。
當被問及AIIA的評測工具相較于其他基準測試工具的優勢,孫明俊強調,“我們沒有產品傾向性,是非常中立且不帶產品色彩的獨立第三方測試。”
值得一提的是,孫明俊也強調AIIA DNN benchmark是深度學習處理器領域首次區分整型和浮點對比的Benchmark。
AI芯片評測非一日之功,開源工具鼓勵企業多參與
雖然AI芯片評測工具已經推出,但是考慮到專用芯片的復雜性,也給評估工作帶來一些困難。
“我們面臨的一個很大的問題是適配,比如TensorFlow/Caffe適配到高通、海思都要做大量的工作,但是以前的通用CPU評測就不存在這個問題。”
孫明俊表示適配的難度之外,由于芯片上搭載的場景也非常多,所以需要測試的場景相應也會很多。另外延遲、帶寬、能耗也都要納入考慮范圍,再加上各種神經網絡模型有不同參數,不同參數下又有不同的輸出曲線,所以測試基準工具也得不斷地迭代下去。
雖然有很多企業也在做AI芯片的基準測試,但是整個業內似乎還缺少統一的標準。對此,孫明俊解釋道,“AI基準測試之所以還沒有任何一家企業被公認為標準的行業測試體系,其原因就在于人工智能處理器的多樣化,處理器的尺寸、功能、構架、制程不同,應用的領域、范圍、特定場景不同,也就導致了人工智能處理器的復雜化。”
而評測體系如果想要建立好,就必須要把所有處理器可能遇到的場景和問題考慮進去。這點也正是行業難點之所在。
所以為了吸引更多的企業參與到專用芯片測試中,目前DNN benchmark V0.5評測工具已經在Github上開源。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













