美國國家工程院院士、福特技術(shù)研究員 Dimitar Filev : 用于智慧出行的智能車輛系統(tǒng)
當(dāng)前智能駕駛汽車算法和解決方案面臨的挑戰(zhàn)如下:
1、能學(xué)習(xí)特定駕駛員和環(huán)境、擁有最少的手工標(biāo)定和標(biāo)簽數(shù)據(jù)的車載或者云平臺的實時解決方案;
2、相比較監(jiān)督式學(xué)習(xí)更傾向于無監(jiān)督和半監(jiān)督強化學(xué)習(xí);
3、包含認(rèn)知信息和物理模型的混合AI算法;
4、AI算法可解釋、可驗證;
5、擁有魯邦特性并且可以自評估;
6、維護(hù)成本低。
下面介紹一些有效的解決方案,每當(dāng)我們遇到一個復(fù)雜系統(tǒng)時,我們會努力學(xué)習(xí)用一些復(fù)雜函數(shù)去近似這個系統(tǒng)例如神經(jīng)網(wǎng)絡(luò),這是其中一種方法。另一種方法使用許多簡單的小的子系統(tǒng)進(jìn)行組合模擬復(fù)雜系統(tǒng)。

非監(jiān)督的演化聚類算法可以實現(xiàn)實時的學(xué)習(xí)對系統(tǒng)的狀態(tài)空間進(jìn)行預(yù)測,一個重要的例子是對引擎特性具有自適應(yīng)標(biāo)定和控制能力的在線空時濾波器。混合馬爾科夫模型對于目的地和路徑的預(yù)測也是非常有效的。神經(jīng)網(wǎng)絡(luò)的可解釋性是近年來的熱點話題,強化學(xué)習(xí)可以使用神經(jīng)網(wǎng)絡(luò)將狀態(tài)空間映射到行為空間,這是個非線性映射。這種非線性映射可不可以使用其他的映射來近似并且時刻解釋的呢?

基于強化學(xué)習(xí)的控制器將狀態(tài)空間映射到行為空間,而使用模糊控制器基于規(guī)則的模型則是一種通用的近似器,通過將強化學(xué)習(xí)Agent仿真為黑盒子動態(tài)系統(tǒng),它可以被有限級的“if-then”規(guī)則近似和解釋。以強化學(xué)習(xí)車輛跟蹤控制為例,跟車問題基本是是一種自適應(yīng)巡航問題,后車需要保持與前車的安全距離、控制好各自的車速以及加速度,傳統(tǒng)方法中車速控制器基于吉布斯分布、加速度控制器使用智能駕駛模型(Intelligent Driving Model,IDM)建模,福特使用強化學(xué)習(xí),分別建立速度、加速度以及距離的獎勵函數(shù),最大化獎勵函數(shù)得到的結(jié)果達(dá)到甚至超過傳統(tǒng)方法。

在得到加速度結(jié)果后,他們使用聚類算法以相對速度和相對距離作為輸入,預(yù)測加速度作為輸出,對數(shù)據(jù)進(jìn)行聚類來近似強化學(xué)習(xí)控制器,強化學(xué)習(xí)器被近似為可解釋的PI控制器的非線性組合的形式,組合系數(shù)為各數(shù)據(jù)點到聚類中心距離負(fù)值的Softmax函數(shù)。



擬合效果基本達(dá)到原始強化學(xué)習(xí)其的性能,但是推理時間從強化學(xué)習(xí)器的0.3ms降低到了非線性組合的0.13ms。最后,對演化系統(tǒng)地總結(jié)如下:
1、使用演化聚類和核粒化的方法講一個復(fù)雜系統(tǒng)實時分解為多個相互重疊的子區(qū)域;
2、實時同步學(xué)習(xí)系統(tǒng)架構(gòu)以及局部子系統(tǒng)的參數(shù);
3、對具有多個操作模式和多元化行為的系統(tǒng)實時建模;
4、特定的機器學(xué)習(xí)技巧(無監(jiān)督聚類與監(jiān)督學(xué)習(xí)的組合);
5、反映人類從現(xiàn)實中學(xué)習(xí)、總結(jié)、管理知識的能力。
我們在此提到的演化系統(tǒng)是多個子系統(tǒng)的組合,它的功能非常強大,包含了監(jiān)督學(xué)習(xí)方法和非監(jiān)督學(xué)習(xí)方法,可應(yīng)用在實時的無人駕駛大數(shù)據(jù)處理中。大數(shù)據(jù)、物聯(lián)網(wǎng)以及AI技術(shù)的快速發(fā)展為智能汽車提供了更多的解決方案,AI算法則需要具備更多的人性化、自適應(yīng)和最小標(biāo)定以適應(yīng)嵌入式實施的需求也很廣泛,智能汽車的發(fā)展為傳統(tǒng)AI算法的改進(jìn)提供了新的發(fā)展方向,傳統(tǒng)AI算法應(yīng)與基于規(guī)則的系統(tǒng)、認(rèn)知知識和基于第一性原理的模型相結(jié)合,此外,認(rèn)知模型對統(tǒng)計機器學(xué)習(xí)的近似使得傳統(tǒng)機器學(xué)習(xí)算法變得可解釋和性能的可升。
以上就是我的報告,非常感謝大家
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計師慌了
- 3 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進(jìn)展總結(jié)
- 5 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













