美國國家工程院院士、福特技術研究員 Dimitar Filev : 用于智慧出行的智能車輛系統

這些系統已經非常智能,但我們在此基礎上設計了智能用戶界面讓車輛更加定制化以適應不同的用戶。虛擬駕駛系統與交通移動云連接,控制著車輛。因此,定制化和智能化是自動駕駛車輛發展的兩個方向。
接下來討論幾個駕駛汽車中的應用以及福特在自動駕駛中的研究。在汽車控制中有自動動力系統控制、自動轉向控制和半自主懸架系統這些不同的系統經過標定可以實現舒適、常規和運動三種模式之間的切換。

車輛模式的選擇共有27中組合,讓駕駛員在這之間進行選擇是一件困難的事,而智能系統則可以基于道路特點和駕駛員的反應選擇最優的模式,這也是定制化的一個方面。另一個重要的應用是智能巡航控制,它基于速度曲線尋找最優的巡航速度設置點來達到最優化燃油消耗的目標。

通過對數字地圖的分析、交通標志的識別、道路幾何形狀的辨別系統能夠為駕駛者建議最優的加減速、檔位,提供最高效的駕駛模式選擇。

此外,分析駕駛員的行為由此生成評估報告、根據車輛在不同時間頻繁的行車、停車的記錄可以估計出下一個目的地。
福特在自動駕駛領域的布置和發展包括投資了 Argo AI 以及成立了自動駕駛子公司AV LLC,這兩家由福特所有的獨立實體計劃在2021年前完成研發并投入生產。

福特研究自動駕駛采用的是分層級的方法,層級從反射級 Reflexive 到深思級 Reflective。反射級指的是當人們在駕駛時不需要思考而下意識作出的一些舉動,Reflective 則是完全相反的,比如人在高速駕駛的時候會不斷地思考獲取最佳的決策。
分層級方法有三個層級,Decision Making 曾屬于高層規劃,基于強化學習、博弈論方法;稍低一個層級的 Path Planning主要完成避障等場景;沿著規定好的軌跡行駛則是由最后的 Path Following層級使用模型預測控制完成。

Path Planning 部分使用的是Q強化學習方法,強化學習通過最大化累計收益函數Q函數來獲得最佳決策,此處狀態為車輛本身以及相鄰車輛的實時的橫向和縱向位置,行為是車道保持、巡航速度增減以及左右換道。仿真器用來訓練神經網絡擬合決策Q函數,該算法提供了狀態到行動的映射,得到的是貝爾曼方程的實時解。

強化學習近些年變得很火熱尤其是谷歌的 Deepmind 推出了AlphaGo取得了成功,他們提出了 Deep Q Learning(DQN),現在幾乎成了強化學習的標準。在DQN算法中,我們建立了一個人工目標于是得到:
y與Q的差值可類比監督學習中的預測值與標簽的差值,由此得到的時域差用來更新網絡得到最優值。在此基礎上,Deepmind提出了三個主要的改進形成了double DQN,首先是提出適合多層神經網絡的Q函數;第二他們提出一個采樣任意的minibatch的方式處理訓練網絡的數據;第三個則是他們提出了兩個Q函數分別為當前Q函數和目標Q函數來更新網絡,這些改進使得強化學習更加穩定。
然而,當福特直接使用這些方法是發現訓練神經網絡經常容易失敗并且訓練速度很慢。因此他們加入了一些常識性的規則,當發現行為不安全時,將安全的行為加入網絡,對碰撞的判別會混合到采樣隨機minibatch中用于網絡的更新,最終結果取得顯著性效果。

在強化學習中,應該不僅僅依賴于對數據這些短期性的經驗的學習,一些常識性的長期經驗規則的使用也很重要。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













