免费久久国产&夜夜毛片&亚洲最大无码中文字幕&国产成人无码免费视频之奶水&吴家丽查理三级做爰&国产日本亚欧在线观看

<samp id="okmuc"><pre id="okmuc"></pre></samp>

當前位置： OFweek 人工智能網 > 機器學習 > 正文

強化學習在無人機項目中的應用

2021-05-28 14:26

強化學習可以解決什么問題？

這張圖是2016年引起熱議人工智能的AlphaGo事件，AlphaGo打敗了圍棋世界冠軍李世石。AlphaGo作為一個智能體，就使用了深度強化學習技術進行了訓練。在這一場景中，狀態就是每一時刻的棋盤，行為就是下棋的動作，而評價系統會根據每一步棋的價值返回獎勵。完成訓練的AlphaGo在與李世石的比賽中，根據當前的棋盤選擇最優的行為“下一步棋”，最終擊敗了李世石，這就是強化學習的一個具體應用。

智能體在不斷與環境交互的過程中，會保留上次學習過的經驗，下一輪與環境交互時，會選擇獎勵更大的行為，一般用來解決“智能體與環境交互時通過決策選擇最好的行為”的這一類問題。

具體到現在的應用場景很廣泛：

工業應用：機器人作業；

金融貿易應用：預測未來銷售額、預測股價等；

自然語言處理（NLP）應用：文本摘要、自動問答、機器翻譯等；

醫療保健應用：提供治療策略；

工程中的應用：數據處理、模型訓練；

推薦系統中的應用：新聞推薦、時尚推薦等；

游戲中的應用：AlphaGo、AlphaZero等；

廣告營銷中的應用：實時競價策略；

機器人控制中的應用：機械臂抓取物體等。

強化學習在無人機項目中的應用

強化學習在無人機項目中的應用越來越廣泛，以下簡單介紹下深蘭科學院目前對該項目的研究內容：簡單的軌跡規劃，以及當前主流的兩個研究方向：軌跡規劃、運輸懸掛。后續團隊的目標也是基于當前項目，進行這兩個主流方向的研究。

1、簡單軌跡規劃

本項目研究的是無人機圓周軌跡運動規劃。在這一簡單任務中，需要讓無人機飛到指定位置懸停，然后一直做圓周運動。簡單分析這一任務，智能體就是無人機，行為就是對無人機的旋翼發出操作指令，狀態就是當前無人機所處的位置以及無人機的性能，獎勵則是根據無人機是否沿著圓周運動的軌跡判斷。

具體到深度強化學習的框架，采用的是on－policy的PPO框架，之后也會用off－policy的DDPG、SAC框架進行比對效果。

2、復雜軌跡規劃

在許多機器人任務中，如無人機比賽，其目標是盡可能快地穿越一組路徑點。這項任務的一個關鍵挑戰是規劃最小時間軌跡，這通常通過假設路徑點的完美知識來解決。這樣所得到的解決方案要么高度專用于單軌道布局，要么由于簡化平臺動力學假設而次優，方案不具有可擴展性。

視頻是使用深度強化學習和相對門觀察的方法，自適應地進行隨機軌道布局的效果展示，與傳統的假設路徑點軌道方法相比，基于軌跡優化的方法顯示出了顯著的優勢。在仿真環境和現實世界中的一組軌道上進行了評估，使用真實四旋翼無人機實現了高達17米／秒的飛行速度。

3、懸掛運輸

第二個主流方向是懸掛運輸，運輸懸掛的有效載荷對自動駕駛飛行器來說是一個挑戰，因為有效載荷會對機器人的動力學造成重大和不可預測的變化。這些變化可能會導致飛行性能不理想，甚至會導致災難性故障。視頻是運用自適應控制與深度強化學習在這一問題上的效果展示，可以看出這種方法在此任務表現良好。

<上一頁 1 2

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新活動更多

即日-5.20
立即下載>> 【限時免費】物理場仿真助力生物醫學領域技術創新
精彩回顧
立即查看>> 【直播】智測未來·2026海克斯康春季產品創新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國機器人產業大會
精彩回顧
立即查看>> 維科杯· OFweek 2025中國機器人行業年度評選
精彩回顧
立即查看>> 【在線會議】液冷服務器信號完整性及冷卻液關鍵電參數測試

一周熱點月點擊榜

企業服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發工程師福建省/福州市
銷售總監（光器件）北京市/海淀區
激光器高級銷售經理上海市/虹口區
光器件物理工程師北京市/海淀區
激光研發工程師北京市/昌平區
技術專家廣東省/江門市
封裝工程師北京市/海淀區
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號

<strike id="iuc2s"></strike>

<strike id="iuc2s"><s id="iuc2s"></s></strike>

<sup id="iuc2s"></sup>

<samp id="iuc2s"><tbody id="iuc2s"></tbody></samp>