從錯誤中學習!科學家讓無人機碰撞1.15萬次以學習如何避開障礙

卡內基梅隆大學(Carnegie Mellon University,CMU)機器人學院的3名科學家Dhiraj Gandhi、Lerrel Pinto與Abhinav Gupta近日發表了一篇論文「從碰撞中學習飛行」(Learning to Fly by Crashing),描述的是如何讓無人機透過碰撞而非避免碰撞來學習飛行,在經過1.15萬次的碰撞之後,這款無人機的表現勝過了基於深度預測的方法,且在某些環境中與飛行專家的能力相當。

一般而言,自駕車或無人機的訓練多半根據人類駕駛經驗來訂定自駕政策,但CMU的研究人員反其道而行,他們讓無人機以「自我監督」(self-supervised)的全程自我學習模式,在40小時內於20種不同的室內環境中自行訓練,總計碰撞了1.15萬次,創造了號稱是迄今最大的無人機碰撞資料集。當然,他們用來測試的無人機是以便宜的材質打造,以減少碰撞之後的損壞成本,

該無人機配備了一個前方相機與兩個側邊相機,在碰撞之後會將飛行良好時與即將碰撞之際的影像回饋到卷積神經網路(Convolutional Neural Networks)架構,據此進行學習,在擁有1.15萬次的碰撞經驗後,無人機已可在既狹窄又凌亂的空間中穿越各種障礙物,對白色牆壁與玻璃門的辨識能力也優於單眼的深度估計。

科學家指出,在訓練無人機的方法中,若只仰賴少量的專家經驗可能會造成「過適」(overfit)的狀況,若是採用模擬,則仍存在模擬與現實世界中的感知差異,而市場之所以避免使用大量的真實數據都是因為擔心碰撞。

此一數據集同時集結了負面(碰撞)與正面的飛行資料,以作為無人機的導航學習材料,除了學習效果不錯之外,其他科學家也認為若能在不擔心損壞的情況下讓機器完全自動化地自我學習真是太省事不過了。

原文來自 iThome