準過GPS!劍橋SegNet影像識別技術 助無人機自動導航

現在無人機之所以容易操作,全因內藏大量測量儀器,輔助航拍玩家修正航道。劍橋大學的電算視像及機械組成功研發出 SegNet 和 Visual Localisation 技術,能夠即時辨認道路上的物件和所在地點,號稱準確度高於現有的雷達和 GPS 定位系統,為無人機和無人駕駛汽車提供更理想的自動導航方案。

可代替 GPS 與雷達

兩種技術均為無人車輛而設,透過分析影像和複雜計算,協助乘客沿途定位和辨別路面障礙,得以取代 GPS 系統和雷達、光達等感應器,免除價格高昂、體積較大、易受干擾等缺點。同樣技術亦可應用於其他自動機械,或是內置於相機,用作導航和提供現場資訊。

  • Visual Localisation:精於辨認影像內的地點和方向,曾於劍橋中心的國王街的 1 公里路段測試,位置和方向誤差分別低至 2 米和 3 度;
  • SegNet:擅長即時辨別道路上的物件,包括:建築物、行人、馬路、行人路、樹木等 12 種,以每點像素計,準確度超過 90%。SegNet 曾經走出實驗室,在城市道路和高速公路實地測試,具潛力應用於警告系統和防撞技術,惟未足以完全取代人手操作車輛。

SegNet 懂得自學和進步

以上技術均採用「深度卷積編碼及解碼結構」(deep convolutional encoder-decoder architecture),是一種分層分類的電算分析方法,常用於圖像辨識。這些電腦之所以懂得分析影像內容,全因受過長時期「訓練」。以辨別物件的 SegNet 為例,團隊先要人手標籤 5,000 幅照片上每一顆像素的內容,再把這些標記好的照片輸入,讓 SegNet 熟識每個項目的特徵,據悉學習過程需時 2 日。

目前 SegNet 已能辨識道路和市區建築物,惟暫未能處理郊外、荒野、雪地等地理環境。團隊把 SegNet 和 Visual Localisation 在網上公開,除了是向公眾示範有關技術外,也是為了收集「學習材料」,讓機械可接受更多「訓練」。以上基於深度卷積編碼及解碼結構的圖像分析技術及應用詳情,請參閱有關論文

▼ 劍橋大學講解教導機械看見物件的方法

想第一時間收到無人機的最新情報?立即加入我們的Facebook粉絲團吧!
想要看更多像這樣的無人機新聞?訂閱我們的電子報!



 

作者:伍彤

喜歡真摯而持平的心得,「不必分數我更愛意想不到」。熱愛日常生活科技,最近對航拍興趣特濃,急不及待要與人分享新知和想法。耐性比頭髮短。

 

作者:伍彤

喜歡真摯而持平的心得,「不必分數我更愛意想不到」。熱愛日常生活科技,最近對航拍興趣特濃,急不及待要與人分享新知和想法。耐性比頭髮短。