訂閱
糾錯(cuò)
加入自媒體

SLAM +機(jī)器學(xué)習(xí)迎來了“感知時(shí)代”

2020-07-30 15:55
振工鏈
關(guān)注

機(jī)器和深度學(xué)習(xí)的最新進(jìn)展已改進(jìn)了SLAM技術(shù),從而導(dǎo)致地圖的豐富性增加,語義場景理解提高了定位,地圖質(zhì)量和堅(jiān)固性。

最近的危機(jī)使人們?cè)絹碓疥P(guān)注將自動(dòng)機(jī)器人用于實(shí)際利益。我們已經(jīng)看到機(jī)器人,運(yùn)送食物和藥品,甚至對(duì)患者進(jìn)行評(píng)估。這些都是驚人的用例,它們清楚地說明了從現(xiàn)在起機(jī)器人將在我們的生活中發(fā)揮更大作用的方式。

然而,盡管具有所有優(yōu)點(diǎn),但是機(jī)器人自動(dòng)繪制周圍環(huán)境并成功定位自身的能力仍然十分有限。機(jī)器人在計(jì)劃一致的環(huán)境中擅長做特定事情的能力越來越強(qiáng)。但是動(dòng)態(tài),未經(jīng)訓(xùn)練的情況仍然是一個(gè)挑戰(zhàn)。

我興奮的是下一代SLAM(同步定位和地圖繪制),它將使機(jī)器人設(shè)計(jì)人員能夠創(chuàng)造出在各種情況下具有更強(qiáng)的自主操作能力的機(jī)器人。它正在開發(fā)中,并吸引了整個(gè)行業(yè)的投資和興趣。

我們稱其為“感知時(shí)代”,它將機(jī)器和深度學(xué)習(xí)的最新進(jìn)展結(jié)合起來以增強(qiáng)SLAM。通過語義場景理解來增加地圖的豐富度,可以改善定位,地圖質(zhì)量和堅(jiān)固性。

簡化地圖

目前,大多數(shù)SLAM解決方案都從傳感器獲取原始數(shù)據(jù),并使用概率算法來計(jì)算機(jī)器人的位置和地圖。LIDAR是最常用的,但成本越來越低的相機(jī)為增強(qiáng)的地圖提供了豐富的數(shù)據(jù)流。無論使用哪種傳感器,數(shù)據(jù)都會(huì)創(chuàng)建由數(shù)百萬個(gè)3維參考點(diǎn)組成的地圖。這些使機(jī)器人可以計(jì)算其位置。

問題在于這些3D點(diǎn)云沒有意義-它們只是機(jī)器人計(jì)算其位置的空間參考。不斷處理所有這些數(shù)百萬個(gè)點(diǎn)也是機(jī)器人處理器和內(nèi)存的沉重負(fù)擔(dān)。通過將機(jī)器學(xué)習(xí)插入到處理“流水線”中,我們既可以提高這些地圖的實(shí)用性,又可以簡化它們。

全景分割

技術(shù)使用機(jī)器學(xué)習(xí)將來自攝像機(jī)供稿的像素集合分類為可識(shí)別的“對(duì)象”。例如,代表墻壁的數(shù)百萬個(gè)像素可以歸類為單個(gè)對(duì)象。此外,我們可以使用機(jī)器學(xué)習(xí)來預(yù)測3D世界中這些像素的幾何形狀和形狀。因此,代表一堵墻的數(shù)百萬個(gè)3D點(diǎn)可以全部匯總到一個(gè)平面中。

數(shù)以百萬計(jì)的代表椅子的3D點(diǎn)都可以匯總到帶有少量參數(shù)的形狀模型中。將場景分解為2D和3D的不同對(duì)象可以降低處理器和內(nèi)存的開銷。

令我興奮的是下一代SLAM,它將使機(jī)器人設(shè)計(jì)人員能夠創(chuàng)造出在各種情況下能夠自主運(yùn)行的機(jī)器人。它正在開發(fā)中,并吸引了整個(gè)行業(yè)的投資和興趣。

增加理解

以及簡化地圖,此方法為進(jìn)一步了解機(jī)器人的傳感器捕獲的場景提供了基礎(chǔ)。通過機(jī)器學(xué)習(xí),我們能夠?qū)鼍爸械膯蝹(gè)對(duì)象進(jìn)行分類,然后編寫代碼來確定應(yīng)如何處理它們。

這種新興功能的首要目標(biāo)是能夠從地圖上移除包括人在內(nèi)的移動(dòng)物體。為了有效導(dǎo)航,機(jī)器人需要引用場景的靜態(tài)元素。不會(huì)移動(dòng)的東西,因此可以用作可靠的定位點(diǎn)。機(jī)器學(xué)習(xí)可用于教導(dǎo)自主機(jī)器人場景中哪些元素用于定位,哪些元素不作為地圖的一部分或?qū)⑵浞诸悶橐苊獾恼系K。將場景中的對(duì)象的全景分割與基礎(chǔ)地圖和位置數(shù)據(jù)相結(jié)合,將很快大大提高機(jī)器人SLAM的準(zhǔn)確性和功能。

感知對(duì)象

下一個(gè)激動(dòng)人心的步驟將是基于此分類,以增加對(duì)單個(gè)對(duì)象的理解水平。機(jī)器學(xué)習(xí)作為SLAM系統(tǒng)的一部分,將使機(jī)器人能夠?qū)W習(xí)將房間的墻壁和地板與家具和房間內(nèi)的其他物體區(qū)分開。將這些元素存儲(chǔ)為單獨(dú)的對(duì)象意味著添加或刪除椅子無需完全重繪地圖。

這些優(yōu)勢的結(jié)合是自主機(jī)器人功能取得巨大進(jìn)步的關(guān)鍵。機(jī)器人在未經(jīng)訓(xùn)練的情況下不能很好地推廣。變化,尤其是快速移動(dòng)會(huì)破壞地圖并增加大量計(jì)算量。機(jī)器學(xué)習(xí)創(chuàng)建了一層抽象,可以提高地圖的穩(wěn)定性。它在處理數(shù)據(jù)方面的更高效率產(chǎn)生了開銷,以增加更多的傳感器和更多的數(shù)據(jù),從而增加了粒度和可包含在地圖中的信息,更多信息盡。

機(jī)器學(xué)習(xí)可用于教導(dǎo)自主機(jī)器人場景中哪些元素用于定位,哪些元素不作為地圖的一部分或?qū)⑵浞诸悶橐苊獾恼系K。

自然互動(dòng)

將位置,地圖和感知鏈接在一起,使機(jī)器人可以更多地了解其周圍環(huán)境并以更有用的方式進(jìn)行操作。例如,可以感知大廳和廚房之間差異的機(jī)器人可以執(zhí)行更復(fù)雜的指令集。能夠識(shí)別和分類椅子,書桌,櫥柜等物體將進(jìn)一步改善這一點(diǎn)。指示機(jī)器人去特定的房間去獲取特定的東西將變得更加簡單。

當(dāng)機(jī)器人開始以更自然的方式與人進(jìn)行更多互動(dòng)時(shí),機(jī)器人技術(shù)的真正革命將來臨?梢詮亩喾N情況中學(xué)習(xí)并將這些知識(shí)組合到模型中的機(jī)器人,這些機(jī)器人可以使它們根據(jù)存儲(chǔ)在內(nèi)存中的地圖和對(duì)象執(zhí)行未經(jīng)訓(xùn)練的新任務(wù)。創(chuàng)建這些模型和抽象需要將SLAM的所有三層完全集成。由于在這些領(lǐng)域處于領(lǐng)先地位的人們的努力,我相信感知時(shí)代即將來臨,更多信息盡在振工鏈。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)