編者語:后臺回復“入群”,加入「智駕最前沿」微信交流群
現(xiàn)在無圖/輕地圖的智駕方案比較火,主要就是因為依靠高精地圖來為感知兜底的方式成本太高,那么為什么現(xiàn)在大家都齊刷刷地轉(zhuǎn)向bev/occ+transformer的方案呢?這種方案相比于用SLAM方法實時建立一定時間范圍內(nèi)的局部語義地圖,再在此地圖上做規(guī)劃的方案優(yōu)勢在哪兒?以SLAM為基礎(chǔ)做局部導航的缺陷在哪兒?
作為SLAM算法方向的研究生來發(fā)表一下自己的看法。
首先我認為題主是混淆了一些概念,SLAM主要是解決定位問題,而BEV/Occ+Transforme主要解決感知任務(wù)(局部語義地圖),感知是以定位為前提的,只不過這個定位可以不是SLAM定位。
一般SLAM算法的使用方法分為兩步,先建圖,后定位。在機器人應(yīng)用中,這里第一步建好的地圖 主要有兩個作用,一個作用是用來進行全局的路徑規(guī)劃,另外一個作用是進行第二步的定位。
在自動駕駛場景中道路環(huán)境經(jīng)常變化,高精地圖的維護成本較高,因此自駕采用了重感知輕地圖的方案,其中輕地圖并不是無地圖,自駕中全局的路徑規(guī)劃問題可以依靠百度地圖等來進行,定位問題可以使用輪速計、IMU、衛(wèi)星導航組合的方式來替代。然后在這種定位方法的基礎(chǔ)上進行局部語義地圖的創(chuàng)建。
而題主說的為啥不采用SLAM的方式進行局部語義地圖的創(chuàng)建,我的理解是自駕中還是使用了SLAM中幀間位姿估計的方法,只不過沒有采用基于先驗地圖的SLAM定位方法而已,所以這種多傳感器組合定位的方法只是沒有被叫做SLAM定位而已。
此外,雖然自駕中大多采用輕地圖重感知的方案,但是室內(nèi)機器人像是掃地機器人、人形機器人、倉運機器人等等還是采用的SLAM+局部語義地圖的方法,因為室內(nèi)機器人要求更高的精度,而且GPS等傳感器在室內(nèi)也無法使用,所以目前來說SLAM+感知的方案對于室內(nèi)機器人來說還是主流。
最后,其實我感覺容易讓題主產(chǎn)生疑惑的點更多的在于名稱的叫法上面,只不過搞深度學習的人把定位+局部語義地圖這一塊工作叫做感知任務(wù)而已,其實跟SLAM+局部語義地圖的叫法區(qū)別不大,局部語義地圖的創(chuàng)建方法可以是一樣的,區(qū)別只在于定位上面而已。
這個問題很好,借此澄清幾個概念:
1 無“圖”智駕,也需要有圖,無“圖”其實是偷換概念,因為商業(yè)和監(jiān)管的原因。
2 不管無圖有圖,自動駕駛感知都有出帶語義的OD,這個感知和BEV與否沒關(guān)系,和Transformer與否也沒關(guān)系。所以題目里,“無圖方案都用xxx”并沒有邏輯,其實是 無圖方案也可以不用xxx,有圖方案也可以用xxx。
3 無圖方案,都會使用SLAM技術(shù)建圖。SLAM技術(shù)是一個建圖和定位的技術(shù)的打包集合。不管有圖無圖,都會使用SLAM技術(shù)做融合定位或者叫定位配準。所以,這個提問,連續(xù)犯了三個邏輯錯誤。
4 倒數(shù)第二問,又來到了 規(guī)劃 問題,規(guī)劃和SLAM也并沒有什么相關(guān)性。所以我也沒看懂這個問題:“為什么用感知xxx,做定位xxx,比規(guī)劃xxx好在哪兒”。自動駕駛都有先驗地圖的,不會像掃地機器人先探索一遍才知道怎么走的,除非先撞一圈墻。
5 關(guān)于最后一問,大家都會“以SLAM為基礎(chǔ)做局部導航”,這句話等同于“以定位技術(shù)為基礎(chǔ)做定位”。
首先第一“無圖”并不是沒有高精地圖,是不要外部提供的高精地圖,內(nèi)部是需要自建圖;
第二:SLAM建圖可以作為無圖智駕一種方式,叫記憶行車,業(yè)內(nèi)也有就是大疆,小鵬的通勤模式,這種模式是可以只用導航地圖,但是SLAM一次并不能得到全部道路元素與結(jié)構(gòu),需要跑重復的道路幾次,所以智駕系統(tǒng)會表現(xiàn)出一回生二回熟,一次比一次開的好,但這也就意味著它需要你跑同樣的路線,SLAM建圖是能適用于你經(jīng)常上下班或者同一路線的通勤模式;
第三:bev/occ + transformer 不是一個方案,SLAM也是可以使用bev生成的道路拓撲自建地圖的,另外有SLAM也并不意味著不需要occ,occ對于沒有激光雷達方案,道路異形障礙物檢測是必須的;
第四個:一定時間范圍內(nèi)的局部語義地圖,如果簡單依賴視覺bev+occ,是沒有超視距信息的,也能用,但是你要接受它可能變道到匯入車道以及在遮擋時出現(xiàn)一些意想不到的問題,這種模式上限也就是有圖;
首先就是高速場景,基于高精地圖建立的先驗地圖信息更新比較慢,圖商的地圖車造價很高,都是季度更新的,最多是按照月去更新,所以如果在他們建圖歪了一些的話,進行SLAM匹配時結(jié)果就會歪,因此這個技術(shù)路線就不是很成功的。
BEV可以實時感知周圍前后20m甚至更遠的距離,足夠規(guī)劃去使用。
-- END --
聲明:內(nèi)容源自3D視覺之心,文中觀點僅供分享交流,不代表本公眾號立場,如涉及版權(quán)等問題,請您告知,將及時處理!