訂閱
糾錯(cuò)
加入自媒體

詳解特斯拉AI Day:FSD成長(zhǎng)到了哪一步?

10?1?,?年?度的科技春晚,特斯拉AI Day 來了。整場(chǎng)發(fā)布會(huì)?常硬核,?貨也很多。FSD、Dojo、Tesla Bot超級(jí)計(jì)算機(jī)是這次發(fā)布會(huì)的三?看點(diǎn)。不過,我們主要關(guān)注的,還是特斯拉在FSD ??的新進(jìn)展。此前,絕?部分??都循著特斯拉的步伐,?上漸進(jìn)式?動(dòng)駕駛發(fā)展之路。但是隨著能?參差以及對(duì)?動(dòng)駕駛理解不同,特斯拉與?眾?企分道揚(yáng)鑣。

特斯拉?上了純視覺路線,其他?企則開始投?激光雷達(dá)懷抱。但是,對(duì)于?多數(shù)??來說,特斯拉依然是?向標(biāo)。他們也都很好奇:特斯拉純視覺?動(dòng)駕駛究竟有何進(jìn)展?聊進(jìn)展之前,還是先了解?下,特斯拉FSD 的基本框架。

01FSD框架

先說測(cè)試規(guī)模,2021 ?概有2000 位「勇?」參與到FSD Beta 的測(cè)試, 今年,這個(gè)數(shù)字增加到160000 位。

從去年到現(xiàn)在,F(xiàn)SD 進(jìn)?過35 個(gè)版本迭代,訓(xùn)練了 7.5萬 個(gè)神經(jīng)?絡(luò)模型,基本上8 分鐘訓(xùn)練1 個(gè),并推送了35個(gè)版本更新。?前FSD Beta 在?定程度上已經(jīng)可以實(shí)現(xiàn)從?個(gè)停?場(chǎng)導(dǎo)航到另?個(gè)停?場(chǎng),可以?動(dòng)完成識(shí)別紅綠燈并通?、通過?字路?、轉(zhuǎn)彎等操作。來看看特斯拉FSD基本框架。所有的?切完全依靠單?智能實(shí)現(xiàn)。通過?上運(yùn)?神經(jīng)?絡(luò)的攝像頭?成環(huán)境模型,?后基于此模型進(jìn)??輛的規(guī)劃和控制。

這是?個(gè)多攝像頭神經(jīng)?絡(luò),系統(tǒng)通過收到的圖像來推測(cè)物理世界各個(gè)坐標(biāo)都有什么東?。沒錯(cuò),推測(cè)。雖然我們看到的是圖?,但是在攝像頭看來,它看到的就是其實(shí)是?維?格,需要進(jìn)?轉(zhuǎn)換和編碼。?后通過不斷的模型訓(xùn)練,才能識(shí)別出圖像中的物體到底是什么,譬如樹?、墻壁、汽?。當(dāng)然,識(shí)別的內(nèi)容不?這些,還有各種語義層,包括各種?道線、交通信號(hào)燈、停?線等。

?在識(shí)別物體之后,系統(tǒng)會(huì)得出這些物體現(xiàn)在的狀態(tài)坐標(biāo),并預(yù)測(cè)這些物體接下來的運(yùn)動(dòng)。對(duì)于典型計(jì)算機(jī)視覺技術(shù)來說,處理這些內(nèi)容?常困難,所以特斯拉在不斷深?到語?技術(shù)領(lǐng)域,然后從其他領(lǐng)域提取最先進(jìn)的技術(shù),融合進(jìn)來。但是,很多物體還是?法被探測(cè)到或者被準(zhǔn)確識(shí)別,這?就需要對(duì)數(shù)據(jù)進(jìn)?標(biāo)注,特斯拉已經(jīng)擁有??的?動(dòng)標(biāo)注系統(tǒng)。此外,特斯拉利???的仿真系統(tǒng)來構(gòu)建圖像,通過數(shù)據(jù)引擎管道,??些數(shù)據(jù)訓(xùn)練模型,然后把它放到?上,看是否可?。

如果發(fā)?故障,?隊(duì)會(huì)進(jìn)?分析,并提供當(dāng)前標(biāo)簽并將數(shù)據(jù)添加?訓(xùn)練集,這個(gè)過程系統(tǒng)地解決了問題。為了訓(xùn)練這些新的?規(guī)模神經(jīng)?絡(luò),特斯拉今年把訓(xùn)練基礎(chǔ)設(shè)施擴(kuò)展了40%-50%,今年特斯拉在美國(guó)訓(xùn)練集群已搭載?約14000 個(gè)GPU。同時(shí),特斯拉還開發(fā)了??的??智能編譯器,?持這些神經(jīng)?絡(luò)所需的新操作,并將它們映射到特斯拉最好的底層硬件上。?前,特斯拉推理引擎能夠?qū)蝹(gè)神經(jīng)?絡(luò)的執(zhí)?分布在芯?上的兩個(gè)獨(dú)?系統(tǒng)上。本質(zhì)上其實(shí)就是連接在同?臺(tái)?動(dòng)駕駛計(jì)算機(jī)中的獨(dú)?計(jì)算機(jī)。

其實(shí)就是同?神經(jīng)?絡(luò)在兩塊FSD芯?都進(jìn)?運(yùn)算,為此,必須嚴(yán)格控制新系統(tǒng)端到端的延遲。為此,特斯拉布局了很多新的代碼,所有這些在??運(yùn)?的新?絡(luò),產(chǎn)?向量空間。進(jìn)?在汽?周圍建?起新的模型,規(guī)劃系統(tǒng)在此基礎(chǔ)上得出運(yùn)?軌跡。通過基于模型的神經(jīng)?絡(luò)的組合,特斯拉FSD 正在?速成?。

02交叉路口規(guī)控策略

?保護(hù)左轉(zhuǎn),是?動(dòng)駕駛的??難題。

?動(dòng)駕駛?輛在進(jìn)?決策規(guī)劃的時(shí)候就會(huì)涉及到多種變量,需要梳理不同變量之間的關(guān)系,進(jìn)?推演出最合理的通??式。下?這個(gè)就是?個(gè)很有代表性的場(chǎng)景:?保護(hù)左轉(zhuǎn)還遇到通過的??。

這基本上可以歸結(jié)為解決多智能體在?我和所有其他智能體軌跡上的精確規(guī)劃問題。這就需要系統(tǒng)能夠在很短時(shí)間內(nèi)厘清出各個(gè)對(duì)象之間的關(guān)系,然后推導(dǎo)出最合理的通?策略。別忘了,系統(tǒng)還要預(yù)測(cè)這些對(duì)象接下來的運(yùn)動(dòng),相關(guān)交互組合的數(shù)量會(huì)爆炸式增?。這個(gè)計(jì)算量?常?,?規(guī)劃者需要每50 毫秒做?個(gè)決定。很多?商都不太能做好這個(gè)場(chǎng)景。包括??駕駛Robotaxi 公司。那么,特斯拉是怎么做的呢?特斯拉采??種名為Interaction Search(?譯交互搜索)的框架,對(duì)?系列運(yùn)動(dòng)物體進(jìn)?研究。這?的狀態(tài)空間對(duì)應(yīng)于?我的運(yùn)動(dòng)狀態(tài),其他主體的運(yùn)動(dòng)狀態(tài),多模型未來預(yù)測(cè),以及場(chǎng)景中所有的靜態(tài)實(shí)體?梢允??組物體運(yùn)動(dòng)軌跡來看場(chǎng)景中不同交互決策,同時(shí)也可以加?新的變量,來獲得更多決策優(yōu)化。

?如還是剛剛的過?字路?案例。我們從?系列視覺測(cè)量開始。

1、被看?的物體。?如?道、移動(dòng)物體、其他不可動(dòng)實(shí)體,這些元素為潛在特征。

2、構(gòu)建路徑。我們?它從?結(jié)構(gòu)化區(qū)域的?道?絡(luò)中來創(chuàng)造最優(yōu)通?路徑。

3、路徑推演。以此來創(chuàng)建項(xiàng)?樹,使?來?客戶群的數(shù)據(jù)進(jìn)?訓(xùn)練。與此同時(shí)就會(huì)?成多種不同決策結(jié)果,我們也能從中找到最優(yōu)解。

4、引?新變量,再次尋求最優(yōu)。在這個(gè)最優(yōu)解之上,你也可以加?新的變量,?如加?右側(cè)駛來的?輛,這樣就會(huì)產(chǎn)?新的決策樹,新的分?,然后再?gòu)闹羞x出其中的最優(yōu)解。

就像剛剛說的這個(gè)運(yùn)算量?常巨?。所以特斯拉選擇構(gòu)建輕量級(jí)?絡(luò)來進(jìn)?軌跡?成。結(jié)果就是:把每個(gè)動(dòng)作的運(yùn)?時(shí)間縮短到100 微秒。對(duì)?之下,此前每個(gè)動(dòng)作需要1-5 毫秒。這個(gè)提升,?常明顯。此外,特斯拉還會(huì)有?項(xiàng)「軌跡評(píng)分」標(biāo)準(zhǔn),此舉是為了提升FSD?戶使?舒適度。

說?話就是:FSD 不僅要能夠做到,還要能夠做好,讓?開起來像?個(gè)?司機(jī)?樣穩(wěn)健。在這?,特斯拉會(huì)運(yùn)?兩個(gè)可變神經(jīng)?絡(luò),可以相互增強(qiáng)。其中?套是FSD Beta,這讓我們知道在接下來的?秒鐘內(nèi),?個(gè)?受到?預(yù)的可能性有多?。第?套源??類駕駛數(shù)據(jù),給FSD系統(tǒng)的表現(xiàn)評(píng)分,可以幫助特斯拉更好的優(yōu)化FSD 的體驗(yàn)。特斯拉表示:「這個(gè)架構(gòu)最酷的地?在于,它允許我們?cè)跀?shù)據(jù)驅(qū)動(dòng)的?法之間創(chuàng)建?個(gè)很酷的融合,沒有那么多??成本,但結(jié)果的核查檢驗(yàn)依然是基于現(xiàn)實(shí)!惯@?part簡(jiǎn)?之就是:特斯拉?動(dòng)駕駛規(guī)劃決策所需時(shí)間變短、能?更強(qiáng)、體驗(yàn)更好。033D建模

特斯拉所有感知都要靠這8 個(gè)攝像頭。特斯拉依靠攝像頭獲取圖像信息,然后?算法,取得類激光雷達(dá)3D 成像的效果(從 image space 到 vector space ),F(xiàn)在FSD UI 中展示的只是所渲染的空間向量中的?部分:

但是在精度上還是?法與真正的激光雷達(dá)相?。?如,當(dāng)有?輛經(jīng)過時(shí),?法準(zhǔn)備識(shí)別該物體。這也是去年難到特斯拉的?個(gè)?問題:

對(duì)于采?激光雷達(dá)?案的公司來說,可以?常精準(zhǔn)且輕松的檢測(cè)到物體并捕捉物體的移動(dòng)。但是視覺想要做到這?點(diǎn),并不容易。特斯拉運(yùn)??何占?率了解視覺3D 中的遮擋??。下?這個(gè)占?神經(jīng)?絡(luò)(the occupancy network)就是他們的成果。這?看到的是來?系統(tǒng)內(nèi)部第?層的規(guī)則?絡(luò)輸出。(這個(gè)3D 建模并沒有出現(xiàn)在?前特斯拉推送給?戶的可視化UI 中,但也很酷)

具體來說,占??絡(luò)將8 個(gè)攝像頭的視頻流作為輸?,在?量空間中直接為所有汽?周圍的每個(gè)三維位置?成統(tǒng)?的體積精度,然后預(yù)測(cè)該地點(diǎn)被?量占?的概率。

與此同時(shí),聯(lián)系輸?的視頻上下?,它還會(huì)預(yù)測(cè)即將可能被遮擋的障礙物。在每個(gè)位置,它都會(huì)?成?組語義,?如?路??、汽?等,然后?不顏?標(biāo)注。于是就有了下圖的建模:

與此同時(shí),對(duì)于運(yùn)動(dòng)中的占有率情況也可以進(jìn)?預(yù)測(cè)。由于該模型是?個(gè)?義?絡(luò),它沒有區(qū)分靜態(tài)和動(dòng)態(tài)對(duì)象,也能夠建模隨機(jī)運(yùn)動(dòng)。

?前,這個(gè)?絡(luò)正在所有特斯拉FSD計(jì)算機(jī)上,?且?常?效,使?特斯拉新的加速器,?概每10 毫秒運(yùn)算?次。所以,這就是特斯拉在純視覺取代激光雷達(dá)上所做的?點(diǎn)?作。除了?體像素,占??絡(luò)還能輸出路?相關(guān)信息,?如它的路??何情況(?如坡度),還有路?語義。這會(huì)對(duì)系統(tǒng)規(guī)控有很?的幫助。直接上案例吧?催@?的這張圖,坡道三維信息也被很很好的預(yù)測(cè)出來,有了這樣的信息輸?,后續(xù)系統(tǒng)可以決定接下來是否要減速?駛。

如果這件事交給直接采??精地圖?案的公司來說,這?步就很簡(jiǎn)單。因?yàn)?精地圖公司已經(jīng)將這些道路信息包括坡度、彎道曲率等信息錄?地圖,當(dāng)?輛?駛到這?,?輛可以提前根據(jù)這些已知做出預(yù)判和控制。所以,這就是特斯拉在替代?精地圖上取得了不錯(cuò)的進(jìn)展。04具體怎么實(shí)現(xiàn)的?

?先,攝像頭提取圖像數(shù)據(jù)并校正,然后采?RegNets和BiFPNS 來提取圖像特征,構(gòu)建3D 位置查詢,所有圖像以及特征都有其??的鍵和值。通過這些鍵和值,你可以知道前?是什么物體,亦或者是某個(gè)部分被遮擋的物體。

這些內(nèi)容再通過注意?模塊輸出?維空間特征,這些空間特征?致。然后使??輛瞬時(shí)測(cè)程推導(dǎo)運(yùn)動(dòng)軌跡。

將這些時(shí)空特性通過反卷積神經(jīng)?絡(luò),推出最終的占?率和占?流,形成固定尺?的盒?。但是這對(duì)于規(guī)劃和控制來說精度可能不是很夠。

為了獲得更?分辨率,特斯拉還?成每個(gè)像素形狀映射,你就當(dāng)做是?個(gè)個(gè)坐標(biāo),然后把這些坐標(biāo)和 3D 空間點(diǎn)查詢送?給MLP(多重感知機(jī)),以獲得任意點(diǎn)的位置和語義。

很多?看到這?可能就暈了,來看看這個(gè)案例:

特斯拉在不斷?駛,前?的?巴被識(shí)別為「L」的紅?盒?,當(dāng)?輛逐漸靠近,巴?也在移動(dòng),?頭直接從紅?變成了藍(lán)?。隨著時(shí)間推移,整個(gè)巴?都變成了藍(lán)?,你甚?可以看到這個(gè)?絡(luò)預(yù)測(cè)巴?向左運(yùn)動(dòng)時(shí)的精確曲率。

對(duì)于傳統(tǒng)?標(biāo)檢測(cè)?絡(luò)來說,這是?個(gè)?常復(fù)雜的問題,可能會(huì)??個(gè)或者兩個(gè)??體來擬合曲率。但是對(duì)于占??絡(luò)來說,只需注意有可?空間的占?情況,?后就能精確的建?曲率模型。此外還有剛剛說的,彎曲路?的?何以及相關(guān)語義的識(shí)別。

最后就是使??型?動(dòng)標(biāo)記數(shù)據(jù)集對(duì)占??絡(luò)進(jìn)?訓(xùn)練。

此外,特斯拉也在關(guān)注其他神經(jīng)?絡(luò),?如NeRF((Neural Radiance Fields)這?簡(jiǎn)單解釋?下。NeRF,神經(jīng)輻射場(chǎng)。是?項(xiàng)利?多?圖像重建三維場(chǎng)景的技術(shù)。直接上案例吧。?如眼前的這個(gè)架??。通過多組圖像在神經(jīng)?絡(luò)的訓(xùn)練,就可以構(gòu)建出這個(gè)架??的三維場(chǎng)景,?且還能給到兩組不同于之前圖像的新視圖。

顯然,這個(gè)技術(shù)很對(duì)特斯拉胃?。特斯拉考慮將?些功能整合到占??絡(luò)訓(xùn)練中。這是他們做的?個(gè)演示案例,?的是為了給?動(dòng)駕駛呈現(xiàn)呈現(xiàn)3D 世界。

不過要做到這點(diǎn)并不容易,特斯拉在這個(gè)地?繼續(xù)邀請(qǐng)??們加?特斯拉?動(dòng)駕駛團(tuán)隊(duì)。有了強(qiáng)?模型,下?步就是要訓(xùn)練它。這就需要海量可?學(xué)習(xí)的數(shù)據(jù)視頻。

看到這張圖了嗎?這并不是故障或者是雪花,?是視頻。?概1.4 億幀。

這個(gè)量?常巨?。如果?10 萬個(gè)GPU 進(jìn)?訓(xùn)練,需要1 個(gè)?時(shí),如果你有1 塊GPU,需要10 萬?時(shí)。這個(gè)時(shí)間?常?,?特斯拉想要更快的訓(xùn)練速度。這也是為什么特斯拉要建造??的超級(jí)計(jì)算機(jī)的原因。特斯拉有3 個(gè)超級(jí)計(jì)算機(jī),共計(jì)14000 個(gè)GPU,其中1 萬個(gè)?于訓(xùn)練, 另外4 千塊?于?動(dòng)標(biāo)注。

所有的視頻都存在容量在30PB 的分布式視頻緩存設(shè)施中。這些數(shù)據(jù)集并??塵不變,?是處于變化,每天有?概有50 個(gè)視頻在集群中替換流動(dòng),系統(tǒng)每秒跟蹤40 萬個(gè)視頻實(shí)例。?在優(yōu)化視頻模型訓(xùn)練上,特斯拉也是做了很多?作:

結(jié)果就是:通過這些積累和優(yōu)化,特斯拉現(xiàn)在訓(xùn)練占??絡(luò)的速度提升了2.3 倍。

05車道檢測(cè)&周圍物體未來行為預(yù)測(cè)

早期特斯拉是在2D 圖像空間進(jìn)?實(shí)例分割,同時(shí)神經(jīng)?絡(luò)也很簡(jiǎn)單,只能識(shí)別為數(shù)不同的?種類型的道路。

這種?較簡(jiǎn)單的道路建模適合在?度結(jié)構(gòu)化的道路上。

現(xiàn)在,特斯拉要做的是?個(gè)系統(tǒng),可以適?在更復(fù)雜的路況,不僅僅要?成全套?道實(shí)例還有它們之間的連接。

路?通?是?個(gè)很好的案例。?前輔助駕駛?輛的?個(gè)?較?的通病在于:有?道線道路?駛正常,??道線引導(dǎo)???亂。
特斯拉要做的就是提升輔助駕駛在這?塊的表現(xiàn)。所以特斯拉??做了?道神經(jīng)?絡(luò)。

由三個(gè)組件構(gòu)成:1、視覺組件:有?組卷積層、注意層和其他神經(jīng)?絡(luò)層,處理來??個(gè)攝像頭的視頻數(shù)據(jù)并進(jìn)?編碼,并產(chǎn)?豐富的視覺表征;2、?道引導(dǎo)模塊:?道路級(jí)別的地圖數(shù)據(jù)增強(qiáng)這種表征。并引??組額外的神經(jīng)?絡(luò)層進(jìn)?編碼。雖然只是普通地圖,雖然不是?精地圖,但提供了很多基礎(chǔ)屬性信息,?如?道拓?fù)浣Y(jié)構(gòu)、?道數(shù)、導(dǎo)航路線等信息。這?引申出的?個(gè)信息是:特斯拉FSD 有?到地圖,但是是普通的導(dǎo)航地圖,?不是?精地圖。所以不要再問特斯拉?動(dòng)駕駛到底?不?地圖這件事了。

3、語?組件:前兩個(gè)組件產(chǎn)?了?個(gè)密集的張量,可以對(duì)世界進(jìn)?編碼。不過特斯拉的訴求是將這個(gè)密集張量轉(zhuǎn)換為智能?道集還有它們的連通上。輸?的是這個(gè)密集張量,輸出?本則被預(yù)測(cè)為特斯拉??開發(fā)的特殊語?,姑且稱之為道路語?(Language of Lanes)吧,特斯拉?它來編碼?道的連接關(guān)系。

具體咋做呢?看圖:

這就是最終?道?絡(luò):

簡(jiǎn)?之,這讓特斯拉在沒有?精地圖以及激光雷達(dá)的情況下,擁有了?清晰度的空間定位以及更遠(yuǎn)的可視范圍。周圍物體未來?為預(yù)測(cè)&路徑規(guī)劃這個(gè)?為其實(shí)很好理解。代?到我們?類駕駛員,其實(shí)我們??在開?的時(shí)候,其實(shí)下意識(shí)的也會(huì)去做類似的預(yù)判,關(guān)注周圍不同交通參與者(?如??、???、?輛等)的動(dòng)向,然后做出下?步的?輛控制(加速、減速、停?)。這?特斯拉提到了兩個(gè)個(gè)?常好的案例,可以讓我們更好的理解特斯拉在這?塊所做的?作。第?個(gè):

特斯拉正常?駛,遇到?輛?闖了紅?并左轉(zhuǎn)。在這個(gè)過程中,特斯拉已經(jīng)預(yù)測(cè)了這臺(tái)?可能會(huì)做的所有動(dòng)作,?后根據(jù)這臺(tái)?接下來會(huì)做的不同動(dòng)作,來決定?輛到底要采取怎樣的動(dòng)作。第?個(gè):

雖然前?都是紅燈,但是本?道這臺(tái)?不知道為何距離很遠(yuǎn)就停?了。特斯拉并沒有?常機(jī)械的停在該?后?,?是提前變道,轉(zhuǎn)到了另?條?道上。這個(gè)操作真的很細(xì)節(jié),特斯拉FSD 在變得更?性化,給個(gè)好評(píng)。特斯拉在試圖建??個(gè)實(shí)時(shí)系統(tǒng),所以就需要最?限度地提?對(duì)象部分堆棧的幀速率,以便Autopilot 能夠?qū)Σ粩嘧兓沫h(huán)境做出快速反應(yīng)。在這?,每?毫秒都?常重要,以盡量減少推理的延遲。

在這?,特斯拉神經(jīng)?絡(luò)運(yùn)作分為兩個(gè)階段:第?階段,確定三維空間中存在的物體的位置;第?階段,在這些三維位置拉出張量,附加上?輛上的其他數(shù)據(jù),然后再進(jìn)?其余的處理。

這樣,可以讓神經(jīng)?絡(luò)將計(jì)算集中在最重要的區(qū)域上,從?以??部分延遲成本提供更好的性能。把它們放在?起,特斯拉的Autopilot 視覺堆棧不僅可以預(yù)測(cè)?何和運(yùn)動(dòng),同時(shí)可以預(yù)測(cè)各種語義,讓駕駛更安全,F(xiàn)在,F(xiàn)SD 道路?絡(luò)已經(jīng)在?上運(yùn)?,同時(shí)特斯拉也做了很多?作:

?且,現(xiàn)在在?上運(yùn)?的不?有?道?絡(luò),還有移動(dòng)物?絡(luò)、占??絡(luò)、交通控制和路標(biāo)?絡(luò)、路徑規(guī)劃?絡(luò)…..

可能后續(xù)還會(huì)加?更多新的?絡(luò)。下?這張圖就是在特斯拉?內(nèi)的神經(jīng)?絡(luò)的可視化:

看著?常震撼。特斯拉的這套東?,才算是真正的?動(dòng)駕駛數(shù)字?腦。與此同時(shí),特斯拉也在優(yōu)化延遲上做了不少?作:

有了數(shù)量如此多的神經(jīng)?絡(luò),就需要巨量的數(shù)據(jù)喂養(yǎng)。接下來且看看特斯拉在?動(dòng)標(biāo)注數(shù)據(jù)??的進(jìn)展。

06自動(dòng)標(biāo)注

特斯拉有?種所有的標(biāo)注框架來?持各種類型的?絡(luò)。以?道?為例,為了成功地訓(xùn)練和普及這個(gè)?絡(luò)到各個(gè)地?,需要100萬甚?更多交叉?出?數(shù)千萬次的數(shù)據(jù)量。不過,數(shù)據(jù)對(duì)于特斯拉來說不是問題,畢竟?源眾多。但是?個(gè)新的挑戰(zhàn)就是將所有這些數(shù)據(jù)轉(zhuǎn)換成訓(xùn)練表格。這?年,特斯拉嘗試過多種數(shù)據(jù)標(biāo)注?式:

如今,特斯拉在?的是新的?動(dòng)標(biāo)注技術(shù),效率提升?常多。此前10000 次?程標(biāo)注,如果換??貼標(biāo),需要500 萬?時(shí),現(xiàn)在只需要12 個(gè)?時(shí)就能搞定。具體怎么做的呢?我們?cè)僭僭俅握归_。主要分為三個(gè)步驟:第?步,通過?身攝像頭、視覺慣性測(cè)距法進(jìn)??精度的軌跡和結(jié)構(gòu)恢復(fù)。所有的特征,包括地?都是通過神經(jīng)?絡(luò)從視頻中推斷出來的,然后在向量空間中進(jìn)?跟蹤和重建。

第?步:多重?程重構(gòu)。這也是最核?部分?梢钥吹街帮@示的?程是如何重建的,并與其他?程對(duì)?,?后實(shí)現(xiàn)重建。然后,?類分析師進(jìn)來并最終確定標(biāo)簽,每個(gè)步驟都已經(jīng)在集群上完全并?化。所以整個(gè)過程通常只需要?個(gè)?時(shí)。

最后?步:?動(dòng)標(biāo)注新?程。只是在預(yù)先建?的重構(gòu)和每個(gè)新?程之間,使?相同的多?程對(duì)?引擎。因此,這?完全重建所有的?段要簡(jiǎn)單得多。

這也是這臺(tái)機(jī)器可擴(kuò)展性的關(guān)鍵。只要有可?的計(jì)算和?程數(shù)據(jù),這臺(tái)機(jī)器就能輕松擴(kuò)展。

當(dāng)然,?動(dòng)標(biāo)注不僅?在?道,還有規(guī)劃、占??絡(luò)等,很多都是?動(dòng)標(biāo)注的。

07仿真

對(duì)于?動(dòng)駕駛來說,路測(cè)很重要,因?yàn)槟芙佑|到真實(shí)場(chǎng)景。但是同樣的,模擬仿真也是?動(dòng)駕駛數(shù)據(jù)獲得的重要途徑和來源之?, 可以提供很多難以獲得的數(shù)據(jù)。但是,3D 場(chǎng)景的制作是出了名的慢。以這個(gè)模擬場(chǎng)景為例,渲染師需要兩周來構(gòu)建,但是有了新的?具后,使得特斯拉可以在5 分鐘內(nèi)就完成類似場(chǎng)景的搭建,?之快了1000 倍。

?先,特斯拉會(huì)把?動(dòng)化的地?真實(shí)標(biāo)簽輸送到模擬世界創(chuàng)建?具中:

隨后,?成道路?格,并??道標(biāo)簽對(duì)其進(jìn)?重新拓?fù)涮畛,其中包括各種重要道路信息,?如?字路?的坡度、材料等:

在路?上創(chuàng)造?道線:

然后是填充細(xì)節(jié),?成植物以及樓房,與此同時(shí),帶來的還有由植物樓房等帶來的視覺遮擋效果:

然后是交通信號(hào)的引?:

然后是路標(biāo)以及?道指引線:

接下來加??輛、??等交通參與者:

只需要?jiǎng)觿?dòng)?指,特斯拉可以創(chuàng)造各種想要的仿真環(huán)境:

現(xiàn)在,特斯拉可以很容易地?成?部分的舊??城市街道仿真:

08寫在最后

來個(gè)?結(jié)吧。特斯拉在FSD 上今年展示了很多內(nèi)容。感知、規(guī)劃、決策、控制以及仿真每?塊都有不同進(jìn)展和突破。

這次AI Day 讓我們看到了特斯拉在替代激光雷達(dá)以及?精地圖上所做的?作。同時(shí),隨著新神經(jīng)?絡(luò)的加?,特斯拉FSD變得更聰明,同時(shí)駕駛上也更?性化。?斯克表示:「?前FSD軟件已經(jīng)可以適?于全球各個(gè)地區(qū)的路況,如果地?監(jiān)管政策允許,我們可以在今年年底?向全球推出FSD Beta 版本軟件!

10?5?,特斯拉宣布了「Tesla Vision」的新動(dòng)向:取消超聲波傳感器。

兩年前,特斯拉拿掉了毫?波雷達(dá),現(xiàn)在,特斯拉對(duì)超聲波傳感器下?。這樣?來,特斯拉真就在純視覺?動(dòng)駕駛?條路?到?了。特斯拉的純視覺?動(dòng)駕駛正在按著既定的?標(biāo)逐漸推進(jìn)。最后?個(gè)問題:特斯拉能不能?純視覺實(shí)現(xiàn)?動(dòng)駕駛?這個(gè)問題我暫時(shí)?法回答。我只能給你?個(gè)我看到的現(xiàn)狀:當(dāng)絕?部份的?企都轉(zhuǎn)向激光雷達(dá)陣營(yíng),?特斯拉仍在純視覺路線上做?個(gè)孤勇者和開拓者,為?動(dòng)駕駛的實(shí)現(xiàn)提供更多的參考思路。

不是誰都敢賭上??的前程去博?個(gè)不確定的明天,但是特斯拉敢。這份開拓創(chuàng)新的勇?,讓?敬佩。OK,以上就是這次特斯拉AI Day 關(guān)于FSD 的進(jìn)展。如果你覺得內(nèi)容不錯(cuò),歡迎?鍵三連,這對(duì)我的創(chuàng)作有很?的幫助。

— 完 —

       原文標(biāo)題 : 詳解特斯拉AI Day:FSD成長(zhǎng)到了哪一步?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)