訂閱
糾錯
加入自媒體

車載邊緣運算如何成為自動駕駛重要技術?

全球汽車快訊 據(jù)外媒報道,自動駕駛車輛需要大量的傳感器、海量的數(shù)據(jù)、持續(xù)提升的運算能力、實時操作及安全性顧慮,上述因素將運算的核心從云端推向了網絡邊緣。

自動駕駛車輛將持續(xù)不斷地感知路況、定位及周邊車輛,然后發(fā)送上述數(shù)據(jù)。自動駕駛車輛每秒將生產近1GB的數(shù)據(jù)量,由于存在帶寬和延遲,即便是先向集中式服務器某個發(fā)送兆兆字節(jié)(TB)的片段,再將其用于數(shù)據(jù)分析,該方法依然不切實際。

由于大量的數(shù)據(jù)需要傳輸、存在延遲和網絡安全性問題,目前的云端運算服務架構對向無人駕駛車輛提供實時的人工智能處理有妨礙作用。

因此,作為人工智能的主要代表性技術,深度學習將被整合到邊緣運算框架內。邊緣人工智能運算可解決延遲敏感型監(jiān)控,如:目標追蹤與檢測、位置感知及云端運算范式所面臨隱私性保護方面的挑戰(zhàn)。

若邊緣運算平臺能負責預先訓練深度學習建模

只有當所采集的數(shù)據(jù)能夠實現(xiàn)本地化處理、能做出實時決策和預判,且對遠程資源無依賴時,才能實現(xiàn)邊緣人工智能運算的真實價值。該情況的發(fā)生僅存在于以下前提條件:邊緣運算平臺能負責預先訓練深度學習建模并擁有運算資源在本地執(zhí)行實時推理。

延遲和本地化(地點,locality)是邊緣(運算)的兩大核心要素,因為對于無人駕駛車輛而言,數(shù)據(jù)傳輸延遲和上行服務中斷是無法忍受的事情,且會引發(fā)安全隱患(SO26262)。

舉個例子,車載傳感器應能在3秒內檢測并識別周邊的環(huán)境,該過程并不依賴于云端的運算資源,且可靠性要達到99.9999%。

對于一輛以120公里/小時行駛的車輛而言,1毫秒的來回延遲(round-trip latency)意味著車輛與靜態(tài)目標物間的距離縮短了3厘米。如果對方是相向行駛中的車輛,該延遲意味著這兩輛車間的距離縮短了6厘米。

目前,對自動駕駛車輛的功能應用而言,最令人興奮的莫過于車載人工智能運算任務,其中包括:目標檢測、目標分割、路面追蹤、標識和信號識別,上述任務主要依賴于通用類硬件——中央處理器(CPU)、圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)或通用的處理器。

然而,應將耗電量、運行速度、精確度、內存占用、芯片尺寸、物料清單成本等因素統(tǒng)統(tǒng)納入到自動駕駛及內置應用的功能設計中。

為滿足熱穩(wěn)定約束,采用的冷卻負載將進一步提升圖形處理器的高耗電量,這將極大地縮短車輛的駕駛里程數(shù)和電動車的燃油效率。

別致的包裝/套件、風扇冷卻和通用型實現(xiàn)組件也不可或缺。因此,這就需要采用更為便宜、能效更高的優(yōu)化版人工智能加速器芯片(如:針對特定領域、基于人工智能推理的專用集成電路,ASIC),將其作為加速邊緣深度學習推理速度的實用方案。

人工智能車載邊緣運算的優(yōu)點

最近,在提升車輛安全性和能源效率方面,付出了重大的努力。如今,車載通信及基于5G網絡的車聯(lián)網(V2X)所取得的技術進步為車輛與基礎設施網絡間的通信(V2I)提供了可靠的通信鏈路。

邊緣運算最適用于帶寬密集型和延遲敏感型應用,如:出于安全原因,需要立即做出行為及響應的無人駕駛汽車。

自動駕駛系統(tǒng)極為復雜,其緊密地整合了以下多種技術:感應、定位、感知、決策、與云端平臺的順暢交互以生成高清地圖并完成數(shù)據(jù)存儲。這類技術的復雜性為自動駕駛邊緣運算系統(tǒng)的設計工作平添了海量的挑戰(zhàn)。

車載邊緣運算(Vehicular edge computing,VEC)系統(tǒng)需要實時處理海量的數(shù)據(jù)。由于VEC系統(tǒng)是可移動的,其通常具有非常嚴格的能耗限制因素。

為此,當務之急是在合理的能耗范圍內提供充足的運算能力,從而確保自動駕駛車輛的安全性。即便該車輛也高速行駛,也需要做到這一點。

談到為自動駕駛車輛設計一款邊緣運算生態(tài)系統(tǒng),其超負荷挑戰(zhàn)在于:提供能實時處理且足夠強大的運算能力、保障可靠性、可擴容性、成本和安全性,從而確保自動駕駛車輛用戶體驗的安全性與品質。

表2——車載邊緣運算與車載云端運算的對比

低延遲

對于行車安全而言,零(低)延遲是必需/必要條件。許多自動駕駛車輛制造商的設計構想是:傳感器數(shù)據(jù)將流向云端,進行自動駕駛車輛所需的深層數(shù)據(jù)處理、深度學習、訓練及分析,使得車企采集了海量的駕駛數(shù)據(jù),然后利用機器學習來提升基于人工智能的自動駕駛實踐和學習。

據(jù)估計,在整個網絡發(fā)送數(shù)據(jù),整個來回(發(fā)送和接收)需要至少150-200毫秒,鑒于車輛在行駛中,且需要做出車輛控制方面的駕駛決策,該耗時占用了大量的時間。

據(jù)豐田透露,到2025年,車輛與云端網絡間的數(shù)據(jù)傳輸量或將達到10艾字節(jié)(exabytes)/月,是當前數(shù)據(jù)量的1萬倍。而云端網絡的設計顯然并不足以快速處理自動駕駛車輛所傳輸?shù)暮A繑?shù)據(jù)。

自動駕駛車輛將執(zhí)行時間敏感型進程任務,如:在本地(邊緣)實時執(zhí)行車道追蹤、交通監(jiān)控、目標檢測或語義分割并采取相應的駕駛操控。同時,為應對耗時較長的任務,自動駕駛車輛將傳感器數(shù)據(jù)上傳到云端進行數(shù)據(jù)處理,最終在將分析結果發(fā)回到自動駕駛車輛。

為此,邊緣運算技術提供一個端對端系統(tǒng)架構框架,用于向本地化網絡分配運算過程。一款設計精良的、基于人工智能的自動駕駛與智能網聯(lián)車輛將是一款協(xié)作式邊緣-云端運算系統(tǒng),高效的視頻/圖像處理及多層分布式(5G)網絡——這是本地處理和云端處理的集合體。

邊緣人工智能運算旨在為云端提供互補,而非完全取代后者。

圖5——協(xié)作式邊緣-云端運算

數(shù)據(jù)處理速度

鑒于網絡間數(shù)據(jù)傳輸?shù)恼麄來回要消耗大量的時間,出于安全因素,許多數(shù)據(jù)處理不得不在車載系統(tǒng)內完成。

車輛將自行運算源源不斷的數(shù)據(jù),無需進行數(shù)據(jù)傳輸。得益于車聯(lián)網網速及數(shù)據(jù)傳輸?shù)乃俣龋囕d數(shù)據(jù)的處理速度將有助于降低延遲并提升準確性。

人機間的相互依賴意味著:實時信息傳輸?shù)乃俣戎陵P重要。邊緣人工智能運算的應用涉及:擁有足量的本地化運算處理能力和內存容量,能夠確保自動駕駛車輛及人工智能處理器能執(zhí)行其各自亟待完成的任務。

可靠性

確保自動駕駛車輛的安全性是非常關鍵的任務。邊緣運算為擁堵的云端網絡減輕了壓力,通過縮減數(shù)據(jù)處理與車輛間的延時來提升可靠性。制造自動駕駛車輛的車企沒花多長時間就認識到了云端網絡的局限性。盡管云端是不可或缺的重要一環(huán),但自動駕駛車輛需要更為分散的應對途徑。

憑借邊緣運算以及與車輛位置更近的邊緣數(shù)據(jù)中心,因遠方網絡問題而對當?shù)刈詣玉{駛車輛造成影響的概率將大幅降低。即使車輛附近的數(shù)據(jù)中心真的出現(xiàn)網絡問題,自動駕駛車輛的車載智能邊緣推理將繼續(xù)自行高效地運行,因為其本來就能應對重要的處理功能。

如今,車企提供多層防御層和冗余防護,旨在應對斷電、斷網乃至運算故障。自動駕駛車輛還能夠動態(tài)地重新規(guī)劃路線,為網絡流量乃至決策提供助力,使自動駕駛車輛能夠安全地停車。擁有邊緣人工智能功能的無人駕駛車輛可憑借預見性系統(tǒng)分析來為車載診斷功能提供支持,該系統(tǒng)能在整個生命周期中不斷成長并實現(xiàn)功能演進。

隨著大量擁有邊緣運算功能的車輛連接到(云端)網絡上,數(shù)據(jù)可借助多個途徑重新發(fā)送,旨在確保車輛能在需要時獲取信息的訪問權限。車聯(lián)網(IoV)和邊緣運算高效地整合到綜合性分布式邊緣架構內,該架構可提供無與倫比的可靠性及可及性。

網絡安全性

自動駕駛車輛邊緣運算生態(tài)系統(tǒng)的最終挑戰(zhàn)在于為自動駕駛車輛提供充足的運算能力、冗余和網絡安全,保障自動駕駛車輛的駕駛安全性,也就是為自動駕駛車輛提供保護。

邊緣運算系統(tǒng)可應對面向感應和運算堆棧各個層級的網絡攻擊,這也是該系統(tǒng)最令人關注的地方。

自動駕駛車輛的網絡安全性應涵蓋自動駕駛邊緣運算堆棧的不同層級。這類網絡安全性包括:傳感器的網絡安全性、操作系統(tǒng)的網絡安全性、控制系統(tǒng)的網絡安全性及通信的網絡安全性。

此外,隨著數(shù)量安全性的重要性提升,邊緣網關的人工智能將減少車載信息娛樂系統(tǒng)的通信量及通信結果。

可擴容性

從根本性上講,車載邊緣運算擁有分布式架構,該架構有助于將數(shù)據(jù)帶來網絡邊緣,自動駕駛車輛可在網絡邊緣進行實時的數(shù)據(jù)分析與數(shù)據(jù)交互,就像本地化操作那般。

對于某些任務而言,云端是不可或缺的一環(huán),自動駕駛車輛還需要更為分散的應對途徑。舉個例子,智能傳感器能夠分析其自身采集的視頻輸入,確定哪些幀數(shù)的視頻需要關注,然后只向服務器發(fā)送上數(shù)幀數(shù)所對應的視頻數(shù)據(jù)。

這種分散式架構可縮短數(shù)據(jù)傳輸過程中的網絡延遲,因為數(shù)據(jù)不再需要在網絡和云端中來回發(fā)送,可直接進行處理。相較于過去的車輛,基于人工智能的車輛配置了更多的車載運算能力,能夠自行處理更多的任務,且可預測性更高、延遲更短。

成本

越來越多的路側單元配置了功能強大的人工智能本地處理器,其有助于降低能耗、維護和運營成本及向云端進行數(shù)據(jù)傳輸所涉及到的高帶寬成本。同時,作為諸多核心驅動力中的一員,如今運算設備與傳感器的價格跳水,使得邊緣運算成為現(xiàn)實的可行性有多了幾分。

人工智能車規(guī)級處理器技術

汽車業(yè)正在經歷關鍵性技術轉型,向著更高層級的自動駕駛技術水平挺進。智能駕駛需要更高效、功能更強大的人工智能處理器。

據(jù)Horizon Robotics提供的車企需求匯總顯示,越高層級的自動駕駛技術,對每秒萬億次運算(magnitude tera operations per second,TOPS)量級的需求量就更高。

換言之,2級自動駕駛技術需要2 TOPS的運算能力,3級自動駕駛技術則需要24 TOPS的運算能力,4級和5級自動駕駛技術所需的運算能力則分別為320 TOPS和逾4,000 TOPS。

汽車處理器通?煞譃槿箢悾

基于中央處理器和圖形處理器技術的處理器:往往靈活性更高,但通常耗電量也更大;

相較于圖形處理器,現(xiàn)場可編程門陣列對運算資源的需求更少,但成本更高,可編程性受限;

專用集成電路:通常采用定制化設計,在性能夠、成本和耗電量方面,其表現(xiàn)更高效。

傳統(tǒng)的中央處理器和圖形處理器正竭力滿足4級和5級自動駕駛車輛提升的高水準運算要求。在4級和5級自動駕駛層級,相較于前兩者,現(xiàn)場可編程門陣列和專用集成電路的性能更為出色。

運算能力將成為“車輪上的數(shù)據(jù)中心”。在考慮汽車應用的復雜性時,光靠運算力是不夠的。人工智能汽車芯片的能源效益、性能及成本效益也應納入到考量范圍。

到目前為止,在低功耗、性功能和成本方面,全定制的專用集成電路要遠超圖形處理器/現(xiàn)場可編程門陣列,這就是向自動駕駛車輛整合針對人工智能的專用集成電路愈發(fā)火爆的原因了。

高執(zhí)行能力的加速器芯片

Gyrfalcon Technology, Inc (GTI公司)的推理加速器擁有一款卷積神經元網絡特定域架構(Convolutional Neural Network Domain-Specific Architecture,CNN-DSA)及一款矩陣處理引擎(Matrix Processing Engine,MPE)及一項高效的人工智能內存處理(AI Processing in Memory,APiM)技術。

例如,GTI的LightSpeeur2803S提供了24 TOPS/Watt的電源效率性能,其所有的卷積神經元網絡處理都能在內存中完成,而非在動態(tài)隨機存儲器(DRAM)。

該款神經元網絡加速器可對448×448 RGB的圖像輸入值進行分類,其計算速度在16.8 TOPS以上,峰值功耗不足700mW,其精度也可媲美VGG的基準水平。

Gyrfalcon旗下的CNN- DSA加速器可重置設定值,旨在為各層級尺寸及層級類型的CNN建模系數(shù)提供支持。

對于諸如無人駕駛汽車人工智能平臺等更多運算密集型邊緣運算應用而言,GTI旗下基于顯示卡第二個插槽(PCIe)的人工智能加速卡采用了16x 2803S的芯片設計,其可提供270 TOPS和9.9 TOPS/W的運算效率,該設備旨在滿足4級自動駕駛人工智能汽車的性能需求。

GTI旗下基于人工智能的芯片擁有靈活的、可擴容的架構,可輕松實現(xiàn)并聯(lián)或串聯(lián)布局,用于任何既定性能/建模尺寸。串聯(lián)功能可提供靈活性并減少主機的工作量。串聯(lián)還支持尺寸更大、更復雜的建模(如:ResNet-101、ResNet-152等)。

圖8——GTI旗下基于人工智能的加速器,其擁有一款可擴容架構:(a)為提升性能的串聯(lián)架構、(b)大型建模的串聯(lián)架構

許多自動駕駛車輛應用的向量函數(shù)(underlying function)是深度學習技術,如:卷積神經元網絡,該技術通常被用于車輛及行人探查、路面追蹤、標識與信號識別及對語音指令的詮釋。

GTI旗下基于人工智能的架構是“硅晶驗證”獨立式加速器技術,其可被用于任何類型的傳感器輸出值,如:視頻、音頻及其他形式的數(shù)據(jù)。這還涉及了來自于機器學習攝像頭及高分辨率激光雷達的高數(shù)據(jù)速率及來自雷達和超聲波傳感器的低數(shù)據(jù)速率。(本文為編譯作品,所用英文原文和圖片選自ept.ca)

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號