揭秘基于FPGA異構(gòu)計(jì)算的深蘭科技AI加速器平臺(tái)
AI加速器是一類專門的硬件電路或計(jì)算系統(tǒng),旨在加速人工智能算法的實(shí)現(xiàn),尤其是機(jī)器學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺和語音識(shí)別等需要大規(guī)模計(jì)算的應(yīng)用。典型的應(yīng)用場景包括無人駕駛系統(tǒng)、機(jī)器人技術(shù)、監(jiān)控安防等計(jì)算密集型任務(wù)場景。
AI加速器是涉及算法模型、網(wǎng)絡(luò)框架、軟件工具鏈、加速器IP和硬件平臺(tái)的復(fù)雜AI算法實(shí)現(xiàn)系統(tǒng)。深蘭科技AI加速平臺(tái)采用異構(gòu)計(jì)算的FPGA芯片,并自主研發(fā)了加速器IP及整套開發(fā)工具,在多任務(wù)處理方面的優(yōu)勢尤為突出。
深蘭科技AI加速解決方案如下圖所示
1.異構(gòu)計(jì)算在AI加速領(lǐng)域的優(yōu)勢
深蘭科技的AI加速硬件平臺(tái)采用賽靈思的MPSOC系列FPGA。MPSOC是一種集成多處理器系統(tǒng)的異構(gòu)計(jì)算芯片,其中的多處理器系統(tǒng)包括:CPU(applications processor),RTP(real-time processor),GPU(graphics processor)以及FPGA(Field Programmable Gate Array)。不同的處理器適合處理的任務(wù)不同,多處理器的異構(gòu)計(jì)算系統(tǒng)在AI加速領(lǐng)域有著獨(dú)特的優(yōu)勢。
以人臉識(shí)別應(yīng)用為例,來看一下異構(gòu)計(jì)算平臺(tái)在AI加速領(lǐng)域的表現(xiàn)。
1.?dāng)?shù)據(jù)采集階段,計(jì)算平臺(tái)要提供傳感器接入的能力;
2.?dāng)?shù)據(jù)處理階段,計(jì)算平臺(tái)要提供常見的視頻圖像處理庫;
3.特征提取和比對階段,包含大量的數(shù)據(jù)調(diào)度和重復(fù)計(jì)算任務(wù);
4.最終模型輸出和顯示階段,計(jì)算平臺(tái)要提供圖像疊加和視頻顯示等功能。
單獨(dú)的CPU更適合處理串行的控制流,不適用于大規(guī)模的并行計(jì)算;單獨(dú)的GPU更適合處理大規(guī)模的并行計(jì)算,但是在處理控制流方面又顯得捉襟見肘。MPSOC中的多核ARM適合視頻采集和數(shù)據(jù)預(yù)處理,FPGA中各種加速算子適合特征提取和特征比對,Mali GPU適合最終輸出顯示。多種處理器協(xié)同合作才能高效的完成人臉識(shí)別任務(wù)。
深蘭科技AI加速器如何高效工作
決定AI加速器工作效率的關(guān)鍵有三點(diǎn):
1.高帶寬的片外數(shù)據(jù)吞吐;
2.高效率的片上數(shù)據(jù)緩存;
3.針對性的大規(guī)模并行計(jì)算單元。
深蘭科技AI加速器在設(shè)計(jì)的時(shí)候充分考慮了這三個(gè)因素
深蘭科技自主研發(fā)的AI加速器采用ARM和FPGA協(xié)同工作的架構(gòu),ARM和FPGA上各掛有一組帶寬高達(dá)150G的DDR4內(nèi)存顆粒,兩組內(nèi)存統(tǒng)一編址,便于內(nèi)存管理。內(nèi)存顆粒和計(jì)算單元間采用AXI4高速總線互聯(lián),AXI_INTERCONNECT可以保證高效的多路數(shù)據(jù)總線讀寫仲裁,避免多路總線沖突及帶寬分配不均衡。
高帶寬的片外數(shù)據(jù)吞吐只能保證海量的數(shù)據(jù)可以送進(jìn)FPGA,數(shù)據(jù)如果要進(jìn)入計(jì)算單元,還要經(jīng)過高效的片上數(shù)據(jù)重組和數(shù)據(jù)緩存。深蘭科技的AI加速器按照NCHW的格式重組數(shù)據(jù),重組完的數(shù)據(jù)被寫入相應(yīng)的片上緩存(RAM和FIFO)。
不同類型的計(jì)算任務(wù)由定制化開發(fā)的RTL算子完成,這樣可以保證很高的計(jì)算效率。目前完成的算子包括卷積算子、池化算子、上采樣算子、加法算子和softmax算子等,具體參數(shù)見下表。
3.深蘭科技AI加速器應(yīng)用案例展示
無人駕駛應(yīng)用:
紅綠燈識(shí)別,采用Mobilenet+Edlenet的組合神經(jīng)網(wǎng)絡(luò)提高小目標(biāo)的識(shí)別準(zhǔn)確性。
智能交通應(yīng)用:
航拍目標(biāo)檢測,直升機(jī)高空俯視航拍,用于智能交通控制。
激光雷達(dá)應(yīng)用:
點(diǎn)云數(shù)據(jù)目標(biāo)檢測,使用Pixornet神經(jīng)網(wǎng)絡(luò)進(jìn)行3D 目標(biāo)檢測的鳥瞰圖檢測。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場仿真助跑新能源汽車
-
11月20日火熱報(bào)名中>> 2024 智能家居出海論壇
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無人駕駛車,還未迎來“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬億獨(dú)角獸,AI人才之爭開啟
- 高級軟件工程師 廣東省/深圳市
- 自動(dòng)化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市