國(guó)產(chǎn)GPU“挑戰(zhàn)”美國(guó)禁令,創(chuàng)全球通用GPU最高算力
上個(gè)月,美國(guó)以維護(hù)國(guó)家安全為由,禁止英偉達(dá)、AMD向中國(guó)銷售AI芯片,引發(fā)市場(chǎng)熱議。但同時(shí)有專家指出,此舉給予中國(guó)廠商與相關(guān)產(chǎn)業(yè)崛起的機(jī)會(huì),如同2015年美國(guó)政府發(fā)出禁令要求英特爾停止向中國(guó)超級(jí)計(jì)算機(jī)制造商出售高端芯片,因擔(dān)心中國(guó)用于核武研究,但僅僅一年后,中國(guó)便成功研發(fā)出用于超算的自主知識(shí)產(chǎn)權(quán)的國(guó)產(chǎn)芯片。
業(yè)內(nèi)人士認(rèn)為,美國(guó)禁止AI芯片銷往中國(guó),是打擊超級(jí)計(jì)算機(jī)、高效能運(yùn)算以及AI等領(lǐng)域的措施之一,去年美國(guó)將7家超算企業(yè)及研發(fā)機(jī)構(gòu)列入“貿(mào)易黑名單”,如今又禁止英偉達(dá)、AMD向中國(guó)銷售AI芯片,未來(lái)不排除會(huì)擴(kuò)大制裁范圍。
然而,近日,非盈利性機(jī)器學(xué)習(xí)開放組織MLCommons聯(lián)盟發(fā)布報(bào)告指出,國(guó)產(chǎn)高端GPU芯片企業(yè)——壁仞科技的AI芯片擁有出色的效率,甚至超越其中一款被美國(guó)政府限制出售的AI芯片。
有專家認(rèn)為,這是里程碑的代表,國(guó)內(nèi)廠商獲得了額外的機(jī)會(huì),因?yàn)樵S多客戶無(wú)法取得國(guó)外的芯片,而國(guó)內(nèi)廠商正在生產(chǎn)類似的產(chǎn)品。
【國(guó)產(chǎn)GPU賽道的“種子選手”】
據(jù)了解,壁仞科技創(chuàng)立于2019年,是國(guó)內(nèi)一家通用智能芯片的初創(chuàng)企業(yè),也是國(guó)產(chǎn)圖形GPU賽道的“種子選手”。截至目前,壁仞科技已完成B輪融資,總?cè)谫Y額超50億元人民幣。
今年4月,公司公布首款通用GPU芯片BR100系列,是首款面向云端AI訓(xùn)練集推理的通用GPU算力產(chǎn)品。
該系列芯片架構(gòu)完全由壁仞科技自主原創(chuàng)研發(fā),核心性能能夠直接對(duì)標(biāo)國(guó)際廠商近期發(fā)布的旗艦產(chǎn)品。消息稱,其峰值算力超過(guò)了英偉達(dá)目前在售的旗艦A100。
據(jù)了解,BR100芯片采用7nm制程、壁仞原創(chuàng)“壁立仞”芯片架構(gòu),容納近800億顆晶體管,配備超300MB片上高速SRAM,并應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),突破了大尺寸芯片制造與封裝中的光罩尺寸限制問(wèn)題,做到高良率與高性能的兼顧。
總體而言,壁仞科技BR100最大的爆點(diǎn)在于單芯片1000TFLOPs,以及這是在550W功耗約束下的算力。在發(fā)布會(huì)上,壁仞科技創(chuàng)始人、董事長(zhǎng)、CEO張文稱,中國(guó)通用GPU芯片進(jìn)入每秒1,000,000,000,0000,000次計(jì)算新時(shí)代。
BR100系列芯片將主要用于AI訓(xùn)練推理、通運(yùn)用算等場(chǎng)景,在智慧城市、云游戲、自動(dòng)駕駛等領(lǐng)域都有很大的發(fā)揮空間。
據(jù)消息稱,壁仞的CTO是華為海思出身的洪洲,當(dāng)年海思推GPU,進(jìn)展很好,但是被美國(guó)制裁了,壁仞的技術(shù)團(tuán)隊(duì)還有不少技術(shù)才俊,包括曾創(chuàng)建高通公司驍龍GPU團(tuán)隊(duì)、領(lǐng)導(dǎo)了5代Adreno GPU架構(gòu)開發(fā)的首席架構(gòu)師焦國(guó)方,前阿里云AI基礎(chǔ)架構(gòu)負(fù)責(zé)人徐凌杰,海光前海外GPU部門副總裁張凌嵐,EDA軟件巨頭Synopsys(新思科技)前AI Lab負(fù)責(zé)人唐杉,AMD前全球副總裁、中國(guó)研發(fā)中心總經(jīng)理李新榮,英偉達(dá)前上?偨(jīng)理?xiàng)畛吹取?/p>
【BR104創(chuàng)造全球通用GPU最高算力】
近日,全球權(quán)威AI基準(zhǔn)評(píng)測(cè)MLPerf公布了最新AI基準(zhǔn)測(cè)試結(jié)果(MLPerf Inference v2.1)。壁仞科技以最新發(fā)布的通用GPU芯片BR104,拿下數(shù)據(jù)中心推理評(píng)測(cè)中自然語(yǔ)言理解(BERT模型)和圖像分類(ResNet50模型)兩類基準(zhǔn)評(píng)測(cè)“available”(可售產(chǎn)品類別)單卡性能全球第一的成績(jī),其中BR104在BERT模型下達(dá)到了英偉達(dá)A100單卡性能的1.58倍。
據(jù)了解,MLPerf由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(David?Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等共同成立,是國(guó)際上最權(quán)威、最有影響力的基準(zhǔn)測(cè)試之一。為及時(shí)跟蹤和評(píng)測(cè)迅速發(fā)展的AI計(jì)算需求與性能,MLPerf每年組織2次AI測(cè)試。其數(shù)據(jù)中心場(chǎng)景的評(píng)測(cè),綜合考察參與廠商的硬件系統(tǒng)和軟件優(yōu)化能力,而此次BR104參加的“Closed Division”(固定任務(wù))類別,則要求參評(píng)者在完全一致的模型和環(huán)境下進(jìn)行性能結(jié)果的提交,因此這一類別下的結(jié)果被認(rèn)為是全球數(shù)據(jù)中心產(chǎn)業(yè)最具參考價(jià)值的AI性能基準(zhǔn)測(cè)試結(jié)果。
與此同時(shí),在BERT模型下,BR104還拿下了4卡整機(jī)、8卡整機(jī)性能全球第一的成績(jī),算力能效比也遠(yuǎn)遠(yuǎn)領(lǐng)先于其他廠商,達(dá)到英偉達(dá)A100算力能效比的2.11倍。BERT模型是目前自然語(yǔ)言理解領(lǐng)域應(yīng)用最廣泛的模型之一,也是相關(guān)產(chǎn)業(yè)應(yīng)用中最重要的模型。
壁仞科技董事長(zhǎng)、創(chuàng)始人、CEO張文表示,ResNet50模型和BERT模型是目前產(chǎn)業(yè)客戶最重視的AI模型,此次MLPerf最新發(fā)布的評(píng)測(cè)結(jié)果,直接證明了BR100系列通用GPU芯片的落地應(yīng)用能力。目前,BR104已經(jīng)開始了大規(guī)模的客戶送測(cè)和適配,性能更強(qiáng)大的BR100也已啟動(dòng)落地應(yīng)用,我們對(duì)BR100系列未來(lái)的應(yīng)用前景充滿信心。
【硝煙開始彌漫】
長(zhǎng)期以來(lái),全球GPU產(chǎn)業(yè)都被英偉達(dá)和AMD等美國(guó)企業(yè)所壟斷,在美國(guó)禁令的背景下,中國(guó)在技術(shù)領(lǐng)域“自給自足”的重要性愈發(fā)凸顯。
當(dāng)下,看到機(jī)會(huì)的不止是壁仞科技,除了早先入局的寒武紀(jì)、比特大陸、燧原科技等云端芯片創(chuàng)企外,過(guò)去一年間,陸續(xù)有新玩家現(xiàn)身,大量資本也正積極地涌入這一賽道。
分析機(jī)構(gòu)CCS Insight的分析師表示,壁仞科技已經(jīng)展現(xiàn)出實(shí)力,商機(jī)已經(jīng)落在他們身上,可能會(huì)因此獲得成功。此外,有分析師認(rèn)為,要在人工智能領(lǐng)域獲得成功,不僅是生產(chǎn)芯片,還需要一套與英偉達(dá)CUDA平臺(tái)競(jìng)爭(zhēng)的完整的人工智能軟件生態(tài)系統(tǒng),而這挑戰(zhàn)難度極大。
眾所周知,英偉達(dá)的一個(gè)關(guān)鍵優(yōu)勢(shì)在于2006年發(fā)表的CUDA通用并行計(jì)算平臺(tái)和編程模型,讓GPU成為并行運(yùn)算的首選,如今已被開發(fā)者們大量使用。
壁仞科技CTO洪洲曾表示,新的GPU板卡要無(wú)縫地支持CUDA生態(tài),這比更高的算力,更好的能效比更重要。目前階段必須保證用CUDA寫的程序能無(wú)縫運(yùn)行在壁仞科技的異構(gòu)計(jì)算開發(fā)平臺(tái)上,不應(yīng)當(dāng)為了追求所謂的極致能效,而打破對(duì)通用編程模型的兼容性。
當(dāng)前壁仞科技的第一要?jiǎng)?wù)是在打造自有編程模型的同時(shí),兼容CUDA當(dāng)前版本,而壁仞科技的終極目標(biāo),是提供比CUDA更好的自研編程模型。
國(guó)內(nèi)云端AI芯片及GPU賽道的硝煙正開始彌漫,入局者將越來(lái)越多。
畢竟,GPU, CPU, NPU, XPU國(guó)產(chǎn)化是這一代國(guó)人工程師的歷史使命,也是中國(guó)拿下電車,自動(dòng)駕駛,物聯(lián)網(wǎng)這些蛋糕的前置條件。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒(méi)有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 大模型“新星”開啟變現(xiàn)競(jìng)速
- 6 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 7 AI 投流卷哭創(chuàng)業(yè)者
- 8 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 9 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 10 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市