訂閱
糾錯(cuò)
加入自媒體

國(guó)產(chǎn)GPU“挑戰(zhàn)”美國(guó)禁令,創(chuàng)全球通用GPU最高算力

上個(gè)月,美國(guó)以維護(hù)國(guó)家安全為由,禁止英偉達(dá)、AMD向中國(guó)銷售AI芯片,引發(fā)市場(chǎng)熱議。但同時(shí)有專家指出,此舉給予中國(guó)廠商與相關(guān)產(chǎn)業(yè)崛起的機(jī)會(huì),如同2015年美國(guó)政府發(fā)出禁令要求英特爾停止向中國(guó)超級(jí)計(jì)算機(jī)制造商出售高端芯片,因擔(dān)心中國(guó)用于核武研究,但僅僅一年后,中國(guó)便成功研發(fā)出用于超算的自主知識(shí)產(chǎn)權(quán)的國(guó)產(chǎn)芯片。

業(yè)內(nèi)人士認(rèn)為,美國(guó)禁止AI芯片銷往中國(guó),是打擊超級(jí)計(jì)算機(jī)、高效能運(yùn)算以及AI等領(lǐng)域的措施之一,去年美國(guó)將7家超算企業(yè)及研發(fā)機(jī)構(gòu)列入“貿(mào)易黑名單”,如今又禁止英偉達(dá)、AMD向中國(guó)銷售AI芯片,未來(lái)不排除會(huì)擴(kuò)大制裁范圍。

然而,近日,非盈利性機(jī)器學(xué)習(xí)開放組織MLCommons聯(lián)盟發(fā)布報(bào)告指出,國(guó)產(chǎn)高端GPU芯片企業(yè)——壁仞科技的AI芯片擁有出色的效率,甚至超越其中一款被美國(guó)政府限制出售的AI芯片。

有專家認(rèn)為,這是里程碑的代表,國(guó)內(nèi)廠商獲得了額外的機(jī)會(huì),因?yàn)樵S多客戶無(wú)法取得國(guó)外的芯片,而國(guó)內(nèi)廠商正在生產(chǎn)類似的產(chǎn)品。

【國(guó)產(chǎn)GPU賽道的“種子選手”】

據(jù)了解,壁仞科技創(chuàng)立于2019年,是國(guó)內(nèi)一家通用智能芯片的初創(chuàng)企業(yè),也是國(guó)產(chǎn)圖形GPU賽道的“種子選手”。截至目前,壁仞科技已完成B輪融資,總?cè)谫Y額超50億元人民幣。

今年4月,公司公布首款通用GPU芯片BR100系列,是首款面向云端AI訓(xùn)練集推理的通用GPU算力產(chǎn)品。

該系列芯片架構(gòu)完全由壁仞科技自主原創(chuàng)研發(fā),核心性能能夠直接對(duì)標(biāo)國(guó)際廠商近期發(fā)布的旗艦產(chǎn)品。消息稱,其峰值算力超過(guò)了英偉達(dá)目前在售的旗艦A100。

國(guó)產(chǎn)GPU“挑戰(zhàn)”美國(guó)禁令,創(chuàng)全球通用GPU最高算力

據(jù)了解,BR100芯片采用7nm制程、壁仞原創(chuàng)“壁立仞”芯片架構(gòu),容納近800億顆晶體管,配備超300MB片上高速SRAM,并應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),突破了大尺寸芯片制造與封裝中的光罩尺寸限制問(wèn)題,做到高良率與高性能的兼顧。

總體而言,壁仞科技BR100最大的爆點(diǎn)在于單芯片1000TFLOPs,以及這是在550W功耗約束下的算力。在發(fā)布會(huì)上,壁仞科技創(chuàng)始人、董事長(zhǎng)、CEO張文稱,中國(guó)通用GPU芯片進(jìn)入每秒1,000,000,000,0000,000次計(jì)算新時(shí)代。

BR100系列芯片將主要用于AI訓(xùn)練推理、通運(yùn)用算等場(chǎng)景,在智慧城市、云游戲、自動(dòng)駕駛等領(lǐng)域都有很大的發(fā)揮空間。

據(jù)消息稱,壁仞的CTO是華為海思出身的洪洲,當(dāng)年海思推GPU,進(jìn)展很好,但是被美國(guó)制裁了,壁仞的技術(shù)團(tuán)隊(duì)還有不少技術(shù)才俊,包括曾創(chuàng)建高通公司驍龍GPU團(tuán)隊(duì)、領(lǐng)導(dǎo)了5代Adreno GPU架構(gòu)開發(fā)的首席架構(gòu)師焦國(guó)方,前阿里云AI基礎(chǔ)架構(gòu)負(fù)責(zé)人徐凌杰,海光前海外GPU部門副總裁張凌嵐,EDA軟件巨頭Synopsys(新思科技)前AI Lab負(fù)責(zé)人唐杉,AMD前全球副總裁、中國(guó)研發(fā)中心總經(jīng)理李新榮,英偉達(dá)前上?偨(jīng)理?xiàng)畛吹取?/p>

【BR104創(chuàng)造全球通用GPU最高算力】

近日,全球權(quán)威AI基準(zhǔn)評(píng)測(cè)MLPerf公布了最新AI基準(zhǔn)測(cè)試結(jié)果(MLPerf Inference v2.1)。壁仞科技以最新發(fā)布的通用GPU芯片BR104,拿下數(shù)據(jù)中心推理評(píng)測(cè)中自然語(yǔ)言理解(BERT模型)和圖像分類(ResNet50模型)兩類基準(zhǔn)評(píng)測(cè)“available”(可售產(chǎn)品類別)單卡性能全球第一的成績(jī),其中BR104在BERT模型下達(dá)到了英偉達(dá)A100單卡性能的1.58倍。

國(guó)產(chǎn)GPU“挑戰(zhàn)”美國(guó)禁令,創(chuàng)全球通用GPU最高算力

據(jù)了解,MLPerf由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(David?Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等共同成立,是國(guó)際上最權(quán)威、最有影響力的基準(zhǔn)測(cè)試之一。為及時(shí)跟蹤和評(píng)測(cè)迅速發(fā)展的AI計(jì)算需求與性能,MLPerf每年組織2次AI測(cè)試。其數(shù)據(jù)中心場(chǎng)景的評(píng)測(cè),綜合考察參與廠商的硬件系統(tǒng)和軟件優(yōu)化能力,而此次BR104參加的“Closed Division”(固定任務(wù))類別,則要求參評(píng)者在完全一致的模型和環(huán)境下進(jìn)行性能結(jié)果的提交,因此這一類別下的結(jié)果被認(rèn)為是全球數(shù)據(jù)中心產(chǎn)業(yè)最具參考價(jià)值的AI性能基準(zhǔn)測(cè)試結(jié)果。

與此同時(shí),在BERT模型下,BR104還拿下了4卡整機(jī)、8卡整機(jī)性能全球第一的成績(jī),算力能效比也遠(yuǎn)遠(yuǎn)領(lǐng)先于其他廠商,達(dá)到英偉達(dá)A100算力能效比的2.11倍。BERT模型是目前自然語(yǔ)言理解領(lǐng)域應(yīng)用最廣泛的模型之一,也是相關(guān)產(chǎn)業(yè)應(yīng)用中最重要的模型。

壁仞科技董事長(zhǎng)、創(chuàng)始人、CEO張文表示,ResNet50模型和BERT模型是目前產(chǎn)業(yè)客戶最重視的AI模型,此次MLPerf最新發(fā)布的評(píng)測(cè)結(jié)果,直接證明了BR100系列通用GPU芯片的落地應(yīng)用能力。目前,BR104已經(jīng)開始了大規(guī)模的客戶送測(cè)和適配,性能更強(qiáng)大的BR100也已啟動(dòng)落地應(yīng)用,我們對(duì)BR100系列未來(lái)的應(yīng)用前景充滿信心。

【硝煙開始彌漫】

長(zhǎng)期以來(lái),全球GPU產(chǎn)業(yè)都被英偉達(dá)和AMD等美國(guó)企業(yè)所壟斷,在美國(guó)禁令的背景下,中國(guó)在技術(shù)領(lǐng)域“自給自足”的重要性愈發(fā)凸顯。

當(dāng)下,看到機(jī)會(huì)的不止是壁仞科技,除了早先入局的寒武紀(jì)、比特大陸、燧原科技等云端芯片創(chuàng)企外,過(guò)去一年間,陸續(xù)有新玩家現(xiàn)身,大量資本也正積極地涌入這一賽道。

分析機(jī)構(gòu)CCS Insight的分析師表示,壁仞科技已經(jīng)展現(xiàn)出實(shí)力,商機(jī)已經(jīng)落在他們身上,可能會(huì)因此獲得成功。此外,有分析師認(rèn)為,要在人工智能領(lǐng)域獲得成功,不僅是生產(chǎn)芯片,還需要一套與英偉達(dá)CUDA平臺(tái)競(jìng)爭(zhēng)的完整的人工智能軟件生態(tài)系統(tǒng),而這挑戰(zhàn)難度極大。

眾所周知,英偉達(dá)的一個(gè)關(guān)鍵優(yōu)勢(shì)在于2006年發(fā)表的CUDA通用并行計(jì)算平臺(tái)和編程模型,讓GPU成為并行運(yùn)算的首選,如今已被開發(fā)者們大量使用。

壁仞科技CTO洪洲曾表示,新的GPU板卡要無(wú)縫地支持CUDA生態(tài),這比更高的算力,更好的能效比更重要。目前階段必須保證用CUDA寫的程序能無(wú)縫運(yùn)行在壁仞科技的異構(gòu)計(jì)算開發(fā)平臺(tái)上,不應(yīng)當(dāng)為了追求所謂的極致能效,而打破對(duì)通用編程模型的兼容性。

當(dāng)前壁仞科技的第一要?jiǎng)?wù)是在打造自有編程模型的同時(shí),兼容CUDA當(dāng)前版本,而壁仞科技的終極目標(biāo),是提供比CUDA更好的自研編程模型。

國(guó)內(nèi)云端AI芯片及GPU賽道的硝煙正開始彌漫,入局者將越來(lái)越多。

畢竟,GPU, CPU, NPU, XPU國(guó)產(chǎn)化是這一代國(guó)人工程師的歷史使命,也是中國(guó)拿下電車,自動(dòng)駕駛,物聯(lián)網(wǎng)這些蛋糕的前置條件。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)