国产v亚洲V天堂无码下载,午夜精品褔利一区二区三区蜜桃

未來的大模型，或許都是A卡來算的？

2024-10-21 09:54

Ai芯天下

關(guān)注

前言：

當(dāng)前，算力中心領(lǐng)域正面臨一個重要趨勢，即隨著部分大型模型制造商逐漸減少對預(yù)訓(xùn)練的依賴，對推理能力和模型微調(diào)的需求顯著增加。

這一變化對下游大型模型和應(yīng)用開發(fā)商產(chǎn)生了深遠(yuǎn)影響，進(jìn)而促使上游芯片制造商迅速調(diào)整戰(zhàn)略方向。

然而，僅僅依靠單一芯片的差異化競爭已難以滿足市場需求。

作者 | 方文三

圖片來源 | 網(wǎng) 絡(luò)

AMD新品直接對標(biāo)英偉達(dá)Blackwell系列芯片

AMD公司在舊金山舉辦的Advancing AI 2024盛會上，其首席執(zhí)行官蘇姿豐推出了全新一代的Ryzen CPU、Instinct AI計算卡以及EPYC AI芯片等系列產(chǎn)品。

這些產(chǎn)品全面覆蓋了AI計算領(lǐng)域，并明確針對英偉達(dá)公司的Blackwell系列芯片展開競爭。

據(jù)國際媒體報道，過去幾年中，英偉達(dá)在數(shù)據(jù)中心GPU市場中占據(jù)了顯著的領(lǐng)導(dǎo)地位，近乎形成壟斷態(tài)勢，而AMD則長期穩(wěn)居市場份額的第二位。

今年初，英偉達(dá)又發(fā)布了其性能巔峰之作B200，其運(yùn)算能力相較于上一代H200芯片實(shí)現(xiàn)了近30倍的提升。

根據(jù)規(guī)劃，B200將于今年第四季度實(shí)現(xiàn)量產(chǎn)并投放市場，預(yù)計將進(jìn)一步拉大與競爭對手的差距。

然而，隨著MI325X的發(fā)布，AMD旨在與英偉達(dá)的Blackwell芯片展開有力競爭。

AMD在其Instinct MI325X GPU中集成了8個MI325X單元，該配置能夠支持最高達(dá)2TB的HBM3E內(nèi)存；

其FP8精度下的理論峰值性能可達(dá)20.8 PFLOPs，而在FP16精度下則可達(dá)10.4 PFLOPs。

在系統(tǒng)架構(gòu)方面，AMD采用了Infinity Fabric互連技術(shù)，實(shí)現(xiàn)了高達(dá)896 GB/s的帶寬，并且總內(nèi)存帶寬達(dá)到了48 TB/s。

此外，每個GPU的功耗也從原先的750W提升至了1000W。

與英偉達(dá)H200 HGX相比，Instinct MI325X在內(nèi)存量、內(nèi)存帶寬及算力水平方面分別展現(xiàn)出1.8倍和1.3倍的優(yōu)勢。

在推理性能上，其相較H200 HGX也實(shí)現(xiàn)了約1.4倍的提升。

在Meta Llama-2等主流模型中，MI325X的單GPU訓(xùn)練效率已超越H200，但在集群環(huán)境中，兩者則保持相當(dāng)水平。

此外，AMD還著重介紹了其下一代MI300系列GPU加速器——MI355X。

該型號基于下一代CDNA 4架構(gòu)，并采用3nm制程工藝，其內(nèi)存容量已升級至288GB HBM3E。

MI355X能夠同時支持FP4和FP6數(shù)據(jù)類型，從而在保持計算精度的同時，進(jìn)一步提升AI訓(xùn)練和推理性能。

AMD方面表示，下一代CDNA 4架構(gòu)相較于CDNA 3架構(gòu)，預(yù)計將有35倍的性能提升和7倍的AI算力提升，同時內(nèi)存容量和帶寬也將提升約50%。

因此，明年的Instinct MI355X AI GPU在性能上預(yù)計將實(shí)現(xiàn)巨大飛躍。

根據(jù)AMD目前公布的數(shù)據(jù)，Instinct MI355X AI GPU在FP16數(shù)據(jù)格式下的算力可達(dá)到2.3PF，相較于MI325X提高了1.8倍，并與英偉達(dá)B200的算力持平。

而在FP6和FP4格式下，其算力則能達(dá)到9.2PF，較B200在FP6格式下的算力提高近一倍，與B200在FP4格式下的算力相當(dāng)。

因此，MI355X被視為AMD真正對標(biāo)B200的GPU芯片。

Blackwell GPU的生產(chǎn)問題目前已解決

此前有報道稱，Blackwell架構(gòu)產(chǎn)品的生產(chǎn)過程中遭遇了一些問題，具體表現(xiàn)為良品率較低，進(jìn)而影響了出貨量。

英偉達(dá)Blackwell GPU作為首批采用臺積電CoWoS-L封裝技術(shù)的產(chǎn)品，該技術(shù)通過LSI橋接器構(gòu)建高密度互聯(lián)，能夠無縫兼容各類高性能芯片。

然而，由于GPU芯片、RDL中間層、LSI橋接器及基板之間的熱膨脹系數(shù)（CTE）存在差異，這在一定程度上給生產(chǎn)帶來了挑戰(zhàn)。

摩根士丹利指出，英偉達(dá)Blackwell GPU在生產(chǎn)過程中出現(xiàn)的良率下降問題主要發(fā)生在后封裝階段，這進(jìn)一步加劇了原本就緊張的CoWoS封裝及HBM3e內(nèi)存的供應(yīng)狀況。

不過，該機(jī)構(gòu)認(rèn)為英偉達(dá)已內(nèi)部解決了這些問題。

摩根士丹利預(yù)測，英偉達(dá)將在今年第四季度出貨最多45萬張Blackwell GPU，有望實(shí)現(xiàn)50億美元至100億美元的營收。

同時，該機(jī)構(gòu)還表示，由于當(dāng)前Blackwell GPU訂單已排滿至明年下半年，無法滿足的訂單將轉(zhuǎn)而推動Hopper GPU的需求增長。

英偉達(dá)Blackwell GPU的生產(chǎn)問題曾被視為AMD公司的一個潛在機(jī)遇，然而，這一機(jī)遇并未如預(yù)期般兌現(xiàn)。

AMD的UDNA與英偉達(dá)CUDA競爭生態(tài)位

在ADVANCING AI 2024大會上，AMD進(jìn)一步揭示了其AI芯片發(fā)展藍(lán)圖，宣布基于CDNA 4架構(gòu)的MI350系列將于明年面世，而MI400系列則將采用更為先進(jìn)的CDNA架構(gòu)。

然而，要撼動英偉達(dá)CUDA生態(tài)的領(lǐng)先地位，AMD仍面臨諸多挑戰(zhàn)，需付出長期努力。

UDNA作為AMD的一項長遠(yuǎn)布局，其潛力尚需時間驗(yàn)證。

AMD在擴(kuò)大市場份額的過程中，面臨的主要挑戰(zhàn)在于英偉達(dá)通過其CUDA平臺在AI軟件開發(fā)領(lǐng)域構(gòu)建了堅固的壁壘，吸引了大量開發(fā)人員并深度綁定了他們與英偉達(dá)的生態(tài)系統(tǒng)。

CUDA生態(tài)系統(tǒng)，作為英偉達(dá)所獨(dú)有的并行計算平臺與編程模型，現(xiàn)已確立為AI領(lǐng)域及高性能計算任務(wù)中的基準(zhǔn)標(biāo)準(zhǔn)。

AMD所面臨的挑戰(zhàn)，不僅聚焦于硬件性能的提升，更在于構(gòu)建一個能夠吸引開發(fā)人員與數(shù)據(jù)科學(xué)家關(guān)注的軟件生態(tài)系統(tǒng)。

為此，AMD已加大對其ROCm（Radeon Open Compute）軟件堆棧的投資力度，并在近期活動中宣布，已成功將AMD Instinct MI300X加速器在廣泛應(yīng)用的AI模型中的推理與訓(xùn)練性能提升一倍。

此外，該公司還指出，已有超過百萬個模型能夠在AMD Instinct平臺上無縫運(yùn)行，這一數(shù)字是MI300X推出之初的三倍。

退出高端顯卡市場，專注AI市場

對于游戲玩家群體，主流大廠針對英偉達(dá)產(chǎn)品的專屬優(yōu)化策略展現(xiàn)出了難以抗拒的吸引力。

鑒于此，AMD目前暫時退出高端顯卡市場的舉措，被視為一項更為明智的商業(yè)抉擇。

值得注意的是，這并非AMD首次在高端市場向英偉達(dá)讓步。

回溯至2017至2019年間，AMD實(shí)際上已缺席高端顯卡領(lǐng)域，彼時Vega 64與Radeon VII相繼淡出市場，僅依賴RX580與RX590兩款產(chǎn)品在中低端市場維持競爭力。

AMD當(dāng)前的戰(zhàn)略重心聚焦于中低端市場，旨在擴(kuò)大用戶基礎(chǔ)，并通過龐大的用戶群體引導(dǎo)開發(fā)者優(yōu)化產(chǎn)品。

此外，AMD的戰(zhàn)略性撤退或可視為其在AI領(lǐng)域[梭哈]的前奏。

鑒于AMD董事長兼首席執(zhí)行官蘇姿豐博士對AI超級周期剛剛啟幕的堅定判斷，公司將AI視為未來發(fā)展的關(guān)鍵方向，不惜重注投入。

面對AI芯片這一快速增長的市場，AMD無疑不愿錯失良機(jī)。

盡管其CPU業(yè)務(wù)因ZEN架構(gòu)的成功而持續(xù)繁榮，但獨(dú)立顯卡、尤其是高端游戲顯卡的市場表現(xiàn)卻難盡如人意。

因此，揚(yáng)長避短、專注于AI產(chǎn)品的開發(fā)，成為了AMD當(dāng)前最合理的選擇。

盡管英偉達(dá)在AI訓(xùn)練性能領(lǐng)域依然保持顯著優(yōu)勢，但AI領(lǐng)域的真正盈利點(diǎn)在于推理工作負(fù)載。

簡而言之，訓(xùn)練是通過數(shù)據(jù)集來[教育]AI模型的過程，而推理則是訓(xùn)練后的模型對全新數(shù)據(jù)進(jìn)行預(yù)測的過程。

但值得注意的是，AMD對其加速服務(wù)器產(chǎn)品的定價策略相當(dāng)激進(jìn)，這與凈利潤率超過50%的英偉達(dá)形成了鮮明對比。

這一策略與AMD在CPU市場上削弱英特爾地位所采用的方法如出一轍，鑒于性價比優(yōu)勢，該策略或?qū)⒋偈共糠挚蛻魪挠ミ_(dá)轉(zhuǎn)向AMD。

AMD當(dāng)下的首要目標(biāo)是爭取更多的市場訂單

TechInsights公司的研究報告指出，英偉達(dá)在2023年的數(shù)據(jù)中心GPU出貨量達(dá)到了約376萬臺，占據(jù)了97.7%的市場份額，這一比例與2022年大致相當(dāng)。

相比之下，AMD和英特爾分別以50萬臺和40萬臺的出貨量位列其后，市場份額分別占據(jù)了1.3%和1%。

對于AMD而言，其當(dāng)前的主要目標(biāo)并非超越英偉達(dá)，而是積極爭取更多的市場訂單。

作為英偉達(dá)在市場上的少數(shù)競爭對手之一，AMD始終被科技巨頭視為多元化的選擇之一。

目前，AMD業(yè)務(wù)中AI芯片所占比重持續(xù)攀升。

依據(jù)AMD二季度財務(wù)報告，AMD Instinct MI300X GPU在當(dāng)季度為AMD貢獻(xiàn)了超過10億美元的營業(yè)收入，并預(yù)計全年銷售額將突破45億美元大關(guān)，約占公司整體銷售額的15%。

值得注意的是，包括微軟、OpenAI、Meta、Cohere、Stability AI、Lepton AI及World Labs在內(nèi)的多家企業(yè)，在其生成式AI解決方案中均選用了AMD Instinct MI300X GPU。

除了獲得科技巨頭的支持外，AMD產(chǎn)品的性價比優(yōu)勢也是其搶占市場的重要因素。

英偉達(dá)由于其技術(shù)領(lǐng)先和市場高占比，其產(chǎn)品溢價較高。

相比之下，AMD的MI300系列在性能上已經(jīng)超越了英偉達(dá)的H100，且價格更為親民。

這一性價比優(yōu)勢使得AMD在AI芯片市場上具有較大的發(fā)展?jié)摿Α?/p>

基于以上分析，蘇姿豐對AMD在2024年的人工智能芯片收入預(yù)測進(jìn)行了上調(diào)，預(yù)計將達(dá)到超過45億美元的水平，這一數(shù)字高于其4月份的預(yù)估值40億美元。

這進(jìn)一步表明了AMD在AI芯片市場上的強(qiáng)勁增長勢頭和廣闊發(fā)展前景。

與英偉達(dá)相似，AMD亦規(guī)劃每年推出全新的AI芯片產(chǎn)品。

結(jié)尾：

對于AMD而言，雖然英偉達(dá)產(chǎn)能的恢復(fù)可能帶來競爭壓力，但幸運(yùn)的是，AMD也已逐漸找到了適合自己的競爭節(jié)奏。

展望2025年，兩大芯片巨頭將在GPU領(lǐng)域再次正面交鋒，這將是檢驗(yàn)雙方綜合實(shí)力的關(guān)鍵一年。

隨著技術(shù)的不斷進(jìn)步和GPU在更多領(lǐng)域的廣泛應(yīng)用，這兩家公司將持續(xù)優(yōu)化GPU架構(gòu)、提高計算效率，共同推動智能互聯(lián)時代的到來。

部分資料參考：潮外音：《AMD發(fā)布最強(qiáng)AI芯片，對標(biāo)英偉達(dá)Blackwell，2025年上市》，至頂頭條：《AMD發(fā)力GPU計算領(lǐng)域，現(xiàn)在壓力來到英偉達(dá)這邊》，機(jī)器之心：《AMD的GPU跑AI模型終于Yes了？PK英偉達(dá)H100不帶怕的》，電子發(fā)燒友網(wǎng)：《AMD最強(qiáng)AI芯片，性能強(qiáng)過英偉達(dá)H200，但市場仍不買賬，生態(tài)是最大短板？》，美股研究社：《AMD 即將奪得英偉達(dá)的 AI 領(lǐng)先地位》，報告財經(jīng)：《OORT創(chuàng)始人：AMD在AI芯片市場對英偉達(dá) 的挑戰(zhàn)》， NO 易摸：《AMD最強(qiáng)AI芯片登場，性能或徹底超越英偉達(dá)》，三易生活：《放棄高端顯卡市場，AMD或是選擇了[梭哈]AI》，賽博汽車：《挑戰(zhàn)英偉達(dá)，AMD正成為一家AI芯片公司》，大盛唐電子：《英偉達(dá)與AMD：GPU競爭的歷史與未來》

原文標(biāo)題 : AI芯天下丨分析丨未來的大模型，或許都是A卡來算的？