訂閱
糾錯(cuò)
加入自媒體

中國AI長卷(二):框架立基

2024-07-24 14:17
腦極體
關(guān)注

圖片

2021年正值科技摩擦之際,我采訪到一位工業(yè)機(jī)械公司的技術(shù)負(fù)責(zé)人,向他問到:“制造領(lǐng)域有沒有一些“卡脖子”的情況?”

他提到,“工業(yè)智能制造的核心要素,可以歸納為“三軟三硬”。三軟主要是指大數(shù)據(jù)、人工智能和工業(yè)軟件,三硬主要是指核心裝備、制造工具和材料。卡脖子這個(gè)問題,在各行各業(yè)各個(gè)領(lǐng)域都普遍存在”。

“反倒是深度學(xué)習(xí)框架,現(xiàn)在的情況還好,沒有卡脖子。TensorFlow是開源框架,雖然也是國外的,但目前還沒有封閉,不過也不排除它后期還會(huì)封閉。這也是為什么我們公司選擇國產(chǎn)深度學(xué)習(xí)框架,一是使用門檻更低,二是防患于未然?陀^地說,國產(chǎn)框架離TensorFlow還有一定的差距,但這個(gè)差距在肉眼可見地縮小。”

從傳統(tǒng)的深度學(xué)習(xí)模型時(shí)代,到方興未艾的大模型時(shí)代,都離不開AI框架的平臺(tái)化支撐,其重要性不亞于芯片。但和芯片不同的是,與大模型發(fā)展相適配的國產(chǎn)AI框架,基本實(shí)現(xiàn)了自保。

圖片

這是基礎(chǔ)技術(shù)領(lǐng)域一個(gè)非常大的進(jìn)步,也是中國為什么沒有錯(cuò)過這一輪大模型AI熱潮的原因之一。

2021-2024的短短數(shù)年,從機(jī)器學(xué)習(xí)到大模型,新舊技術(shù)“滄海桑田”,科技行業(yè)風(fēng)云變幻,但AI框架之于產(chǎn)業(yè)的重要性,卻從未改變。

如果說,從信息化、數(shù)字化到智能化的漫長進(jìn)程,就像魚類走向陸地的進(jìn)化變遷,那么AI框架,就處于算力層與應(yīng)用層的中間地帶,猶如海洋與陸地之間的那道“海岸”,支撐著各行各業(yè)與智能浪潮的交融。

那么,究竟什么是大模型所需要的AI框架?AI框架是如何滿足產(chǎn)業(yè)鏈需求的?國產(chǎn)AI框架與海外框架的差距或差異又在哪里?

本文就讓我們深入AI產(chǎn)業(yè)鏈的中樞地帶,沿著AI框架的“海岸”一探究竟。

圖片

魚要經(jīng)由海岸,進(jìn)化成兩棲動(dòng)物,適應(yīng)陸地,才能具備在新環(huán)境的生存能力,拓寬種群的邊界。同理,AI模型從訓(xùn)練到推理的全流程落地,開發(fā)者也需要一種基礎(chǔ)設(shè)施作為助力,這就是AI框架。

一個(gè)底層AI框架,至少具備幾個(gè)特質(zhì):

1.通用性。AI框架作為基礎(chǔ)設(shè)施,廣泛覆蓋各類模型,同時(shí)簡(jiǎn)化了AI開發(fā)過程,對(duì)多種算法進(jìn)行模塊化封裝,讓開發(fā)者不需要“重復(fù)造輪子”,可以快速搭建AI模型。比如對(duì)多元異構(gòu)計(jì)算硬件的適配兼容,支持大分發(fā)多類型任務(wù)調(diào)度的分布式能力,核心算子庫等,是開發(fā)各類算法模型都需要的,都要在框架層去解決。

2.全流程。AI框架集成了模型開發(fā)所需要的工具,為開發(fā)人員提供全流程的開發(fā)環(huán)境。具體來說,訓(xùn)練、調(diào)優(yōu)、測(cè)試和部署的一整個(gè)標(biāo)準(zhǔn)化流程中,所需要的相應(yīng)組件,都能夠在一個(gè)平臺(tái)獲得,進(jìn)行全流程的項(xiàng)目提升,高效滿足各類場(chǎng)景的定制化建構(gòu)需求。

圖片

3.生態(tài)化。從產(chǎn)業(yè)鏈全局來看,AI框架下接芯片,上承應(yīng)用,是芯片廠商、應(yīng)用開發(fā)者、軟件服務(wù)商等多個(gè)行業(yè)主體都匯聚的中樞地帶,形成了非常關(guān)鍵的AI生態(tài)系統(tǒng)。擁有一個(gè)集聚產(chǎn)業(yè)鏈的自研AI框架,就如同擁有了一條生態(tài)豐富、自主可靠的海岸線,是一企乃至一國守住AI疆域的關(guān)鍵。

因此,當(dāng)ChatGPT代表的大模型爆火之后,焦慮無處不在,“我們沒有大語言模型怎么辦?”“高端算力卡被禁了怎么辦?”“基礎(chǔ)軟件卡脖子怎么辦?”但同樣至關(guān)重要的底層AI框架,卻沒有出現(xiàn)“什么時(shí)候才能有自己的框架”的焦慮。

試想一下,如果國計(jì)民生重點(diǎn)行業(yè)的大模型,建立在海外企業(yè)的框架上,開源許可證的斷供風(fēng)險(xiǎn)、數(shù)據(jù)安全風(fēng)險(xiǎn)可想而知。幸好,國產(chǎn)AI框架,早就做好了準(zhǔn)備。

目前,國際有兩大主流AI框架TensorFlow(谷歌)、PyTorch(Meta),而中國自研的AI框架,按照其廠商可以分為三類:

圖片

一是以百度為代表的AI頭部科技企業(yè)推出的,如飛槳paddlepaddle,基于先進(jìn)模型和產(chǎn)業(yè)生態(tài)積累,布局AI框架,建立智能業(yè)務(wù)的體系化優(yōu)勢(shì)。

中國軟件產(chǎn)業(yè)40年功勛人物、“國家卓越工程師”稱號(hào)、百度CTO的王海峰,曾回憶文心一言的開發(fā)過程:2023年要在算力需求爆發(fā)、供應(yīng)緊缺的條件下,快速跟上ChatGPT的趨勢(shì),正是基于百度的深度學(xué)習(xí)框架飛槳paddlepaddle,下游跟主流的芯片廠商做了適配,任何好的算力,我們都能用得起來,很快完成了大模型訓(xùn)練。

圖片

二是以華為云為代表的AI云服務(wù)廠商推出的,如昇思mindspore,通過AI框架,在云基礎(chǔ)設(shè)施和行業(yè)云用戶之間搭建起橋梁,提供完整的云端大模型服務(wù)。

去年大模型的百花齊放,就是很多ToB企業(yè)和軟件公司,利用華為云上的AI框架昇思mindspore,以及盤古大模型、昇騰AI云服務(wù)等,支持國內(nèi)各類開發(fā)者、服務(wù)商等結(jié)合行業(yè)應(yīng)用場(chǎng)景,做出原創(chuàng)模型,支撐了國內(nèi)多個(gè)領(lǐng)域訓(xùn)練并首發(fā)大模型,加速了大模型走向產(chǎn)業(yè)化的進(jìn)程。

三是垂類AI服務(wù)商、研究者推出的深度學(xué)習(xí)框架,具備某些獨(dú)特的技術(shù)特性或應(yīng)用場(chǎng)景,比如曠視科技(Megvii)在計(jì)算機(jī)視覺領(lǐng)域的專長,使其MegEngine框架在圖像處理任務(wù)上表現(xiàn)突出;清華大學(xué)計(jì)算機(jī)系推出的Jittor,特別適合于研究和教育領(lǐng)域,便于快速實(shí)驗(yàn)和算法原型開發(fā);騰訊優(yōu)圖的NCNN框架專為移動(dòng)端和嵌入式設(shè)備優(yōu)化,適合資源受限的環(huán)境或邊緣計(jì)算;一流科技的Oneflow,也是業(yè)內(nèi)完整的深度學(xué)習(xí)框架類產(chǎn)品。

圖片

不同于英偉達(dá)基于芯片構(gòu)建的軟件生態(tài)體系,國產(chǎn)AI芯片廠商受限于產(chǎn)品規(guī)模,自研軟件配套的應(yīng)用范圍比較有限,有待發(fā)育,就不詳述了。

綜上,面對(duì)大模型掀起的這一輪AI浪潮,海外框架平臺(tái)生態(tài)蓬勃,起到了一個(gè)“海闊憑魚躍”的作用。國產(chǎn)AI框架也沒有缺席,為各行各業(yè)探索大模型,奠定了基礎(chǔ),匯聚了力量。

圖片

AI框架之所以沒有缺席,是中國產(chǎn)學(xué)界人士“板凳甘坐十年冷”,一點(diǎn)一滴地構(gòu)筑而成的。這個(gè)過程,遵循了技術(shù)領(lǐng)域的“雙漏斗”規(guī)律,是一個(gè)從擴(kuò)散到收斂,從收斂到擴(kuò)散的過程,其間經(jīng)由開發(fā)者不斷選擇和淘汰,最終演化成了今日格局。

第一階段:早期時(shí)期的擴(kuò)散漏斗(Diversity Phase)

新技術(shù)出現(xiàn)的初期,由于技術(shù)尚未成熟,新的想法和產(chǎn)品層出不窮,市場(chǎng)和用戶對(duì)于哪種技術(shù)會(huì)最終勝出存在很大的不確定性,因此會(huì)出現(xiàn)多樣化的技術(shù)流派。

PC操作系統(tǒng)、移動(dòng)互聯(lián)網(wǎng)OS都經(jīng)歷過百花齊放、多家爭(zhēng)鳴的階段,AI框架也不例外。深度學(xué)習(xí)大行其道的時(shí)候,數(shù)據(jù)、算法和算力激增,工程復(fù)雜度提高,開發(fā)者非常需要減少“重復(fù)造輪子”,直接調(diào)用某些模型或工具,這時(shí)候各大廠商都開始將自研算法和工具封裝為軟件框架,供開發(fā)者使用,涌現(xiàn)出了Theano、Caffe(伯克利大學(xué))、Torch、DistBelief(谷歌,TensorFlow前身)等多款框架。

圖片

同一時(shí)期,國內(nèi)還沒有互聯(lián)網(wǎng)企業(yè)或科技公司做框架,部分高校在學(xué)術(shù)科研角度做了一些零散的工作。構(gòu)建完整的深度學(xué)習(xí)框架,是2013年百度開始。因?yàn)楹茉缇完P(guān)注到深度學(xué)習(xí)技術(shù),百度更早遇到了深度學(xué)習(xí)應(yīng)用上的一些挑戰(zhàn),比如所有的算法從頭寫,開發(fā)效率低,經(jīng)常出錯(cuò);每個(gè)深度學(xué)習(xí)開發(fā)團(tuán)隊(duì)寫的程序差異很大,模塊無法復(fù)用,兼容性也不高,急需一個(gè)統(tǒng)一框架。于是2013年,百度開始在框架上投入。據(jù)了解,當(dāng)時(shí)百度內(nèi)部也是框架百花齊放,開發(fā)了多個(gè)深度學(xué)習(xí)框架,解決不同業(yè)務(wù)的不同問題。

值得注意的是,早在此時(shí)起,國內(nèi)外的框架就已經(jīng)顯露出差異化的特質(zhì)。以Caffe、Torch為代表的海外框架,更偏向于學(xué)術(shù)、工程師使用;以百度為代表的國內(nèi)框架,從產(chǎn)業(yè)土壤上生長出來,一開始就很注重實(shí)用性、功能性、分布式訓(xùn)練、硬件優(yōu)化等產(chǎn)業(yè)特性。

第二階段:競(jìng)爭(zhēng)時(shí)期的收斂漏斗(Consolidation Phase)

隨著時(shí)間的推移,更主要是AI巨頭如谷歌、Facebook、百度的優(yōu)勢(shì)框架相繼開源,其他框架逐漸被淘汰、合并,多樣化的框架格局開始向幾家主導(dǎo)“收斂”。

2015年開始,谷歌大腦宣布TensorFlow開源,2016年百度飛槳宣布開源,2017年Meta人工智能研究院(FAIR)宣布PyTorch開源。開發(fā)者逐漸集中到幾個(gè)主導(dǎo)者生態(tài)中。

圖片

曾經(jīng)的熱點(diǎn)框架如Theano、CNTK(微軟)、Keras、Caffe2都相繼停止維護(hù),或被主流框架收編,百度內(nèi)部也開始將多款框架收斂為paddlepaddle,并正式對(duì)外開源。

這一階段,海內(nèi)外并不“同此涼熱”。

一方面,PyTorch憑借極強(qiáng)的學(xué)術(shù)靈活性、易用性,迅速崛起,已經(jīng)發(fā)布很快成為爆款,成為圍剿谷歌“框架霸權(quán)”(TensorFlow不兼容其他開發(fā)框架)的生力軍。

另一方面,當(dāng)時(shí)國內(nèi)很多企業(yè)的AI意識(shí)還沒有覺醒,以計(jì)算機(jī)視覺為代表的深度學(xué)習(xí)技術(shù),很難滿足產(chǎn)業(yè)落地的精度需求。因此,當(dāng)海外AI巨頭圍繞框架“火星四濺”的時(shí)候,中國的深度學(xué)習(xí)框架依然是“冷板凳”,企業(yè)中只有百度一家在堅(jiān)持做。

如果說,當(dāng)時(shí)海外框架是因競(jìng)爭(zhēng)而主動(dòng)收斂,那國內(nèi)框架就是因?yàn)橛隼涠粍?dòng)孤守。

第三階段:摩擦?xí)r期的再生漏斗(Renewal Phase)

當(dāng)主導(dǎo)框架不再適應(yīng)時(shí)代需求,就會(huì)出現(xiàn)新的創(chuàng)新浪潮,導(dǎo)致技術(shù)的多樣性再次增加。“TensorFlow、PyTorch兩分天下”的局面被改變,國產(chǎn)AI框架的創(chuàng)新再生大爆發(fā),是在2019-2020左右,中美科技摩擦逐漸增多,需求側(cè)和供給側(cè)都發(fā)生了諸多變化。

圖片

從供給側(cè)來看,海外框架爆出安全漏洞,而AI又涉及國計(jì)民生核心領(lǐng)域,供應(yīng)鏈風(fēng)險(xiǎn)不得不重點(diǎn)考慮,自主可靠的國產(chǎn)框架成為必需,供給增多。這一階段,國產(chǎn)AI框架進(jìn)入加速發(fā)展期,除了飛槳PaddlePaddle,華為、阿里巴巴、騰訊、曠視科技等產(chǎn)業(yè)界,以及清華薩血等學(xué)術(shù)界,也都相繼推出了自研框架,豐富了國產(chǎn)框架的活力。

從需求側(cè)來看,隨著AI滲透率提升,中國各行各業(yè)的開發(fā)者需要中文框架,更貼合中國市場(chǎng)的工具與數(shù)據(jù)集,更符合中國開發(fā)者需求的社區(qū)生態(tài),更能滿足中國產(chǎn)業(yè)需求的AI平臺(tái)。

有開發(fā)者曾提到過,偏底層的TensorFlow,沒有為開發(fā)者考慮到大量細(xì)碎問題;習(xí)慣了郵件溝通的海外平臺(tái)社區(qū),無法滿足中文開發(fā)者實(shí)時(shí)交流、社群互動(dòng)的本土化開發(fā)需求;需求分散、場(chǎng)景多樣的國內(nèi)中小企業(yè),很少有技術(shù)人員,TensorFlow、PyTorch純開源框架不能提供成熟低門檻的解決方案,這種模式無法支撐AI廣泛落地。

當(dāng)前階段:大模型時(shí)期的再收斂漏斗

AI框架從深度學(xué)習(xí)到大模型階段,從擴(kuò)散到收斂再到擴(kuò)散,技術(shù)革新與格局嬗變的背后,一條主線從未改變,那就是從學(xué)術(shù)到產(chǎn)業(yè)化,變得越來越易用、實(shí)用。對(duì)開發(fā)者和產(chǎn)業(yè)更友好,更具應(yīng)用優(yōu)勢(shì)的框架,生態(tài)的吸引力更強(qiáng),框架的生命力也就更長,最終從群雄逐鹿的賽場(chǎng)中廝殺出來,成為主導(dǎo)。

目前,源于中國產(chǎn)業(yè)實(shí)踐的國產(chǎn)AI框架,也逐步收斂到更懂產(chǎn)業(yè)應(yīng)用場(chǎng)景、更具技術(shù)先進(jìn)性和生態(tài)規(guī)模優(yōu)勢(shì)的飛槳與昇思。

具體表現(xiàn)在,飛槳和文心一言,昇思與盤古大模型,與產(chǎn)業(yè)結(jié)合的廣度和深度,已經(jīng)超越了其他國產(chǎn)框架的生態(tài)規(guī)模。

同時(shí),形成了全鏈路、低門檻的大模型服務(wù)能力,提供從算力、模型到應(yīng)用、商業(yè)層的多元多層支持,凝聚更加廣泛的開發(fā)者。

圖片

產(chǎn)業(yè)鏈角色的多樣性與開放性也格外顯著,與模廠、硬件廠商、應(yīng)用開發(fā)者、軟件企業(yè)、ISV服務(wù)商等行業(yè)伙伴,都建立起了較好的相互賦能關(guān)系,構(gòu)建起智能服務(wù)的產(chǎn)品結(jié)構(gòu)體系。

進(jìn)入大模型時(shí)代的新階段,AI基礎(chǔ)設(shè)施的重要性,也被拔高到了前所未有的高度。

正如基礎(chǔ)通用模型不可能人人都做,如果企業(yè)和科研機(jī)構(gòu)無差別入場(chǎng)做基礎(chǔ)模型,會(huì)造成算力人力的極大浪費(fèi),也會(huì)讓使用者的精力分散在各種模型的試錯(cuò)上,無法快速凝聚到技術(shù)更強(qiáng)的模型上,框架也是類似的邏輯。

一個(gè)底層框架的技術(shù)優(yōu)勢(shì)、工具完整度、生態(tài)規(guī)模,需要長期積累、聚沙成塔,而基礎(chǔ)軟件又格外需要生態(tài)的發(fā)展和匯集。逐步收斂到飛槳、昇思等更具潛力和繁榮的產(chǎn)業(yè)化框架上,構(gòu)筑AI戰(zhàn)略底座,將是大勢(shì)所趨。

如前所說,AI框架是技術(shù)浪潮與產(chǎn)業(yè)大陸的連接地帶,只有在一次次潮起潮落后,仍然堅(jiān)守下來的平臺(tái),才能成為中國AI產(chǎn)業(yè)鏈的堅(jiān)定守護(hù)者。

圖片

經(jīng)由時(shí)間和市場(chǎng)的洗練,國產(chǎn)框架與海外框架的特性差異,也變得越來越清晰。而這,可以作為一個(gè)側(cè)影,讓我們看到中國AI的差異化亮點(diǎn)。

還記得ChatGPT橫空出世之后,大家總能聽到這樣的言論,“中美AI差距有十年”“OpenAI一心底層創(chuàng)新,中國AI還沒長大就得出去賺錢”“百模大戰(zhàn)是同質(zhì)化的浪費(fèi)資源”……

從AI框架可以看到,更強(qiáng)的產(chǎn)業(yè)化能力,本就是中國AI的底色,也是亮色。

基礎(chǔ)能力上,以飛槳、昇思為代表的AI框架,在產(chǎn)業(yè)AI方面的實(shí)踐更多、積累最早,理解也最為深刻,因此可以很好地支持AI模型開發(fā)與部署,讓產(chǎn)業(yè)迅速、更大規(guī)模應(yīng)用這些新技術(shù)。

圖片

舉個(gè)例子,面向科研、強(qiáng)調(diào)學(xué)術(shù)研究靈活性的PyTorch,對(duì)產(chǎn)業(yè)應(yīng)用的推理部署需求,做得是比較薄弱的,而國產(chǎn)框架為大模型到產(chǎn)業(yè)鋪設(shè)了一條高效通道。

飛槳很快上線了對(duì)大模型開發(fā)的功能支持,提供了一系列模型封裝能力,加速大模型的產(chǎn)業(yè)化落地。昇思MindSpore提供了一整套高效、易用的大模型使能套件,形成了端到端的使能大模型開發(fā)能力。

通過AI框架,開發(fā)者與行業(yè)少走彎路,不重復(fù)造輪子,快速高效地把大模型用起來,這是中國的基座通用大模型快速跟進(jìn)、行業(yè)大模型爆發(fā)的前提。

產(chǎn)品體系上,源于產(chǎn)業(yè)需求的國產(chǎn)AI框架,能力布局更加全面、細(xì)致,可以更好地滿足產(chǎn)業(yè)落地AI大模型的實(shí)際需求。

純開源的海外模型,常常會(huì)強(qiáng)調(diào)自己的技術(shù)有多厲害,有多強(qiáng),對(duì)開發(fā)者就主打一個(gè)“野蠻生長”,這與其數(shù)字化水平、數(shù)字人才等都有直接關(guān)系。

然而中國企業(yè)的小、分散、需求長尾,決定了AI框架作為產(chǎn)業(yè)基礎(chǔ)設(shè)施,是不能輕易“放養(yǎng)”的。

圖片

比如硬件適配,海外以英偉達(dá)為主導(dǎo)的硬件市場(chǎng),也不像中國面臨多元異構(gòu)算力問題的巨大挑戰(zhàn)。作為國產(chǎn)AI框架,必須進(jìn)行軟硬件結(jié)合的深度融合優(yōu)化,做特別多的工程開發(fā)工作,來降低開發(fā)者的硬件適配成本。

再比如模型庫。模型庫不是深度學(xué)習(xí)框架核心的組成部分,底層框架廠商投入精力去打造更細(xì)分的模型,看起來好像是把精力分散到了外圍一些無關(guān)緊要的東西上,而不是底層核心技術(shù)。但從產(chǎn)業(yè)應(yīng)用的角度來看,中國存在大量企業(yè),沒有專門的研發(fā)人員能夠使用核心框架,從頭完成一個(gè)模型的自研工作,AI也沒有辦法落在產(chǎn)業(yè)需求中。

利用框架平臺(tái)的AI解決方案、模型和開發(fā)套件,進(jìn)行微調(diào)改寫,就能得到一個(gè)貼合場(chǎng)景的定制化模型,這更符合中國的產(chǎn)業(yè)實(shí)際。

圖片

源于產(chǎn)業(yè)、面向產(chǎn)業(yè)、托舉產(chǎn)業(yè),以國產(chǎn)AI框架為基,如同隱藏在漫長時(shí)光深處的“海岸”,在技術(shù)潮水涌動(dòng)之際,才能看出戰(zhàn)略價(jià)值,支撐住中國產(chǎn)學(xué)政各界對(duì)大模型技術(shù)的期待。

處于產(chǎn)業(yè)鏈中樞地帶的AI框架,以穩(wěn)定的底座、全產(chǎn)業(yè)鏈的貫通、較低的門檻,吸引了大量行業(yè)和從業(yè)者在這里棲身,適應(yīng)并探索AI新技術(shù);

在這里“進(jìn)化”,從非數(shù)字原生組織,生長出數(shù)字化、智能化的能力;

在這里“融合”,多種產(chǎn)業(yè)角色在這里交流、融合、創(chuàng)新,匯聚起豐富的AI生態(tài)。

最終,經(jīng)由AI框架的“海岸”,開發(fā)者和行業(yè)一步步向AI時(shí)代遷徙,開啟產(chǎn)業(yè)智能進(jìn)化的新篇章。

       原文標(biāo)題 : 中國AI長卷(二):框架立基

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)