深度學(xué)習(xí)框架簡史:“PPT”格局初現(xiàn),中國占有一席
撰文 / 張賀飛
編輯 / 沈潔
“科技無國界”的幻想,因為東歐的戰(zhàn)火被徹底擊碎。
蘋果、谷歌、Facebook、SAP、微軟等科技巨頭,早已有了實際的行動。單單是Apple Pay和Google Pay的停用,就已經(jīng)影響了數(shù)千萬人的生活秩序,而GitHub、Node、React等開源平臺針對俄羅斯開發(fā)者的嚴(yán)格限制,則給不少企業(yè)的產(chǎn)品開發(fā)、商業(yè)運作蒙上了一層不確定的陰影。
在這樣的語境下,開源軟件的自主可控再度成為輿論場上的焦點,特別是作為AI基礎(chǔ)技術(shù)的深度學(xué)習(xí)框架,更是聚焦了無數(shù)開發(fā)者的關(guān)切。深度學(xué)習(xí)框架屬于AI的底層技術(shù)創(chuàng)新,一旦這些技術(shù)被套上枷鎖,千行百業(yè)的智能化轉(zhuǎn)型將被制約,甚至?xí)绊憞鴥?nèi)第四次工業(yè)革命的進(jìn)程。
可能在不少人的認(rèn)知里,深度學(xué)習(xí)框架還是一個陌生的詞匯,對其所扮演的角色以及重要性仍處于懵懂狀態(tài)。我們不妨從盤點和回顧的視角,梳理下深度學(xué)習(xí)框架的周期演變,在從學(xué)術(shù)圈走向工業(yè)界再到產(chǎn)業(yè)化的歷程中,找尋屬于中國企業(yè)的機會和挑戰(zhàn)到底在哪里。
01 學(xué)術(shù)時代:學(xué)者們的“刀耕火種”
想要講清楚深度學(xué)習(xí)框架的起源,難免要花上一定的篇幅,簡單概述下人工智能技術(shù)的進(jìn)化歷程:
早在1943年,美國心理學(xué)家麥卡洛克和數(shù)學(xué)家皮茨就提出了人工神經(jīng)網(wǎng)絡(luò)的概念,比世界上最早的通用計算機的出現(xiàn)還早了3年時間。
其后出現(xiàn)了不少新概念和新模型,但人工智能的進(jìn)展始終差強人意。直到杰弗里·辛頓在2006年發(fā)表了一篇題為《一種深度置信網(wǎng)絡(luò)的快速學(xué)習(xí)算法》的文章,其中的核心理念是利用 GPU 來加速訓(xùn)練,大幅提高了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度。
時間來到2012年,師從杰弗里·辛頓的多倫多大學(xué)研究生艾力克斯·克柴夫斯基,在當(dāng)年的 ImageNet 挑戰(zhàn)賽中使用一種新的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行訓(xùn)練,在 ImageNet 數(shù)據(jù)集上達(dá)到了 SOTA 精度,遠(yuǎn)超一些學(xué)術(shù)界的頂級團(tuán)隊。這種深度神經(jīng)網(wǎng)絡(luò)架構(gòu),就是后來大名鼎鼎的AlexNet,并在全球范圍內(nèi)掀起了深度學(xué)習(xí)的熱潮。
在機器學(xué)習(xí)大行其道的時候,幾乎沒有一種算法在大量的問題上取得壓倒性的優(yōu)勢,大多數(shù)業(yè)務(wù)問題可以通過大數(shù)據(jù)和算法結(jié)合的經(jīng)典方式解決?傻搅松疃葘W(xué)習(xí)的時代,數(shù)據(jù)、算法和算力都在爆炸式增長,為了提高工作的效率,一些研究者開始編寫深度學(xué)習(xí)模型的幾個必要過程,把前人的研究成果不斷沉淀其中,后來人可以直接調(diào)用某些成果,大幅降低了編寫深度學(xué)習(xí)模型的門檻。
“深度學(xué)習(xí)框架”的概念由此誕生,迅速涌現(xiàn)出了Theano、Caffe、Torch等多款深度學(xué)習(xí)框架,至今仍是人工智能圈子里的熱門話題。
科技文明的每一次躍進(jìn),都離不開個體的靈光乍現(xiàn),人工智能又恰恰是一個標(biāo)準(zhǔn)的眾創(chuàng)型技術(shù)。所以早期深度學(xué)習(xí)框架的締造者,往往被賦予一種特殊的光環(huán),并隨著時間的推移不斷放大其中的價值?苫仡^來看,這些盛名在外的早期框架也有著時代的局限性,所能解決的往往是一類問題,而且有著鮮明的學(xué)術(shù)色彩。
比如艾力克斯·克柴夫斯基就寫過一套名叫Cuda-Convnet的深度學(xué)習(xí)框架,可以在GPU上快速跑神經(jīng)網(wǎng)絡(luò),卻不怎么重視工程設(shè)計,也談不上模塊化和抽象化能力,單純是為了搞科研、出論文。
深度學(xué)習(xí)開源工具的鼻祖Theano,嚴(yán)格地說是一個擅長處理多維數(shù)組的 Python 庫,用于高效解決多維數(shù)組的計算問題。相較于當(dāng)前深度學(xué)習(xí)框架的功能,Theano更像是一個數(shù)學(xué)表達(dá)式的編譯器。
值得一提的是,在深度學(xué)習(xí)框架“刀耕火種”的日子里,中國的學(xué)者們并沒有缺席。百度2013年成立了深度學(xué)習(xí)研究院,Caffe等框架的主導(dǎo)者中都有華人的身影。暗合科技創(chuàng)新的潛在趨勢,中國不再是創(chuàng)新進(jìn)程中的跟隨者,這一次我們也站在了最前沿的領(lǐng)域。
02 商業(yè)時代:科技巨頭“闖入江湖”
2015年是深度學(xué)習(xí)框架的轉(zhuǎn)折點,這年前后發(fā)生了兩件深刻影響到人工智能歷史進(jìn)程的重要事件:
一件發(fā)生在學(xué)術(shù)領(lǐng)域。微軟亞洲研究院的學(xué)者提出了著名的ResNet架構(gòu),影響力絲毫不輸當(dāng)年的AlexNet,不僅在ImageNet的準(zhǔn)確率上再創(chuàng)新高,也讓學(xué)術(shù)界外的工業(yè)界形成了一個共識,即深度學(xué)習(xí)將成為下一個重大技術(shù)趨勢。
另一件發(fā)生在圍棋圈。谷歌旗下DeepMind團(tuán)隊開發(fā)的AlphaGo,和韓國著名棋手李世石進(jìn)行了一場圍棋人機大戰(zhàn),最終以4比1的總比分獲勝。由此出圈的不只有AlphaGo和谷歌,深度學(xué)習(xí)的概念也被越來越多的“行外人”知曉。
后知后覺的話,這兩起事件都有其吊詭之處。ResNet在2015年的原始?xì)埐罹W(wǎng)絡(luò)的結(jié)果一度被質(zhì)疑無法復(fù)現(xiàn),而AlphaGo的圍棋挑戰(zhàn)賽本身就有作秀的嫌疑。草蛇灰線,伏脈千里,不尋常的背后是科技巨頭們的精妙布局。
2013年3月,谷歌以4400萬美元的價格收購了杰弗里·辛頓創(chuàng)建的DNNResearch,這場交易的重心并不是什么新業(yè)務(wù),而是辛頓本人和他的兩位學(xué)生。據(jù)說百度也參與了這場“拍賣”,并堅持到了辛頓做出選擇的最后一刻。
谷歌瘋狂“斂才”的原因,在2015年11月被揭曉:谷歌大腦團(tuán)隊開發(fā)的深度學(xué)習(xí)框架TensorFlow正式開源,杰弗里·辛頓為此做了很多貢獻(xiàn)。谷歌的另一位研究員弗朗索瓦·喬萊特,幾乎獨自完成了Keras框架的開發(fā),為谷歌再添一條護(hù)城河。
遺憾錯失杰弗里·辛頓的百度也沒閑著,2012年開始大規(guī)模采購和建立GPU運算集群,是國內(nèi)最早投入研究深度學(xué)習(xí)平臺的企業(yè),培養(yǎng)和吸納大批AI頂尖人才,內(nèi)部打磨重構(gòu)多年的PaddlePaddle,也在2016年正式開源,后來取了一個中文名字叫“飛槳”。
同樣對深度學(xué)習(xí)框架野心勃勃的Meta(原Facebook),走了一條循序漸進(jìn)的路。先是控制了著名的深度學(xué)習(xí)庫Torch,然后用從Python替換了Lua語言,對Tensor上的全部模塊進(jìn)行重構(gòu),并在2017年初以PyTorch的身份正式開源。同時還搞了Caffe2項目,像谷歌一樣開啟了雙平臺戰(zhàn)略。
這個階段可以說是深度學(xué)習(xí)框架的第一次“百家爭鳴”,Amazon主導(dǎo)的MXNet、微軟背書的CNTK陸續(xù)出現(xiàn)在開源名單上。深度學(xué)習(xí)框架不再是學(xué)者們的自留地,科技巨頭們接過了主導(dǎo)市場的權(quán)柄。
相對應(yīng)的是新舊交替的一幕。
Alpha Go最初是基于Torch開發(fā)的,但在TensorFlow開源后立即進(jìn)行了遷移;Theano的開發(fā)團(tuán)隊在2017年9月宣布停止維護(hù)和更新,從此退出了歷史舞臺;微軟的CNTK經(jīng)歷了一定時間的奮力追趕后,最終在2019年宣布停止維護(hù);Keras后來被TensorFlow收編,Caffe2被PyTorch接納......
還有很多不知名的深度學(xué)習(xí)框架,還沒來得及被外界所熟知,就被埋在了人工智能高速增長所掀起的塵土中。相比于豪擲千金買技術(shù)、團(tuán)隊、人才的巨頭,很多初創(chuàng)企業(yè)常常被各種因素束手束腳,結(jié)局在一開始就注定了。
03 應(yīng)用時代:“剩者為王”的競速賽
正如人類歷史屢屢被驗證的趨勢,深度學(xué)習(xí)框架經(jīng)歷過短暫的激烈角逐后,也呈現(xiàn)出了“寡頭化”的局面。
背靠谷歌這座開源大山,TensorFlow在開源伊始就表現(xiàn)出了主場優(yōu)勢,大批學(xué)者自覺轉(zhuǎn)移了陣地。按照谷歌天才科學(xué)家杰夫·迪恩在一次演講中的說法:2016年TensorFlow的論文引用次數(shù)呈現(xiàn)出指數(shù)級暴漲。
不過,谷歌無意在學(xué)術(shù)圈畫地為牢,早早將目光瞄向了工業(yè)界,得到了英特爾、英偉達(dá)等硬件平臺的配合,向全球開發(fā)者免費供給AI庫與工具,并在2015年推出了專門為TensorFlow框架打造的計算神經(jīng)網(wǎng)絡(luò)專用芯片TPU,引發(fā)了云端造芯的浪潮,并以每年一代的速度持續(xù)迭代。
應(yīng)該說,谷歌的商業(yè)嗅覺非常靈敏,ResNet和AlphaGo一下子就點燃了工業(yè)界的激情,人工智能以熊熊大火之勢席卷工業(yè)界。TensorFlow自然而然地向工業(yè)需求進(jìn)行傾斜,逐步推出了TensorFlow Serving、TensorFlow Lite等產(chǎn)品,讓客戶可以在云、服務(wù)器、移動設(shè)備和 IoT 設(shè)備上進(jìn)行部署。
此舉卻被學(xué)術(shù)界詬病連連,學(xué)者們追求的不是部署的便捷性,而是易用性。這也為身為后來者的PyTorch提供了可乘之機,憑借“易用性”的聚力一招,PyTorch在研究領(lǐng)域迅速站穩(wěn)腳跟,大多數(shù)出版論文和開源模型都在使用 PyTorch,目前論文中的占比已經(jīng)達(dá)到80%,有了和TensorFlow分庭抗禮的資格。
國外不少研究者心中,深度學(xué)習(xí)框架已經(jīng)是TensorFlow和 PyTorch共天下的局面,代表了深度學(xué)習(xí)框架研發(fā)和生產(chǎn)中 90% 以上的用例?蓪⒅袊袌黾{入討論范疇的話,則出現(xiàn)了一些不同的聲音。
知名市場調(diào)研機構(gòu)IDC曾在2020年下半年公布了一份中國深度學(xué)習(xí)框架平臺市場份額的報告,TensorFlow、飛槳和PyTorch排名前三,合計占據(jù)了70%以上的份額。等到2021年上半年,IDC再次更新了市場報告,彼時百度飛槳已經(jīng)超越TensorFlow位居中國市場綜合份額第一。
我們曾就這份報告詢問過不少開發(fā)者,對方給出的回答大多是“沒想到”,再進(jìn)一步的溝通后,聽到最多的聲音是:“原來EasyDL也是飛槳的產(chǎn)品!逼渲斜活l頻強調(diào)的EasyDL,是百度基于飛槳深度學(xué)習(xí)框架構(gòu)建的零門檻AI開發(fā)平臺,開發(fā)者上傳數(shù)據(jù)并標(biāo)注后,即可訓(xùn)練相應(yīng)的模型部署應(yīng)用。
考慮到中國在人才方面的巨大缺口,飛槳的市場滲透方式有著鮮明的實用主義,先讓客戶把AI模型用起來,哪怕他們并不知道后面還有一個深度學(xué)習(xí)框架。因為中國的大部分中小企業(yè)并不具備專業(yè)的AI算法開發(fā)能力,開發(fā)定制 AI 模型絕不是一件容易的事?蓮慕Y(jié)果導(dǎo)向的話,飛槳或許摸索出了不同于谷歌、Facebook的第三條路。
巨頭們“闖入江湖”的連鎖反應(yīng)已然發(fā)生,市場份額越來越向少數(shù)幾個平臺集中,無論是美國還是中國,同時在便捷性、易用性、穩(wěn)定性的多重指標(biāo)下,算法、算力、編譯器等一個都不能少,深度學(xué)習(xí)框架的門檻正變得高不可攀。
04 產(chǎn)業(yè)時代:中國市場“暗”流涌動
中國市場對深度學(xué)習(xí)框架的關(guān)注,在時空上遲滯了許多,直到中美科技戰(zhàn)的爆發(fā),相關(guān)討論才多了起來。
相當(dāng)長的一段時間里,中國開發(fā)者都是TensorFlow、PyTorch的重度擁躉,還有一些企業(yè)曾經(jīng)深耕過MXNet。這里面的原因很復(fù)雜,百度的工程師文化講求實干不張揚,飛槳在很長一段時間里專注于技術(shù)和產(chǎn)品,在輿論場上缺少存在感。
國內(nèi)的其他互聯(lián)網(wǎng)公司則犯了“拿來主義”的錯誤,要么缺少創(chuàng)新精神,怯于和海外的科技巨頭同臺競技;要么奔著摘果子的心態(tài),等別人探索出了眉目再跟隨借鑒...... 所以在2020年以前,中國的深度學(xué)習(xí)框架屈指可數(shù),除了百度打造的飛槳,只有小米MACE、阿里巴巴XDL在內(nèi)的幾個推理框架。
轉(zhuǎn)機出現(xiàn)在2018年前后,中興、華為等企業(yè)先后被美國制裁。當(dāng)Matlab這樣的老牌工具都能被禁用時,不少企業(yè)逐漸嗅到了“危險”的氣息:倘若Pytorch和Tensorflow有一天重蹈Matlab的覆轍,對中國AI產(chǎn)業(yè)的影響無異于釜底抽薪。
深度學(xué)習(xí)框架的應(yīng)用也在這個時間點進(jìn)入了產(chǎn)業(yè)化階段,且呈現(xiàn)出了兩個典型的特征:一是大型模型訓(xùn)練,GPT-3、BERT等大模型的誕生,需要在數(shù)百臺甚至數(shù)千臺設(shè)備上進(jìn)行訓(xùn)練,所瞄準(zhǔn)的正是產(chǎn)業(yè)化的需求;二是可用性,TensorFlow、飛槳、PyTorch先后引入了計算圖和動態(tài)圖,目的是讓運算更加簡潔,開發(fā)者可以采用命令式的編程風(fēng)格,方便進(jìn)行模型的調(diào)試。
留給企業(yè)和開發(fā)者的,其實是一個三難的選擇:倘若像過去那樣All in國外的深度學(xué)習(xí)框架,存在著各種不確定風(fēng)險;如果盲目退出國外的框架,似乎也不是理智的選擇,有競爭才會有進(jìn)步;何況深度學(xué)習(xí)框架屬于高投入、長周期、搶生態(tài)的競爭,在產(chǎn)業(yè)鏈中承上啟下的關(guān)鍵地位,有著統(tǒng)領(lǐng)產(chǎn)業(yè)進(jìn)步節(jié)奏、帶動終端場景與云端服務(wù)協(xié)同發(fā)展的重要作用,押錯寶的代價不言而喻。
所幸最后的結(jié)果并不算糟糕。
按照百度官方的信息,目前基于飛槳開發(fā)的模型數(shù)量已經(jīng)有47.6萬個,不乏文心等大模型,服務(wù)的開發(fā)者數(shù)量已經(jīng)達(dá)到406萬,并在270多所高校開設(shè)了AI學(xué)分課程。至少可以保證在中國市場上奠定飛槳、TensorFlow、PyTorch三分天下的格局,再在市場份額分配上徐徐圖謀。
進(jìn)入2020年以后,清華大學(xué)計圖、曠視科技天元、華為MindSpore、一流科技OneFlow相繼開源,騰訊和阿里也在后面推出了PocketFlow、X-Deep Learning。如果這些新空間有能力以資金、人才等資源換時間,針對中國產(chǎn)業(yè)的需求因地制宜,也不排除進(jìn)一步向國外框架搶奪份額的可能。
回到文初遺留的問題,在AI基礎(chǔ)技術(shù)的角逐中,來自中國的力量確實有些孤獨,很長時間里只有百度一家在搏殺。好在結(jié)果并不糟糕,在深度學(xué)習(xí)框架的“PPT”(飛槳PaddlePaddle、PyTorch、TensorFlow)格局中,已經(jīng)有一個字母是來自中國,不必再面臨被封殺后無計可施的境地。
05 結(jié)語
距離1956年的達(dá)特矛斯會議,已經(jīng)走過了66個春秋,人工智能終于迎來了工業(yè)大生產(chǎn)的浪潮。來自中國的企業(yè)和科學(xué)家們,或許缺席了人工智能的過去,卻在一步步錨定人工智能的未來。
目前中國已經(jīng)在AI應(yīng)用層站穩(wěn)了腳跟,近幾年的專利申請甚至超過了美國,在數(shù)據(jù)、人才、市場等方面的綜合優(yōu)勢正在逐步顯現(xiàn)。假如可以用深度學(xué)習(xí)框架進(jìn)一步聚合開發(fā)者、資本和平臺,創(chuàng)造有利于創(chuàng)新的土壤,不無可能擺脫“數(shù)字鐵幕”的威脅,讓中國AI在一條堅實的道路上加速奔跑。
原文標(biāo)題 : 深度學(xué)習(xí)框架簡史:PPT格局初現(xiàn),中國占有一席
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市