大模型混戰(zhàn),阿里百度華為誰將成就AI時(shí)代的“新地基”?
從算力基礎(chǔ)到用戶生態(tài),群雄逐鹿大模型
自2022年stable diffusion模型的進(jìn)步推動(dòng)AIGC的快速發(fā)展后,年底,ChatGPT以“破圈者”的姿態(tài),快速“吸粉”億萬,在全球范圍內(nèi)掀起了一股AI浪潮,也促使了眾多海外巨頭競相發(fā)布屬于自己的大模型。
而在國內(nèi),實(shí)際上很久之前,阿里、華為、騰訊等公司便早已有所布局:2019年,阿里開始布局大模型研發(fā),去年9月發(fā)布“通義”大模型系列的眾多大模型;華為在2021年基于昇騰AI與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布了鵬程盤古大模型;而騰訊的思路也與阿里相似,發(fā)布了混元AI大模型;第二梯隊(duì)的京東、網(wǎng)易、360、字節(jié)跳動(dòng)等企業(yè),也紛紛官宣了自己在AI大模型方面的布局。
而進(jìn)入2023年以來,隨著文心一言的發(fā)布,成為了中國第一個(gè)類ChatGPT產(chǎn)品后,各家的大模型也紛紛亮相,一時(shí)間,國內(nèi)仿佛陷入了“大模型之戰(zhàn)”中。
截至目前,百度文心大模型、華為盤古大模型、商湯大模型、阿里大模型都已亮相,而后還有許多大模型正在準(zhǔn)備粉墨登場。
那么,在這匆匆發(fā)布的背后,是真的技術(shù)成熟,還是魚龍混雜?各個(gè)大模型的實(shí)力又是怎樣?
本文將從語言大模型、算力與技術(shù)底座與具體應(yīng)用層面狀況三大角度,來分析和研究目前已經(jīng)發(fā)布的大模型的技術(shù)基礎(chǔ)、應(yīng)用場景和用戶生態(tài),看看哪些大模型更有可能在這混戰(zhàn)中成功突圍。
01
ChatGPT不該止于C端
ChatGPT,作為最早出圈的大模型產(chǎn)品應(yīng)用,其問答的流暢程度與準(zhǔn)確程度,可以很好地體現(xiàn)NLP模型的水平。
而目前,國內(nèi)廠商百度、阿里也都發(fā)布了類似模型,那么,相比之下,文心一言與通義千問的表現(xiàn)如何?
首先是最近對話式AI們經(jīng)常出現(xiàn)的一個(gè)典型問題,面對自己知識庫中沒有,或本身就是錯(cuò)誤的提問時(shí),仍能對著錯(cuò)誤描述侃侃而談,簡稱一本正經(jīng)的胡說八道。
于是,我先問了通義千問這樣一個(gè)問題:你知道唐僧為什么要上梁山嗎?
通義千問在思考后,給出了這樣的回答:它首先簡單對唐僧進(jìn)行了介紹,然后將其帶入了《水滸傳》中宋江的角色,但最后卻又回到了《西游記》中,還講“這一情節(jié)體現(xiàn)了唐僧的堅(jiān)定和決心,也反映了他作為一個(gè)有信仰的人物的形象。”
而同樣的問題給了文心一言,卻得到了一個(gè)更加簡短的答案:唐僧上梁山的原因是因?yàn)樗黄瘸鲎,被唐朝通緝,無路可走,只能上梁山。
本次測試中,通義千問與文心一言都犯了同樣的錯(cuò)誤,不過,在我指正之后,通義千問也進(jìn)行了積極地認(rèn)錯(cuò),展現(xiàn)出了良好的連續(xù)問答能力。
接下來,我又問了它們一個(gè)經(jīng)典的數(shù)學(xué)問題——雞兔同籠,“雞兔同籠,頭共10,足共28,雞兔各幾只?”
通義千問在得到提問后,快速做出了回答,為我列出了計(jì)算該問題所需要的方程式,還貼心地在后面?zhèn)渥⑸狭朔匠淌降挠蓙怼?nbsp;
而文心一言就顯得更加直接,回答了我的問題。
而在這兩個(gè)問題之外,我還讓它們兩個(gè)一起編寫了代碼、賞析了詩詞、撰寫了文章。
總得來說,在面對用戶提出的問題時(shí),通義千問與文心一言在絕大多數(shù)情況都可以給出較為正確的回答,在面對C端用戶的提問時(shí),兩個(gè)產(chǎn)品顯示出了不相上下的實(shí)力。
而在C端的勢均力敵之下,阿里卻祭出了同類競品難以比擬的B端服務(wù)能力。
通義千問在C端用戶之外,專門針對企業(yè)用戶發(fā)出了邀請共測,企業(yè)可基于通義千問打造專屬大模型,在企業(yè)專屬的大模型空間中,既可以調(diào)動(dòng)通義千問的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識和應(yīng)用場景,訓(xùn)練自己的企業(yè)大模型。
具體而言,除了通用場景之外,企業(yè)由于業(yè)務(wù)特性的不同,對于大模型服務(wù)有特殊需求和要求,希望讓通用的大模型變成企業(yè)專屬的大模型,支撐企業(yè)各式各樣的應(yīng)用與服務(wù)。
阿里云希望通過產(chǎn)品化的方式,滿足企業(yè)專屬大模型從生成到部署全生命周期的需求。
在發(fā)布會(huì)當(dāng)天,阿里云就宣布將與OPPO安第斯智能云聯(lián)合打造OPPO大模型基礎(chǔ)設(shè)施,基于通義千問完成大模型的持續(xù)學(xué)習(xí)、精調(diào)及前端提示工程,未來建設(shè)服務(wù)于其海量終端用戶的AI服務(wù)。
同時(shí),中興通訊、吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌閱科技等多家企業(yè)也表示,將與阿里云在大模型相關(guān)場景展開技術(shù)合作的探索和共創(chuàng)。
或許,在競爭激烈的C端之外,面向企業(yè)端的大模型構(gòu)建能力,才是通義千問真正的優(yōu)勢所在。
而相關(guān)專家也在交流中表示,通義千問將會(huì)在企業(yè)各自深耕的領(lǐng)域中為他們提供構(gòu)建大模型方面的幫助,帶來更好的生態(tài)系統(tǒng)與商業(yè)模式。
02
大模型背后的算力之爭,誰占先機(jī)?
縱觀國內(nèi)發(fā)布的大模型,可以發(fā)現(xiàn),相對于國外尖端的AI企業(yè)來說,國內(nèi)還像是蹣跚學(xué)步的孩童,在這條道路上剛剛起步。
而在大模型發(fā)展的道路上,最重要的實(shí)際上還是最基礎(chǔ)的算力資源的多少與怎樣利用算力的能力,那么國內(nèi)頂尖大模型企業(yè)在算力上的儲(chǔ)備幾何?
首先是近日同樣發(fā)布了大模型的商湯科技,在前段時(shí)間的交流中,商湯科技內(nèi)部的相關(guān)專家對公司的算力情況進(jìn)行了交流。
國內(nèi)能拿到最尖端的顯卡是來自英偉達(dá)的A100 GPU,商湯科技在美國對華禁售之前,便提前囤積了上萬張A100芯片,是國內(nèi)算力資源比較充足的廠商。
除了來自英偉達(dá)的顯卡之外,商湯還在采購國內(nèi)的GPU,并且專家表示,早在去年以前,就已經(jīng)在大裝置中適配了許多寒武紀(jì)與海光信息的GPU卡,但在當(dāng)下商湯仍舊面臨著如何將國產(chǎn)GPU卡進(jìn)行大模型訓(xùn)練適配的問題。
在商湯之外,華為的盤古大模型也引起了眾人矚目,但在算力資源方面,華為卻略顯窘迫。
因?yàn)槭艿矫绹拈L期制裁,華為只得使用全部國產(chǎn)的加速芯片,而目前昇騰系列最先進(jìn)大幅使用的型號昇騰910,也只有A100 70%的性能,從長期來看,將會(huì)制約大模型的發(fā)展。
而算力的短缺也直接影響了華為的發(fā)展策略,選擇性地放棄了C端的發(fā)展,主攻B端工業(yè)大模型應(yīng)用。
而說起算力資源儲(chǔ)備最多的企業(yè),莫過于云時(shí)代中獨(dú)占鰲頭的阿里。
但從阿里云上的角度來看,當(dāng)前云上至少擁有上萬片的A100 GPU,從整體來說,阿里云的算力資源至少能夠達(dá)到10萬片以上。如果繼續(xù)抬眼,從整個(gè)集團(tuán)的算力資源來說,將會(huì)是阿里云5倍的這樣的一個(gè)量級。
而在英偉達(dá)的芯片之外,阿里云也擁有眾多國產(chǎn)化的GPU芯片,而最近的項(xiàng)目中,便選擇了寒武紀(jì)MLU370,其性能基本過關(guān)(A100的60-70%),檢測合格,廠商態(tài)度積極,愿意與阿里對接,并且已經(jīng)用在了CV等小模型的訓(xùn)練和推理上。
在2023年,阿里云算力資源的增速也將達(dá)到30%-50%。
得益于云時(shí)代的絕對領(lǐng)先,讓阿里擁有了遠(yuǎn)超其他企業(yè)的算力資源,也讓其在AI時(shí)代里天生就占得了上風(fēng)。
但是,動(dòng)輒超千億參數(shù)的大模型研發(fā),并不能靠簡單堆積GPU就能實(shí)現(xiàn),這是囊括了底層算力、網(wǎng)絡(luò)、存儲(chǔ)、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程,需要AI-云計(jì)算的全棧技術(shù)能力。
而阿里是全球少數(shù)在這幾個(gè)領(lǐng)域都有深度布局、長久積累的科技公司之一,也是為數(shù)不多擁有超萬億參數(shù)大模型研發(fā)經(jīng)驗(yàn)的機(jī)構(gòu)。
在AI算法方面,阿里達(dá)摩院是國內(nèi)最早啟動(dòng)大模型研究的機(jī)構(gòu)之一,2019年便開始投入大模型研發(fā),在中文大模型領(lǐng)域一直處于引領(lǐng)地位,2021年阿里先后發(fā)布國內(nèi)首個(gè)超百億參數(shù)的多模態(tài)大模型及語言大模型,此后還訓(xùn)練實(shí)現(xiàn)了全球首個(gè)10萬億參數(shù)AI模型。
在智能算力方面,阿里建成了國內(nèi)最大規(guī)模的智算中心“飛天智算平臺”,千卡并行效率達(dá)90%,自研網(wǎng)絡(luò)架構(gòu)可對萬卡規(guī)模的AI集群提供無擁塞、高性能的集群通訊能力;陲w天智算的阿里云深度學(xué)習(xí)平臺PAI,可將計(jì)算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍,覆蓋全鏈路AI開發(fā)工具與大數(shù)據(jù)服務(wù),深度支持了通義大模型的研發(fā)。
阿里云全棧AI技術(shù)體系,更是從機(jī)器學(xué)習(xí)平臺、大模型即服務(wù)、產(chǎn)業(yè)智能三個(gè)層面,不斷豐富AI服務(wù),并通過全棧技術(shù)驅(qū)動(dòng)千行百業(yè)的AI發(fā)展與應(yīng)用。
可以說,阿里在云時(shí)代的成功,在一定程度上延續(xù)到了AI時(shí)代,與那些算力資源相對不足的競爭者來說,阿里在算力與技術(shù)底座方面,有著無可比擬的巨大優(yōu)勢。
03
大模型帶來業(yè)務(wù)集合式飛躍
在擁有了算力資源與技術(shù)底座后,大模型能力若想要普惠大眾,觸達(dá)到每一個(gè)人,就需要應(yīng)用層面的生態(tài)建設(shè),而這,也正是眾多廠商“刺刀見紅”的戰(zhàn)場,眾多廠商也依據(jù)企業(yè)發(fā)展的不同,做出了不同的選擇。
比如,華為盤古大模型,受算力資源不足與公司業(yè)務(wù)導(dǎo)向的影響,選擇了指向B端的打法。
在盤古大模型發(fā)布會(huì)上,華為沒有著墨于NLP模型,而是著重強(qiáng)調(diào)了CV大模型與科學(xué)計(jì)算大模型的應(yīng)用范例。
盤古CV大模型主要應(yīng)用于智能巡檢、智慧物流等場景。
例如,在與能源公司合作的盤古礦山大模型中案例中,礦井現(xiàn)場是一個(gè)40米長的采掘機(jī),寬度僅2米左右,傳統(tǒng)相機(jī)很難一下子捕捉到全部畫面,只能用圖中的九宮格視頻畫面。而通過5G+AI全景視頻拼接綜采畫面卷,傳輸?shù)降孛妫孛婀ぷ魅藛T將來可以實(shí)現(xiàn)地面控制機(jī)器進(jìn)行采礦,實(shí)現(xiàn)礦下無人少人安全作業(yè)。
而盤古氣象大模型,也在氣象預(yù)測方向上超過了傳統(tǒng)數(shù)值的計(jì)算方法。
盤古氣象大模型在氣象預(yù)報(bào)的關(guān)鍵要素和常用時(shí)間范圍上精度均超過當(dāng)前最先進(jìn)的預(yù)報(bào)方法,同時(shí)速度相比傳統(tǒng)方法提升 1000 倍以上。如在臺風(fēng)路徑預(yù)測任務(wù)上,相比傳統(tǒng)數(shù)值氣象預(yù)報(bào)方法,盤古氣象大模型可以降低 20%以上的位置誤差。
而對阿里而言,其在國內(nèi)領(lǐng)先的大模型能力與眾多的業(yè)務(wù)板塊,讓阿里大模型在各個(gè)領(lǐng)域都能一展拳腳。
阿里云智能集團(tuán)CEO張勇在峰會(huì)上表示,阿里巴巴所有產(chǎn)品未來都將接入“通義千問”大模型,進(jìn)行全面改造,包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等。
以阿里起家的電商賽道來說,大模型就有許多應(yīng)用場景。
對商家而言,大模型最切合實(shí)際的應(yīng)用場景莫過于智能客服。隨著電商行業(yè)逐漸成熟,消費(fèi)者對服務(wù)質(zhì)量的要求日益提高,客服這個(gè)崗位有著極為巨大的降本增效需求。
而經(jīng)過通義千問的改造后,能聽懂消費(fèi)者的話、明白消費(fèi)者訴求的聰明客服機(jī)器人也將上線,將基于機(jī)器學(xué)習(xí)、大數(shù)據(jù)、自然語言處理、語義分析和理解等多項(xiàng)人工智能技術(shù),為消費(fèi)者提供最優(yōu)質(zhì)的服務(wù)。
對于平臺而言,大模型可以有效提升用戶的購物體驗(yàn)。比如,用戶可能有時(shí)不清楚自己的明確需求,但通過與AI導(dǎo)購員交流,可以得到相當(dāng)多的指引信息以及購物清單,比如開一個(gè)生日party需要哪些方面的準(zhǔn)備,化妝需要購買哪些工具等。
在電商場景之外,接入通義千問后的辦公場景,也將實(shí)現(xiàn)多項(xiàng)全新功能。
例如在釘釘文檔中,可借助通義千問自動(dòng)配圖、創(chuàng)作文章、撰寫郵件、生成方案;在會(huì)議中,可以完成記錄、總結(jié)、生產(chǎn)待辦事項(xiàng);甚至還能幫助總結(jié)未讀群聊信息中的要點(diǎn)......
可以說,無論是對B端的企業(yè)還是C端的用戶,只要有阿里系產(chǎn)品存在的地方,在接入通義千問后,其智能水平與易用水平,都將快速提升一個(gè)檔次。
而對阿里來說,作為國內(nèi)最大的商業(yè)集團(tuán)之一,有了通義千問的加持,得到的提升將不會(huì)僅僅局限于某個(gè)業(yè)務(wù)線或是某個(gè)方向,而將是整體實(shí)力的飛躍。
04
寫在最后
AI大模型的浪潮,開啟了一個(gè)新的時(shí)代,將所有的互聯(lián)網(wǎng)廠商都重新拉到了同一起跑線上。
在2023阿里云峰會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇也說出,“面對AI時(shí)代,所有產(chǎn)品都值得用大模型重做一次。”
而在一切應(yīng)用重建后的AI時(shí)代里,核心競爭力究竟是什么?也成為了廠商們需要思考的首要問題。
在我看來,堅(jiān)實(shí)的算力基礎(chǔ)與良好的用戶生態(tài),將成為AI時(shí)代里成功的兩個(gè)必要條件。
而國內(nèi),誰擁有最多高端算力資源與強(qiáng)大的算法進(jìn)化能力,在這場大模型之戰(zhàn)中,就有著其他企業(yè)無法比擬、得天獨(dú)厚的優(yōu)勢。
原文標(biāo)題 : 大模型混戰(zhàn),阿里百度華為誰將成就AI時(shí)代的“新地基”?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動(dòng)化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市