訊飛的星火,能否燎原AI大模型?
來自大洋彼岸硅谷的OpenAI,在2022年11月推出了聊天程序ChatGPT,引發(fā)了一場波及全球的科技“海嘯”。
最新的入場者,是以“星火認(rèn)知大模型”為名稱的科大訊飛。 #科大訊飛#
5月6日,訊飛星火認(rèn)知大模型成果發(fā)布會在安徽合肥舉行。
科大訊飛董事長劉慶峰、研究院院長劉聰發(fā)布訊飛星火認(rèn)知大模型,現(xiàn)場實(shí)測大模型七大核心能力,并發(fā)布教育、辦公、汽車、數(shù)字員工四大行業(yè)應(yīng)用成果。訊飛星火認(rèn)知大模型可基于自然語言對話方式實(shí)現(xiàn)多領(lǐng)域多任務(wù)的用戶需求理解與任務(wù)執(zhí)行。
根據(jù)訊飛星火認(rèn)知大模型發(fā)布會現(xiàn)場展示的內(nèi)容,它還能完成故事創(chuàng)作、中英轉(zhuǎn)寫、代碼編程等高階工作。
星星之火,何以燎原?如何讓大模型賦能更多開發(fā)者,打造更具價值的應(yīng)用?以訊飛星火大模型為引擎,以訊飛開放平臺為依托,共建人工智能「星火」生態(tài),將是“燎原”的必經(jīng)之路。
僅僅6個月時間里,中國幾乎所有的知名的科技企業(yè),都發(fā)布了類ChatGPT的“AI大模型”。
這其中,最為受關(guān)注的,當(dāng)屬百度的“文心一言”,阿里的“通義千問”,商湯科技的“日日新”和科大訊飛的“星火”。
作者張棟偉之所以如此認(rèn)為,是因?yàn)樵贑hatGPT火爆之初,就曾經(jīng)公開發(fā)文指出,AI大模型要能跑出,至少需要同時具備三個基礎(chǔ)條件:數(shù)據(jù)、算力和場景。
1、數(shù)據(jù)
數(shù)據(jù)不僅僅是數(shù)量的問題,還有來源的問題。
中國的數(shù)據(jù)安全法規(guī)、個人隱私保護(hù)法規(guī)都日趨完善,開發(fā)AI大模型首要解決合法的數(shù)據(jù)來源問題。這個合法渠道的數(shù)據(jù)生成還必須要有規(guī);。
這一點(diǎn),就首先賦予了大型科技企業(yè)的“先發(fā)優(yōu)勢”。
百度的搜索數(shù)據(jù),阿里的電商數(shù)據(jù),科大訊飛和商湯科技基于應(yīng)用場景的行業(yè)數(shù)據(jù),都已經(jīng)分別在各自領(lǐng)域成為領(lǐng)袖企業(yè),天然具備了數(shù)據(jù)獲取的“護(hù)城河”。
例如在醫(yī)療領(lǐng)域,據(jù)科大訊飛董事長劉慶峰發(fā)言透露,目前訊飛的智醫(yī)助理在全國已累計提供輔助診斷5億多次,每天可以幫助基層醫(yī)生看70多萬病人,此外還與協(xié)和、安徽省立醫(yī)院等眾多醫(yī)院建立了合作。
只有自己擁有合法、可靠、合規(guī)的數(shù)據(jù)來源,才能在AI大模型競爭中有基本的入場券。
2、算力
ChatGPT可能是迄今為止最吃算力的應(yīng)用。
據(jù)中信建投研報數(shù)據(jù),此前用于AI訓(xùn)練的算力增長符合摩爾定律,大約每20個月翻一番;深度學(xué)習(xí)的出現(xiàn)加速了性能的擴(kuò)展,用于AI訓(xùn)練的算力大約每6個月翻一番;而目前大規(guī)模模型出現(xiàn),其訓(xùn)練算力是原來的10到100倍。
自2012年起,全球頭部AI模型訓(xùn)練算力需求每3-4個月翻一番,每年頭部訓(xùn)練模型所需算力增長幅度高達(dá)10倍, GPT-3訓(xùn)練成本預(yù)計在500萬美元/次。
國信證券測算稱,引用OneFlow的測算結(jié)果,在公有云中訓(xùn)練OPEN AI的GPT-3模型需花費(fèi)訓(xùn)練成本約140萬美元,Google的PaLM模型需花費(fèi)訓(xùn)練成本約1120萬美元。
推理成本方面,國信證券稱為滿足當(dāng)前用戶訪問產(chǎn)生的推理成本,自建IDC初始投入約在4億美元,租用云服務(wù)每日成本約28萬美元。
根據(jù)商湯科技官網(wǎng),2022年1月24日商湯AIDC啟動運(yùn)營,該項(xiàng)目占地面積約5.8萬平方米,總投資約56億元,項(xiàng)目全部建成后AI計算峰值速度將達(dá)到3740Pflops。
以商湯AIDC為計算參考,每新建1Eflops算力需要投資15億元,其中ICT硬件投資占比72%。則活躍人數(shù)每增加1億人需要新增投資203億元,其中ICT硬件投資146億元。
假設(shè)未來有6家科技巨頭能夠在未來3年內(nèi)各自擁有一款活躍人數(shù)2億的ChatGPT類應(yīng)用,則未來3年ICT硬件投資將新增需求1755億元。若考慮到AIGC技術(shù)向音頻、視頻等方向蔓延,算力需求提升幅度將更為顯著。
如此龐大的投資強(qiáng)度,對于事先沒有在云計算領(lǐng)域、AI計算領(lǐng)域做部署的和新入場企業(yè)來說,絕對是巨大的資金壓力。
3、場景
AI大模型,目前在中國的主要應(yīng)用場景,是“拉股價”。
但是當(dāng)喧囂過后,終究丑媳婦要見公婆。例如某幾個上市公司,此前用AI大模型概念股價狂漲,但是當(dāng)證券會問詢函一到,很快就顯出原形,只剩下韭菜們在風(fēng)中凌亂。
從2020年GPT-3模型發(fā)布以后,國內(nèi)大概成立了100多家相關(guān)應(yīng)用公司,大概86%的公司都在做生產(chǎn)率工具,做文字總結(jié)歸納,以及多模態(tài)圖像生成、視頻生成。項(xiàng)目很多,雷同度很高,底層創(chuàng)新很少。
因?yàn)檎f到實(shí)際,請問一下,有多少人會無聊到和AI斗智斗勇聊天,有多少人會需要每天生成幾十個圖片供選擇,又有多少人需要用AI寫PPT寫報告?------特別是那些希望借助AI做文案、做圖片和做報告的人,AI永遠(yuǎn)沒有你更了解上級老板想喝什么茶,以及知道他/她的品味有多低。
因此,至少在中國可見的未來,真正的應(yīng)用場景是政企,即G和B。
G端的AI大模型需求基本一致,但是需要數(shù)據(jù)部署本地化,以形成閉環(huán)保密,這代表著開發(fā)的投入可以多次重復(fù)售賣----這就是傳統(tǒng)科技企業(yè)的起家之本玩法。
B端的AI大模型需求需要定制,因?yàn)榭梢燥@著降本增效,因此愿意支付具有利潤空間的溢價。而行業(yè)內(nèi)企業(yè)之間的底層共性,又能節(jié)約研發(fā)成本。
例如百度大模型是在電力、燃?xì)、金融、航天等領(lǐng)域,華為則是有盤谷氣象、盤谷礦山、盤谷OCR等。
最關(guān)鍵的是,這兩個群體,才是真的有錢,且愿意付錢。
雖然在C端,例如科大訊飛的學(xué)習(xí)機(jī)已經(jīng)完全可以代替家長在家實(shí)現(xiàn)補(bǔ)課、批改,但是訊飛的教育業(yè)務(wù)最大場景客戶還是基于B端的學(xué)校智慧教育方案。
因此,當(dāng)科大訊飛開放平臺宣布將聯(lián)合首批接入的36個行業(yè)、3000余家企業(yè)開發(fā)者,共建大模型行業(yè)通用解決方案,這才是真正有意義的星火,假以時日,必能燎原。
關(guān)于中國的AI大模型前景,你怎么看?
作者/張棟偉(資深互聯(lián)網(wǎng)人士,市場營銷專家,大學(xué)生就業(yè)創(chuàng)業(yè)導(dǎo)師)
原文標(biāo)題 : 張棟偉:訊飛的星火,能否燎原AI大模型?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【限時免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市