大模型2.0時(shí)代的優(yōu)化與突破
作者
車行運(yùn)
大模型可以讓無(wú)人駕駛更智能
今年6月份,各大廠商紛紛升級(jí)自家的類ChatGPT產(chǎn)品。6月9日,訊飛推出星火認(rèn)知大模型升級(jí)版;6月13日,360在發(fā)布類ChatGPT產(chǎn)品之后,再次舉行360智腦大模型應(yīng)用發(fā)布會(huì)。
與2月左右發(fā)布的大模型不同,近期各家公司發(fā)布的升級(jí)版產(chǎn)品,更偏向應(yīng)用層目的是更容易走向千家萬(wàn)戶。
從目前發(fā)布的情況來(lái)看,360智腦已初步具備跨模態(tài)?成能?,除了可以完成文字生成文字、表格、圖片;圖片生成文字、圖片,以及視頻生成文本,文本剪視頻等基礎(chǔ)創(chuàng)作之外,還重新定義“數(shù)字人”,給用戶一種“有靈魂、有?設(shè)、有記憶”可定制的專屬“人工智能”。
目前360智腦與用戶距離最近的應(yīng)用場(chǎng)景,是360現(xiàn)有的全家桶,周鴻祎在發(fā)布會(huì)表示,“360智腦4.0”會(huì)接入360安全衛(wèi)?、360瀏覽器、360搜索等,試圖重塑人機(jī)協(xié)作。
在發(fā)布會(huì)上,周鴻祎更改了此前觀點(diǎn),“我曾經(jīng)說(shuō)過(guò),國(guó)產(chǎn)大模型與ChatGPT之間的差距是兩年,現(xiàn)在我想收回這句話。”隨后補(bǔ)充最新觀點(diǎn),認(rèn)為目前國(guó)產(chǎn)大模型的水平與GPT3.5大打平,照此速度發(fā)展,追趕甚至超過(guò)GPT4將在轉(zhuǎn)瞬之間。
從發(fā)布初始版本至正式發(fā)布360智腦的四個(gè)月內(nèi),周鴻祎看到了會(huì)有如此巨大的轉(zhuǎn)變?
科技大廠圍獵大模型
在2023中關(guān)村論壇上發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,當(dāng)前,中國(guó)人工智能大模型正呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。據(jù)不完全統(tǒng)計(jì),截至目前,參數(shù)在10億規(guī)模以上的大模型全國(guó)已發(fā)布了79個(gè)。
而科技大廠的大模型參數(shù)量較大:阿里通義千問(wèn)大模型參數(shù)在10萬(wàn)億級(jí)以上、騰訊混元大模型和華為盤古大模型參數(shù)量均在萬(wàn)億級(jí)以上、百度文心一言大模型參數(shù)量在2千億級(jí)以上、京東言犀大模型的參數(shù)量為千億級(jí);垂直行業(yè)科技企業(yè)已經(jīng)上線的參數(shù)量普遍在千億級(jí)以上;而科研院校大模型的參數(shù)量在千億級(jí)及以下。
從大模型的布局體系來(lái)看,科技大廠在算力層、平臺(tái)層、模型層、應(yīng)用層進(jìn)行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應(yīng)用進(jìn)行自主研發(fā)的全面布局,如百度的“昆侖芯+飛槳平臺(tái)+文心大模型+行業(yè)應(yīng)用”、阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應(yīng)用”、華為的“昇騰芯片+MindSpore框架+盤古大模型+行業(yè)應(yīng)用”。
此外金山辦公5月31日還發(fā)布了WPS AI,目前,WPSAI已接入金山辦公旗下辦公組件輕文檔、文字、表格、演示、PDF,未來(lái)將錨定AIGC、閱讀理解和問(wèn)答、人機(jī)交互三個(gè)戰(zhàn)略方向發(fā)展,并接入金山辦公全線產(chǎn)品。
各家大廠迅速涌入這個(gè)賽道,主要是因?yàn)楸O(jiān)管層迅速跟進(jìn)出臺(tái)措施規(guī)范行業(yè)發(fā)展,有頂層架構(gòu)保駕護(hù)航,各家大廠自然可以放心投入研發(fā),并推出產(chǎn)品。
自今年3月大模型批量上線以來(lái),AI監(jiān)管政策逐漸明晰,這也給行業(yè)應(yīng)用指明了方向。
回顧整個(gè)行業(yè)發(fā)展歷程,4月11日,《生成式人工智能服務(wù)管理方法》征求意見稿發(fā)布;5 月 30 日,信通院正在聯(lián)合編制“紙鳶”開放人工智能模型許可證,下一步將發(fā)布《紙鳶開放人工智能模型許可證(征求意見稿)》。
隨后,一線城市配合發(fā)布了《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025 年)》;《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023-2024 年)》。
在此背景下,周鴻祎認(rèn)為國(guó)產(chǎn)大模型將會(huì)迅速縮小和ChatGPT的差距,似乎也好理解了。
360智腦有何不同
按照周鴻祎的規(guī)劃,360大模型將在持續(xù)升級(jí)大模型的基礎(chǔ)上,兼顧場(chǎng)景化、產(chǎn)品化、平?化、垂直化。
這種發(fā)展戰(zhàn)略下,360智腦可以實(shí)現(xiàn)對(duì)消費(fèi)者(?戶個(gè)?AI助理)、中?微企業(yè)(SaaS化垂直應(yīng)?)、企業(yè)/政府/城市(私有化部署?模型)、?業(yè)(?業(yè)垂直?模型)等四個(gè)主要應(yīng)用場(chǎng)景的覆蓋。
上述四種不同場(chǎng)景的應(yīng)用,主要通過(guò)其他公司在360大模型API基礎(chǔ)上,結(jié)合不同行業(yè)需求推出特定產(chǎn)品,F(xiàn)階段,很多部門、企業(yè)內(nèi)部擁有大量獨(dú)占性IP,如果將其統(tǒng)統(tǒng)放到一個(gè)公開大模型中,就會(huì)重現(xiàn)三星因GPT泄露芯片機(jī)密的事件,這就凸顯了專有類GPT產(chǎn)品的重要性。
想要更好滿足上述不同場(chǎng)景的需求,通用大模型需要在現(xiàn)有基礎(chǔ)上,完成從輸入文字輸出文字,到看懂圖像、視頻,并能產(chǎn)出圖像、視頻的轉(zhuǎn)變,相當(dāng)于讓大模型具備了“耳朵”和“眼睛”,為創(chuàng)建“數(shù)字人”打下基礎(chǔ)。
傳統(tǒng)數(shù)字人只需要按照既定腳本輸出,但在大模型時(shí)代,360的數(shù)字人可定制,因此?設(shè)、有記憶、有經(jīng)歷,目前在360數(shù)字??場(chǎng)平臺(tái)中,已經(jīng)有200多個(gè)??,分為數(shù)字名?和數(shù)字員?兩個(gè)種類。360希望未來(lái)可以讓每個(gè)?都有自己的AI助理,并有機(jī)會(huì)在虛擬空間內(nèi),跨越時(shí)空,和古人交流。
在演示會(huì)上,周鴻祎問(wèn)“諸葛亮”怎么看今天成為鬼畜素材,數(shù)字人以諸葛亮的口吻回復(fù):夫古今之命,乃實(shí)事所必然也。今之時(shí)勢(shì),天下紛擾不已。吾雖已老,仍志在天下。今者年輕人以吾為鬼畜素材,吾欣然接受此變化。并祝愿年輕朋友在未來(lái)的道路上勇往直前,開創(chuàng)更加美好的未來(lái)。
同時(shí)周鴻祎還強(qiáng)調(diào),未來(lái)數(shù)字人的形態(tài)還會(huì)有??的?標(biāo)、規(guī)劃和分解的能?,從而可以調(diào)?各種垂直的模型完成任務(wù)。
不過(guò)這些功能其實(shí)都是在現(xiàn)有大模型應(yīng)用基礎(chǔ)上的優(yōu)化,并沒有開辟一個(gè)全新的領(lǐng)域。但實(shí)際上,當(dāng)大模型取得突破后,最具創(chuàng)造性的應(yīng)用場(chǎng)景是無(wú)人駕駛。
無(wú)人駕駛有機(jī)會(huì)駛?cè)肟燔嚨?/strong>
回顧無(wú)人駕駛領(lǐng)域,自從2016年開始,各大廠商都在布局這個(gè)領(lǐng)域,但是直到今年也沒有一家可以實(shí)現(xiàn)真正的無(wú)人駕駛。
目前一輛L2+級(jí)別的無(wú)人駕駛系統(tǒng)需要10+顆攝像頭;1-2顆激光雷達(dá);或3-5顆毫米波雷達(dá)提供的多維度數(shù)據(jù),人工標(biāo)注數(shù)據(jù)之后才能用于模型的訓(xùn)練。在可識(shí)別影像的大模型出現(xiàn)之后,人工標(biāo)注所需要的時(shí)間成本和物質(zhì)支出將會(huì)驟然下降。
據(jù)2023年4月毫末智行DriveGPT發(fā)布會(huì)顯示,目前要得到對(duì)諸如車道線、交通參與者、紅綠燈等信息,行業(yè)人工標(biāo)注的成本約每張圖為5元,毫末DriveGPT的成本為0.5元。我們認(rèn)為科技公司大模型訓(xùn)練成熟后,單張圖自動(dòng)標(biāo)注的邊際成本趨近于0,平均成本有望進(jìn)一步下降。
據(jù)愷望數(shù)據(jù)產(chǎn)品項(xiàng)目副總裁張鵬在2023年2月的介紹,目前數(shù)據(jù)標(biāo)注以人工標(biāo)注為主,機(jī)器標(biāo)注為輔,95%的數(shù)據(jù)標(biāo)注還是以人工為主。大模型的介入,可以極大地提升這個(gè)行業(yè)的效率。以特斯拉為例,2021年人工標(biāo)注團(tuán)隊(duì)為1000多人,2022年該團(tuán)隊(duì)裁員200余人。
除此之外,大模型時(shí)代,第三方科技巨頭有望通過(guò)提供完善的工具鏈,幫助整車廠構(gòu)建自己的自動(dòng)駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時(shí)依靠大模型的數(shù)據(jù)生成能力縮小在數(shù)據(jù)領(lǐng)域的差距,自動(dòng)駕駛的安卓時(shí)代有望來(lái)臨。
目前,大模型已經(jīng)被用于賦能數(shù)據(jù)閉環(huán)、仿真、感知算法、規(guī)控算法等領(lǐng)域。而巨頭如微軟、英偉達(dá)在大模型和自動(dòng)駕駛爭(zhēng)相布局,或?qū)⒉脸鲂碌幕鸹ā?/p>
此外大模型的出現(xiàn)也促進(jìn)行業(yè)分工,避免“重復(fù)造輪子”,同時(shí)加速傳感器和芯片迭代,系統(tǒng)成本有望大幅下降。大模型開發(fā)者和自動(dòng)駕駛產(chǎn)業(yè)鏈玩家有望全面受益。
以百度Apollo為例,其首先利用圖文信息預(yù)訓(xùn)練一個(gè)原始模型,利用算法將街景圖像數(shù)據(jù)進(jìn)行物體識(shí)別并定位和分割,放入編碼器形成底庫(kù),即基于街景建立一個(gè)圖片和文字信息對(duì)應(yīng)的數(shù)據(jù)池。
其次可以通過(guò)文本、圖像等形式對(duì)特定的場(chǎng)景(如快遞車、輪椅、小孩等)進(jìn)行搜索和挖掘,對(duì)車端模型進(jìn)行定制化的訓(xùn)練,大幅提升存量數(shù)據(jù)的利用效果。
百度用半監(jiān)督方法,充分利用2D和3D數(shù)據(jù)訓(xùn)練一個(gè)感知大模型。通過(guò)在多個(gè)環(huán)節(jié)對(duì)小模型進(jìn)行蒸餾,提升小模型的性能,同時(shí)通過(guò)自動(dòng)標(biāo)注給小模型定制化的訓(xùn)練,用來(lái)增強(qiáng)遠(yuǎn)距離視覺3D感知能力、提升多模態(tài)感知模型的感知效果。
另一家頭部玩家商湯科技也曾公開表示,可以用AIGC生成真實(shí)的交通場(chǎng)景以及困難樣本來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng),以多模態(tài)數(shù)據(jù)作為大模型的輸入,提升系統(tǒng)對(duì)Cornercase場(chǎng)景的感知能力上限。
同時(shí)自動(dòng)駕駛多模態(tài)大模型可做到感知決策一體化集成,在輸出端通過(guò)環(huán)境解碼器可對(duì)3D環(huán)境進(jìn)行重建,實(shí)現(xiàn)環(huán)境可視化理解;行為解碼器可生成完整的路徑規(guī)劃;動(dòng)機(jī)解碼器可用自然語(yǔ)言對(duì)推理過(guò)程進(jìn)行描述,使自動(dòng)駕駛系統(tǒng)變得更加安全可靠。
大模型實(shí)現(xiàn)上述功能后,未來(lái)無(wú)人駕駛門檻會(huì)越來(lái)越低,頭部廠商加速無(wú)人駕駛項(xiàng)目進(jìn)程的同時(shí),還可以讓更多新玩家加入這個(gè)領(lǐng)域,并開拓除道路導(dǎo)航外,需要道路規(guī)劃功能的賽道,比如進(jìn)一步優(yōu)化掃地機(jī)器人的路徑規(guī)劃。
現(xiàn)在看,在經(jīng)歷二月至三月的大模型集中發(fā)布期、四月至五月的產(chǎn)品研發(fā)期和政策方向逐步明確后,六月已經(jīng)進(jìn)入AI大模型產(chǎn)品和應(yīng)用有望迎來(lái)集中發(fā)布期,這也直接導(dǎo)致OpenAIAPI降價(jià)。
在可預(yù)期的未來(lái),AI技術(shù)仍然在持續(xù)迭代,應(yīng)用也在持續(xù)推進(jìn),同時(shí)越來(lái)越多科技大廠推出產(chǎn)品切入這個(gè)賽道,還將繼續(xù)助推行業(yè)景氣度上升,并給用戶帶來(lái)更貼合市場(chǎng)需求的類GPT產(chǎn)品,比如擁有龐大用戶群的騰訊6月19日也發(fā)布了大模型領(lǐng)域的技術(shù)方案。
當(dāng)這些從業(yè)企業(yè)一起卷的時(shí)候,行業(yè)發(fā)展進(jìn)入快車道的同時(shí),也意味著C端用戶將會(huì)很快就能用上這個(gè)產(chǎn)品,至于會(huì)為誰(shuí)付款,就需要各家廠商自憑本事了。
© THE END
本文僅作為分享學(xué)習(xí)使用,不構(gòu)成任何投資建議。
本文由貝克街探案官原創(chuàng),未經(jīng)許可,請(qǐng)勿轉(zhuǎn)載。
原文標(biāo)題 : 大模型2.0時(shí)代的優(yōu)化與突破
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市