“華米OV”的新戰(zhàn)場:手機(jī)大模型
文丨劉俊宏
編丨王一粟
大模型重塑一切的風(fēng),吹到了手機(jī)行業(yè)。
在見識了大模型重塑IT基礎(chǔ)設(shè)施、營銷、辦公、自動(dòng)駕駛等行業(yè)后,深陷于手機(jī)行業(yè)銷量和技術(shù)雙周期“低谷”的手機(jī)廠商們,急迫且高調(diào)地涌入大模型+手機(jī)的賽道。
走在前面的是華為和小米。今年8月,華為和小米先后宣布自家手機(jī)助手接入大模型。一時(shí)間,手機(jī)助手也擁有了類似ChatGPT一般的深度對話、自然語言理解以及編程能力。
然而,這樣依賴云端的大模型部署方式,在使用上需要用戶等待太久,并且消耗大量帶寬和算力資源,對話也經(jīng)常不流暢。
于是,在手機(jī)端部署大模型,形成端云協(xié)同的大模型的方案,成了所有手機(jī)廠商們的一致選擇。
為了把大模型塞進(jìn)手機(jī),OPPO、vivo、小米紛紛先后推出手機(jī)端十億參數(shù)級別的“輕量版大模型”。芯片廠商聯(lián)發(fā)科和高通也根據(jù)大模型的需求推出了更適合AI計(jì)算的手機(jī)SoC(系統(tǒng)級芯片)。
在11月即將到來的OPPO和vivo開發(fā)者大會(huì)后,“華米OV”們將再次在手機(jī)大模型上齊聚一堂。
如今,如何用好大模型的能力,雖然手機(jī)廠商還在初級階段,但已經(jīng)在許多方向上有了共識,比如:如何壓縮模型、如何云和端協(xié)同、如何在底層打通大模型和系統(tǒng)、應(yīng)用的能力等。
在硬件進(jìn)化多年之后,手機(jī)也再次走到了軟件定義手機(jī)的新節(jié)點(diǎn),這更考驗(yàn)手機(jī)廠商的研發(fā)實(shí)力。也正因?yàn)槿绱,最近手機(jī)廠商也紛紛發(fā)布和升級自己的自研操作系統(tǒng),以求在軟件體驗(yàn)上勝出一籌。
可以預(yù)見,一波大模型?手機(jī)的新賣點(diǎn)就在路上,而隨著大模型對算力要求的提升,能否拉動(dòng)起一波新的換機(jī)潮,把手機(jī)廠商們從寒冬中拉出來?
聚焦大模型
“華米OV”的新戰(zhàn)場
中國的手機(jī)廠商們喜歡“抱團(tuán)作戰(zhàn)”,在進(jìn)軍大模型上也不例外。
“華米OV”各就各位后,大模型在手機(jī)上的落地到底怎么樣?即將進(jìn)入到“實(shí)踐檢驗(yàn)真理”的時(shí)刻。
首先是近在眼前的vivo開發(fā)者大會(huì)。早在九月,vivo 執(zhí)行副總裁、首席運(yùn)營官胡柏山就宣布即將發(fā)布自研大模型,并且會(huì)和新機(jī)一起跟大家見面。
不過,可能是“新聞太大,憋不住”,才一個(gè)月過去,vivo副總裁、全球AI研究院院長周圍,開始在微博上不斷“劇透”即將推出的大模型的信息和能力。
其中,即將發(fā)布的vivoLM(vivo大模型)一共分為5個(gè)版本,按照參數(shù)量又分成十億(1B/7B)、百億(66B)和千億(130B/175B)三個(gè)級別。其中,7B的版本是vivoLM 將對外開放的版本。
在具體的能力上,大模型是很好的文本生成助理,同時(shí)也是很好的知識獲取入口。周圍認(rèn)為,“文本生成助理,除了普通的生文、總結(jié)、擴(kuò)寫,它甚至能幫你寫SWOT分析。同時(shí)它也是很好的知識獲取入口,只要問對問題,它就可以用人人都能聽懂的語句解釋很多專業(yè)領(lǐng)域的知識,比你在搜索引擎里淘金要高效的多,真正的‘旦用難回’。”
按照這個(gè)描述,大模型當(dāng)下與手機(jī)的結(jié)合可能更接近一個(gè)智慧助手的形象。
10月11日,OPPO宣布基于AndesGPT大模型打造的新版AI助手——新小布1.0開啟了第一輪公測。
OPPO對手機(jī)大模型的應(yīng)用展望,也是助理形象。“今天AIGC真的像一個(gè)人在跟你對話,這是最超出想象的一個(gè)體驗(yàn)。所以,未來的手機(jī)一定是你的超級助理。”在關(guān)于AIGC和大模型技術(shù)的顛覆性上,OPPO高級副總裁、首席產(chǎn)品官劉作虎在近日的采訪中表示。
比起“OV”在11月的“趕場”,華為和小米已經(jīng)在各自的手機(jī)助手上開始了應(yīng)用。
8月4日,在華為開發(fā)者大會(huì)上,華為常務(wù)董事、終端BG CEO、智能汽車解決方案BU CEO余承東宣布推出大模型加持的全新小藝,更新的功能還是主要體現(xiàn)在智慧交互,能夠完成自然語言理解的設(shè)備控制、文案內(nèi)容輔助、圖片二次創(chuàng)作等功能。
在小米這邊,8月14日小米開啟了小愛大模型的邀請測試,覆蓋大量手機(jī)機(jī)型和部分智能音箱。升級版的小愛具有理解上下文、更高質(zhì)量的問答、生成式內(nèi)容輸出等能力,基本上相當(dāng)于把文心一言、訊飛星火這種大模型App的能力直接嵌入到了手機(jī)中。但與App不同的是,這種嵌入會(huì)更加底層,交互也更多種多樣。
大模型如何裝進(jìn)手機(jī)里?
把大模型裝進(jìn)手機(jī),猶如把大象裝進(jìn)冰箱,有三步。
首先,手機(jī)行業(yè)雖然在大模型應(yīng)用的具體架構(gòu)和路徑上看法不同,但“云端+終端”的協(xié)同設(shè)計(jì)思路已經(jīng)達(dá)成了共識。
在數(shù)據(jù)中心,大模型動(dòng)輒幾百億、上千億的參數(shù),訓(xùn)練時(shí)對應(yīng)上萬張GPU的硬件需求,完整的大模型根本不可能塞進(jìn)手機(jī)“消費(fèi)級”的硬件里面。
而純云端的方案下,用戶在等待網(wǎng)絡(luò)通信的時(shí)間、云計(jì)算傳輸時(shí)間、判斷反饋時(shí)間的疊加下,等待時(shí)間太長,體驗(yàn)非常差。光是結(jié)合大模型的輸入法推薦詞的耗時(shí)都要長達(dá)兩秒,根本沒法用在實(shí)時(shí)聊天場景中,更別提在地庫、電梯、老辦公樓這些信號較弱的地點(diǎn)了。
再加上,想提供更多的智能輔助,勢必也會(huì)接觸到更多用戶信息。這些信息全上傳云端,那么隱私等信息安全也無法保證,而就算信息安全能夠支持,這些信息全部上傳云端,當(dāng)前存量龐大的智能硬件所產(chǎn)生的天量數(shù)據(jù),將對本就GPU硬件吃緊的廠商們帶來進(jìn)一步的網(wǎng)絡(luò)帶寬、存儲等各方面硬件上的壓力。
正如高通高級副總裁Alex Katouzian所言,“隨著連接設(shè)備和數(shù)據(jù)流量加速增長,疊加數(shù)據(jù)中心成本攀升,(我們)不可能將所有內(nèi)容都發(fā)送到云端。”
如此一來,要想讓移動(dòng)終端(手機(jī))擁有大模型的能力,就勢必要在端側(cè)安排端側(cè)大模型來“接應(yīng)”。
云端和終端的分層,是端云協(xié)同的第一步。
“模型訓(xùn)練需要巨大的算力,一定都會(huì)在云端進(jìn)行。而手機(jī)端的應(yīng)用,其實(shí)是推理。在推理的時(shí)候,模型可以只激活一部分的模塊、一部分的神經(jīng)元來計(jì)算,”小米技術(shù)委員會(huì) AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍表示。
另外,云端和端側(cè)的大模型具體的應(yīng)用場景也有所不同。
例如在手機(jī)上可以執(zhí)行一些簡單的任務(wù),比如寫作、建議、文生圖等。另一些涉及到復(fù)雜的知識體系和實(shí)時(shí)性的信息,不太適合數(shù)據(jù)采集和學(xué)習(xí)的,例如訂票、訂酒店等操作,可以調(diào)動(dòng)云端的能力。
接下來,是改造手機(jī)SoC,在原本的硬件平臺基礎(chǔ)上添加適合大模型的GPU、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、APU(加速處理器)等硬件。
在新款旗艦芯片上,針對大模型的搭載,高通和聯(lián)發(fā)科都有相對應(yīng)的升級。例如在10月25日新鮮出爐的驍龍8Gen3上,NPU性能提升98%,并且還給了兩個(gè)低功耗的NPU單元。令人驚喜的是,驍龍8Gen3支持100 億參數(shù)的模型。這意味著,當(dāng)前高通的新硬件裝下手機(jī)廠商們的大模型綽綽有余。
另一邊,與vivo和OPPO深度合作的聯(lián)發(fā)科,在其即將推出的天璣9300芯片上也集成了新的AI處理器。
不過,硬件上的升級還遠(yuǎn)遠(yuǎn)不夠。要想把大模型“塞進(jìn)”巴掌大的手機(jī)里,還需要對大模型“瘦身”。
在參數(shù)層面,手機(jī)廠商們普遍選擇十億級別的大模型落地。例如小米的13億、vivo的10億和70億、OPPO的70億等。參數(shù)量的減小,有效降低了大模型在側(cè)端占用的存儲空間,避免了千億級的大模型,光是參數(shù)就要占據(jù)幾百G存儲空間的尷尬。
在參數(shù)精簡后,廠商們還需進(jìn)一步調(diào)整模型,來讓小參數(shù)同樣能得出大參數(shù)的結(jié)果。
以華為的全新小藝為例,小藝是在華為盤古大模型的基礎(chǔ)上,針對終端消費(fèi)者場景構(gòu)建并精調(diào)的對話模型。在調(diào)整中,小藝重點(diǎn)學(xué)習(xí)了終端消費(fèi)者可能產(chǎn)生的數(shù)據(jù),如對話、設(shè)備操作,購物、吃穿用度等生活常識。在針對學(xué)習(xí)讓大模型“專精”后,華為在prompt(提示詞)和輸出格式做了逐字分析和壓縮,最終實(shí)現(xiàn)推理時(shí)延減半。
另一邊,當(dāng)前的量化技術(shù)也在推動(dòng)大模型變小。例如將模型從 FP32 縮小到 INT8。所謂 FP32,是一種單精度浮點(diǎn)數(shù),可以表述小數(shù)點(diǎn)后 7 位,相當(dāng)精確,但是運(yùn)算開銷較大。INT8 就是 8 位整數(shù),只占用 1 個(gè)字節(jié),運(yùn)算開銷較小。這個(gè)過程,可以理解為把原本精細(xì)的計(jì)算部分模糊化,量化操作讓端側(cè)的大模型無需達(dá)到云端的“盡善盡美”,也能給出合理的答案。
端云協(xié)同、硬件升級、大模型壓縮,經(jīng)過這三步,大模型基本就可以合格的裝進(jìn)手機(jī)中。
但實(shí)際上,大模型真正跟系統(tǒng)和應(yīng)用結(jié)合才剛剛開始,一個(gè)軟件驅(qū)動(dòng)行業(yè)的新周期漸露曙光。
抓住大模型,抓住
下一輪手機(jī)銷量排位賽
大模型進(jìn)入手機(jī),來自手機(jī)軟件能力的升級,變得前所未有的重要。
參考vivo大模型負(fù)責(zé)人周圍在微博的“劇透”。在大模型的用處中,vivo分為自然語言處理、圖像處理、推薦系統(tǒng)、人工智能安全、自動(dòng)化決策和模型訓(xùn)練優(yōu)化五個(gè)大類。
對于手機(jī)廠商布局端側(cè)大模型的動(dòng)作,欒劍表示:“首先我覺得從手機(jī)廠商來說,一定會(huì)探索這種可能性。如果不探索的話,未來有可能在這個(gè)領(lǐng)域落后”。
而在用戶側(cè)的感知上,以生成圖像、圖像識別的圖像處理和商品推薦、音樂推薦的推薦系統(tǒng)為例,大模型的加入,將給智能手機(jī)帶來智能化的新高度。
前者可以對應(yīng)當(dāng)前手機(jī)的AI優(yōu)化攝影功能。區(qū)別于之前妙鴨相機(jī)這種小程序,大模型接入后的攝影將不再局限自動(dòng)P圖、建議拍攝位置等功能,可以實(shí)現(xiàn)自然語言調(diào)整圖片內(nèi)容,甚至還能建議你,自拍擺什么姿勢最好看。
而后者推薦系統(tǒng)將有望打破音樂、購物、出行、餐飲、長短視頻等一系列APP的“封閉”壁壘,實(shí)現(xiàn)不需要打開對應(yīng)APP就全方位接收推薦算法。
這樣一來,大模型或許將改變APP的“勢力割據(jù)”,重塑應(yīng)用軟件的生態(tài)也不是沒有可能。
更為關(guān)鍵的是,大模型將會(huì)和手機(jī)廠商自研的操作系統(tǒng)深度結(jié)合,提供系統(tǒng)級的體驗(yàn)。
而手機(jī)軟件體驗(yàn)上的差異,將解決當(dāng)下手機(jī)廠商“硬件大同小異,只能外觀找不同”的同質(zhì)化問題。
消費(fèi)者挑選更智能的手機(jī),將不需要看評測、對比拍攝樣張、看跑分、看溫度表現(xiàn)等等產(chǎn)品之間的細(xì)微差別。大模型的PK,手機(jī)產(chǎn)品將直接表現(xiàn)為“智力水平”的高低,這也正是為何手機(jī)廠商們當(dāng)前開始熱衷大模型“打榜”的原因之一。
從AI 定義汽車,到AI定義手機(jī)、PC,大模型的注入將在一定程度上重塑手機(jī)市場的銷量格局。
當(dāng)前手機(jī)廠商們“下餃子”式的入局大模型,還只是個(gè)開始,后續(xù)應(yīng)用落地、模型迭代、優(yōu)化體驗(yàn)等環(huán)節(jié),眼見著將成為手機(jī)行業(yè)玩家們的新一輪“無限游戲”。
而來自軟件層面“看得見,摸得著”的智能化體驗(yàn),也將對過去手機(jī)發(fā)布會(huì)關(guān)于“攝像頭如何來之不易”、“性能參數(shù)又贏蘋果”、“手機(jī)殼材質(zhì)太極限了”這些內(nèi)容的大侃特侃,注入全新的內(nèi)容活力。
更重要的是,大模型倒逼手機(jī)算力的提升,也將帶來一波換機(jī)潮。
過去,因硬件配置過剩,出現(xiàn)了一臺手機(jī)用5年的“手機(jī)釘子戶”,大模型的升級體驗(yàn)或許將給其一個(gè)無法拒絕的換機(jī)理由,從而為手機(jī)行業(yè)帶來銷售層面的增長。
原文標(biāo)題 : “華米OV”的新戰(zhàn)場:手機(jī)大模型
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
11月20日火熱報(bào)名中>> 2024 智能家居出海論壇
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【在線會(huì)議】多物理場仿真助跑新能源汽車
推薦專題
- 1 腦機(jī)接口芯片,華為出了新專利!
- 2 今年諾獎(jiǎng)對人工智能的重視,給我們的基礎(chǔ)教育提了個(gè)醒
- 3 銀行業(yè)AI大模型,從入局到求變
- 4 巨頭搶布局,VC狂撒錢,為了能讓「AI讀心」這些公司卷瘋了
- 5 阿斯麥ASML:“骨折級”洋相,又成AI第一殺手?
- 6 蘋果市值創(chuàng)新高,iPhone 16能否助力突破4萬億美元大關(guān)?
- 7 一場“載入史冊”的發(fā)布會(huì),讓馬斯克失去了4700億
- 8 百度谷歌比較研究2024:中美“遠(yuǎn)古AI龍頭”的現(xiàn)狀與趨勢
- 9 洞見AI風(fēng)潮 第二屆vivo藍(lán)河操作系統(tǒng)創(chuàng)新賽開啟招募
- 10 地平線開啟配售,阿里百度各砸5000萬美金,市值最高超500億
- 高級軟件工程師 廣東省/深圳市
- 自動(dòng)化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市