從“奇點”到“大爆炸”,生成式AI開啟“十年周期”
世界是復雜的,沒有人知道未來會怎樣,但如果單純從技術的角度,我們總是能夠沿著技術發(fā)展的路徑,找到一些主導未來趨勢的脈絡。
從Sora到Suno,從OpenAI到Copilot、Blackwell,這些熱詞在大眾眼里或許還分不清楚,但很多人已經用上各種“ChatGPT”,或聊天或創(chuàng)作。不知不覺間,我們已經卷入新一輪AI浪潮中。
這輪人工智能浪潮,自ChatGPT這類生成式AI工具問世,被迅速引爆。AI大模型從研究走向應用,復用成本大幅降低,各種應用得以更快滲透進各行各業(yè)。
IDC發(fā)布報告稱,2027年全球人工智能IT總投資規(guī)模有望從2022年的1324.9億美元增至2027年的5124.2億美元,年復合增長率(CAGR)為31.1%。
聚焦生成式AI,IDC預測,全球生成式AI市場年復合增長率將達85.7%,到2027年全球生成式AI市場規(guī)模將接近1500億美元。
英偉達CEO黃仁勛表示,生成式AI已經開啟了全新的投資周期,已經進入了“十年周期”(技術從出現、傳播到大規(guī)模應用所需的時間)的第一年。
當生成式AI從一個“奇點”到迎來“大爆炸”時刻,其將在現實世界發(fā)生哪些改變?又將激發(fā)怎樣的潛力?
生成式AI迎來“三個轉變”
過生成式AI技術可分為四個層次,即面向消費者應用;大語言模型(LLM)等基礎技術;支持服務的云基礎設施;以及對于開發(fā)和運營至關重要的半導體。
從技術發(fā)展看,今年生成式AI將從純理論探討階段,全面進入到業(yè)務應用階段。過去一年,大部分企業(yè)和機構并沒有真正打造出生成式AI系統(tǒng);而今年,生成式AI系統(tǒng)將全面進入到生產當中,企業(yè)將真正地開始使用生成式AI工具。
對于生成式AI本身,即將迎來三個方面的轉變。
首先,要把生成式AI投入到企業(yè)以及業(yè)務用例的過程中,就要從構建訓練基礎架構轉向構建推理基礎架構。
到目前為止,大部分企業(yè)往往是通過對開源基礎模型進行調優(yōu)、優(yōu)化或者是互聯(lián),來實現自己的某些功能和需求。
對于各個企業(yè)、各個垂直行業(yè)領域的企業(yè)來說,無論是GenAI還是GPT4,大語言模型的訓練成本是高昂的。特別是對于垂直行業(yè)的企業(yè)用戶,不會在業(yè)務推進過程中直接采用這些模型。
如果未來需要將AI能力賦予企業(yè)的業(yè)務,那么企業(yè)就需要進一步開發(fā)已有的模型,從而讓這些模型在部署到垂直行業(yè)的生產中時,可以真正地轉化為生產力。
而這種轉變也對企業(yè)提出了更加明確的要求:如何更好地設計出這種推理基礎架構?該把它們放在哪里?如何確保其安全?
其次,是企業(yè)的關注點將越來越多地將從寬泛的實驗轉向自上而下的戰(zhàn)略推進,即挑選出少數幾個真正具有變革意義的生成式AI應用項目。
去年,很多企業(yè)都在考慮采用生成式AI技術。但如今,企業(yè)已經認識到,要應用生成式AI技術,每個項目都非常龐大,需要占用大量人力、物力、財力,才能構建和實施一個能夠投入生產的生成式AI系統(tǒng)。
到了今年,一方面,生成式AI領域將會有成百上千乃至上萬的潛在用例,但另一方面,由于每一個企業(yè)的資源有限,因此只能選擇其中幾個重點實施。
對于企業(yè)的CIO和領導者,必然會面臨一個問題:就是從幾百個AI項目中,優(yōu)先選擇幾個進行實施。這其中的風險在于:一旦選對了,這些項目將對業(yè)務產生正向影響;而萬一選錯,可能就會造成大量的資源浪費。
要想做出一個正確的選擇,各個企業(yè)必須要充分理解GenAI價值,以及生成式AI最有可能從哪些方面能夠為企業(yè)提升生產力而賦能。
第三,是用戶對于AI投入的成本考量,從對“訓練成本”的計算轉向對“運營成本”的衡量。
在理論研究和訓練階段,生成式AI的成本取決于構建模型的復雜程度,以及架構開發(fā)和維護人員的規(guī)模,除此之外再無其他成本可言。
但當企業(yè)用戶開始實施部署和應用生成式AI工具時,現實的運營成本就會成為企業(yè)用戶面臨的最大經濟考量。
以戴爾科技為例,其最初開始建立自己的生成式AI系統(tǒng)時,基本上會在三個月的時間里用到20臺服務器,此刻其整體運營成本是未知的。
但當這套系統(tǒng)開始被戴爾科技內部的工程師應用時,6000名工程師每個月就需要大約5000萬次處理量,因此該系統(tǒng)最大的成本不是建立一個模型的成本,而是基于大規(guī)模處理而產生的巨額運營成本。
這對企業(yè)用戶而言,從訓練成本到運營成本的考慮,將是未來必將面對的一個相當現實的問題。
從本質上說,生成式AI的轉變其實是技術從研發(fā)到應用的商用化過程中必然要經歷的過程。
只是由于AI自身業(yè)務形態(tài)的改變,也將帶來更多行業(yè)的改變,其中的一個影響就是會帶動一批相關技術和應用,成為未來的熱點和趨勢。
如何激發(fā)生成式AI 更大潛力
僅僅一年,隨著各大資本和巨頭入場,AI從底層大模型,到基礎設施,到機器學習操作(MLOps),再到消費端應用,生成式AI的生態(tài)已經初步建立。
隨著今年生成式AI的進一步訓練和穩(wěn)定,行業(yè)發(fā)展將加速向下游移動,生成式AI將進一步改變人們的生活,乃至改變整個世界,其為企業(yè)提供了無限的想象空間,使產品和服務的研發(fā)過程更加高效、有趣。
面對生成式AI市場的巨大潛力,亞馬遜、谷歌、微軟、Meta等科技巨頭不甘示弱。去年12月,谷歌多模態(tài)大模型Gemini發(fā)布,包含三個版本:Nano、Pro和Ultra。
Pro對標GPT-3.5,Ultra對標GPT-4,可以處理文本之外的信息,包括圖像、視頻和音頻。同時,谷歌上線文生圖模型Imagen 2、視頻生成模型VideoPoet,推出醫(yī)療人工智能大模型MedLM,將大模型與醫(yī)療保健行業(yè)緊密結合。
去年11月,微軟將集成了GPT的Bing Chat更名為Copilot,可以免費使用GPT-4、DALL·E 3功能,并且擁有了獨立網站,Copilot將嵌入所有微軟旗下應用中。微軟還推出Copilot Studio,使用者可以自定義GPT、創(chuàng)建新插件、自定義工作流。
Meta則接連發(fā)布了650億參數的開源大模型 LLaMA和700億參數的LLaMA2。近日,Meta推出全新開源大模型Code Llama 70B,其準確率達到了53%,超過了GPT-3.5的48.1%,是目前評分最高的開源大模型。
2023年以來,看似默默無聞的亞馬遜頻頻出擊。去年9月,亞馬遜宣布將向人工智能初創(chuàng)公司Anthropic投資40億美元,近日,其再次宣布追加投資27.5億美元,完成了對Anthropic40億美元的投資,決心可見一斑。窗體頂端
更為重要的是,亞馬遜云科技提出了基于生成式AI的三層技術棧。
第一層是高性能基礎設施,過去五年,亞馬遜云科技持續(xù)加大在自研芯片方面的投入,比如Amazon Trainium和Amazon Inferentia芯片,可以提供在云上訓練模型和運行推理的最低成本。
除此之外,在GPU方面,NVIDIA多款先進算力均率先在亞馬遜云科技落地。
第二層是最廣泛的基礎模型選擇。亞馬遜云科技認為“沒有一個模型可以適用于所有業(yè)務場景”,因此推出Amazon Bedrock,企業(yè)可以靈活選擇適合自己的模型,更容易地構建應用,并在保證數據安全和隱私基礎上,進行定制化模型的開發(fā),還無需大量的標注數據。
Amazon Bedrock提供各種領先的基礎模型供客戶選擇:既有知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。
基于Amazon Bedrock云托管服務,企業(yè)可以通過API訪問從文本到圖像的一系列強大的基礎模型。
值得一提的是,亞馬遜和Anthropic在生成式AI領域有著廣泛的合作,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領先的大模型之一,共包含三個模型:Haiku、Sonnet、Opus,從模型尺寸來看,可以理解為模型的中杯、大杯、超大杯。
客戶可以根據自己的商業(yè)需求,從中選擇最合適的智能、速度和價格組合。
Haiku:是響應速度最快的模型,也是成本最低的選項,在大多數純文本任務上的表現仍然相當出色,也同時包含多模態(tài)能力(比如視覺)。
Sonnet:適用于需要平衡性能和成本的場景,它在純文本任務上的表現與后面的Opus相當,但在成本上更為經濟,適合于那些需要性能稍微好點,但預算有限的企業(yè)和個人用戶。
Opus:具有強大的推理、數學和編碼能力,接近人類的理解能力,適用于需要高度智能和復雜任務處理的場景,如企業(yè)自動化、復雜金融預測、研究和開發(fā)等。
對于Claude 3,更有行業(yè)人士認為其終結了GPT-4時代。Claude 3有兩大亮點,一個是長文本,二是多模態(tài)能力。
長文本是Claude 3的一個顯著優(yōu)勢,體現為在讀論文、小說等字數更多的文本時,Claude 3更擅長理解和回答用戶的相關問題。
此次Claude 3大大提升了上下文對話窗口,達到200k,可以理解為單次和模型對話能夠輸入的文本。
具體而言,Claude 3 200k的對話長度,相當于能夠單次處理超過15萬英文單詞,而GPT-4 Turbo的上下文窗口為128k,大約是9.6萬個英文單詞。同時,Claude 3也第一次允許圖像和文檔上傳。
和ChatGPT一樣,Claude 3能夠“認”出來圖里的是什么東西,直接描述,回答用戶的問題。更令人印象深刻的是,Claude 3在分析一些復雜問題時,已經能夠和人一樣,先拆解問題,并且交由子模型來進行調度。
第三層就是應用生成式AI技術的開箱即用的云服務,進一步降低使用門檻。目前已經推出Amazon Q這一AI助手,可以根據客戶業(yè)務進行定制,專用于辦公場景需要。
還與像Amazon QuickSight,包括智能客服的產品Amazon Connect,面向編程開發(fā)人員的平臺Amazon CodeWhisperer,都實現了非常有效的結合。
可以看到,從底層基礎設施到上層應用拓展,今年亞馬遜云科技在生成式AI領域不斷發(fā)力。不同的客戶可以根據需求選擇不同層級的產品,通過這三層來支持他們的業(yè)務創(chuàng)新。
此外,對于如何幫助企業(yè)快速具備生成式AI能力,亞馬遜云科技擁有豐富的專業(yè)技術支持資源,包括SA、產品專家、人工智能實驗室、數據實驗室、快速原型團隊、專業(yè)服務團隊,幫客戶打通應用生成式AI的“最后三公里”工程化挑戰(zhàn)。
對于作為扮演“底層架構師”角色的亞馬遜云科技而言,大模型固然重要,但關鍵技術能力的集合才是提升企業(yè)生產力的根本動力。
亞馬遜云科技大中華區(qū)產品部總經理陳曉建表示,“盡管大模型非常重要,但僅靠大模型對企業(yè)的生產是遠遠不夠的。從模型能力到真正的運營生產之間,企業(yè)還需要增加很多輔助能力。企業(yè)需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜云科技一系列產品所提供的價值所在。”
生成式AI領域接下來發(fā)展的最關鍵一步是什么?陳曉建表示,首先,從最底層來看,芯片性能仍然落后于需求。雖然半導體芯片的發(fā)展已經非?,但模型本身參數規(guī)模的擴大實際上遠超芯片的能力。
“以前一個幾百萬參數的模型,就覺得已經很大了,但現在動輒達到數百億的規(guī)模;A服務商仍需關注如何將底層能力、業(yè)務復雜度和大模型復雜度相匹配,使硬件發(fā)展趕上軟件發(fā)展規(guī)模。”
其次,他認為大模型能力本身還有很多發(fā)展空間,今天看到的模型可能代表了一個博士生水平,但是能不能做得更好?比如達到教授或者院士水平?
包括亞馬遜云科技在內的諸多生成式AI供應商需要在未來持之以恒地去做模型能力方面的工作。
在最上層與各行各業(yè)務相結合方面,陳曉建表示,相關的SaaS解決方案非常多。
從這點上看,將生成式AI能力與垂直場景的解決方案結合需要做巨大的工作。“我們需要思考大模型如何為人類社會各行各業(yè)中的應用提供更好的模型能力、更易用的方式和更低的成本。”
無論如何,人們對未來的期許總是充滿希望。對于科技未來的走向,以AI為代表的技術進化,正在成為一場考驗人類想象力的比賽。
科技企業(yè)能做的,就是通過技術普惠,降低AI參與門檻,先把大模型打造成像電、水一樣隨取隨用的公共資源,再將生成式AI技術應用于各行各業(yè),變成真正能夠推動人類發(fā)展的生產力。
相關閱讀
從“算力核彈”到生成式AI,新紀元還有多遠?
打造生成式AI應用,什么才是關鍵?
AI Agent:大模型的下一個高地
生成式AI來了,我們還能相信自己的眼睛嗎?
【科技云報道原創(chuàng)】
轉載請注明“科技云報道”并附本文鏈接
原文標題 : 從“奇點”到“大爆炸”,生成式AI開啟“十年周期”
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市