天美传媒媒体视频免费观看,欧美成人A∨一区二区三区,人人爽人人澡

ChatGPT之戰(zhàn)，科技“托拉斯”之戰(zhàn)

2023-03-21 09:39

芯流智庫

關(guān)注

2022年11月30日，微軟旗下的OpenAI發(fā)布ChatGPT，5天內(nèi)涌入100W用戶。

他擁有持續(xù)的上下文對話能力，同時(shí)支持文章寫作、詩詞生成、代碼生成等能力。

這個(gè)與Siri、小愛、小度、小冰等完全不在一個(gè)level的聊天機(jī)器人，被認(rèn)為是“通用型人工智能”的開端。

面對它的誕生，有人歡喜有人愁。微軟和谷歌短兵相接，國內(nèi)的百度、阿里等AI大廠們也在緊繃著弦加速攻堅(jiān)。

為什么ChatGPT會(huì)引發(fā)如此大的轟動(dòng)？它的背后有著怎樣的技術(shù)鋪墊？被甩在后面的中國科技產(chǎn)業(yè)，又該怎樣奮起直追？

本文將分為以下兩部分闡述：

1. ChatGPT是怎樣煉成的？

2.中國版ChatGPT還有多遠(yuǎn)？

ChatGPT是怎樣煉成的？

最先看到ChatGPT，不是在科技新聞，也不是媒體官宣，而是在朋友圈刷屏的對話截圖中。面對稀奇古怪的問題，對面總能給出簡潔嚴(yán)謹(jǐn)又不失情感的回答，有如訓(xùn)練有素的萬能客服。

前微軟亞洲互聯(lián)網(wǎng)工程院副院長、現(xiàn)小冰公司CEO李笛說，ChatGPT之所以出圈，是源于它被普通用戶觀察到，并超過了人們對人工智能的預(yù)期。

上一次現(xiàn)象級(jí)的AI浪潮還是2016年，AlphGo擊敗李世石。六年過去，故事的主角從谷歌換成了微軟的OpenAI。

ChatGPT全名為Chat Generative Pre-Trained Transformer，使用基于GPT-3.5架構(gòu)的大型語言模型（LLM），既能夠?qū)懺姼�、編代碼，還能創(chuàng)造劇本、幫你面試出題、發(fā)表論文，以及實(shí)現(xiàn)更廣泛的搜索服務(wù)等。

ChatGPT的誕生，開啟了“AIGC元年”。所謂AIGC，即AI Generative Content，是繼UGC、PUGC之后，由AI直接生產(chǎn)內(nèi)容的技術(shù)形式。ChatGPT使AIGC在各行各業(yè)的商業(yè)化落地有了具象的出路，人類的生產(chǎn)力迎來解放革命仿佛就在不遠(yuǎn)的未來。

目前，如Siri等著名AI實(shí)際上都大同小異，是基于若干個(gè)專業(yè)Agent復(fù)合而成的，也就是說單個(gè)Agent只會(huì)做份內(nèi)的活，在AI判斷了用戶的意圖是生成代碼、文學(xué)創(chuàng)作、圖片繪制、視頻制作等等后，就將命令發(fā)給對應(yīng)的Agent去解決。

而ChatGPT是一個(gè)另類，它的背后是一個(gè)全能機(jī)器人（大語言模型），用戶借助文字下達(dá)命令（Prompting，提示/指示），ChatGPT將自主適應(yīng)不同領(lǐng)域的任務(wù)。

盡管目前還存在不夠智能的時(shí)刻，但ChatGPT已經(jīng)具備了“通用型人工智能”的雛形。

十足的科幻感背后，也離不開實(shí)打?qū)嵉母咄度�。ChatGPT最突出的“通用性”，依賴于背后的通用大模型。

模型的本質(zhì)是一套計(jì)算公式和數(shù)學(xué)模型，參數(shù)可以視為模型中的公式。參數(shù)量越大，模型越復(fù)雜，預(yù)測也越精準(zhǔn)。大模型就是參數(shù)量極大的模型，目前業(yè)內(nèi)主流的AIGC模型動(dòng)輒有著千億、萬億級(jí)的參數(shù)量。

ChatGPT是基于GPT-3模型進(jìn)行優(yōu)化所產(chǎn)生的。OpenAI在訓(xùn)練GPT-3時(shí)，用了45TB的數(shù)據(jù)量、近 1 萬億個(gè)單詞，約合到1351萬本牛津詞典。

這就使得大模型的訓(xùn)練和推理高度依賴芯片。缺少芯片會(huì)造成算力不足，進(jìn)而無法處理龐大的數(shù)據(jù)量和模型，最終導(dǎo)致人工智能變成“人工智障”。

高算力是ChatGPT的地基，其中最重要的搭建者是微軟和英偉達(dá)。

2019年，微軟為OpenAI打造了Azure AI超算平臺(tái)，該平臺(tái)性能位居全球前五，擁有超過28.5萬個(gè)CPU核心、1萬個(gè)GPU、每GPU擁有400Gbps網(wǎng)絡(luò)帶寬的超級(jí)計(jì)算器，成本高達(dá)數(shù)億美元。

此外，2019年微軟向OpenAI投資10億美元。2021年微軟再進(jìn)行了一輪未透露金額的投資。今年1月，微軟宣布將在未來數(shù)年陸續(xù)向OpenAI投資100億美元。

芯片方面，英偉達(dá)的A100/H100是目前性能最強(qiáng)的數(shù)據(jù)中心專用GPU，市面上幾乎沒有可規(guī)模替代的方案。據(jù)瑞銀分析師蒂莫西·阿庫里分析，ChatGPT已導(dǎo)入至少1萬顆英偉達(dá)高端GPU來訓(xùn)練模型。

微軟提供資金與算力支持，英偉達(dá)供應(yīng)高性能芯片，Buff疊滿的OpenAI沉淀了數(shù)年，才一舉驚艷了世界。這其中展現(xiàn)出的，一是OpenAI敢于在無人區(qū)死磕的工匠精神，二是美國強(qiáng)大的科技托拉斯力量。

托拉斯（trust），是由生產(chǎn)同類商品或在生產(chǎn)上有聯(lián)系的大企業(yè)，為壟斷某些產(chǎn)品的產(chǎn)銷以獲取高額利潤而聯(lián)合成的一種壟斷組織形式。

OpenAI的成功，根本上是美國科技托拉斯的成功。下游的終端應(yīng)用、上游的芯片和中間的技術(shù)研發(fā)三大托拉斯，共同催生了ChatGPT：

微軟作為下游應(yīng)用巨頭，其不僅在硬件和AI上投入大量研發(fā)資金，還頻頻收購游戲等行業(yè)的多家科創(chuàng)企業(yè)，整合前沿科技的技術(shù)與生態(tài)，鍛造自己在算力時(shí)代的綜合競爭力。

英偉達(dá)在數(shù)據(jù)中心GPU市場占據(jù)超過90%以上的份額，其供應(yīng)的底層芯片是AIGC賽道不可或缺的稀缺資源。包括特斯拉、Facebook在內(nèi)的企業(yè)，都采用英偉達(dá)的A100芯片組建AI計(jì)算集群，采購規(guī)模均超過7000枚。

而研發(fā)的主體OpenAI，由埃隆馬斯克牽頭出資創(chuàng)立，山姆?阿爾特曼、彼得?蒂爾、雷德?霍夫曼等一眾硅谷大佬加盟，最開始即定位為非營利性組織，劍指AGI（通用人工智能）。

中國能否在新一輪AI浪潮中追上美國，根本上取決于科技托拉斯的力量。

中國版ChatGPT還有多遠(yuǎn)？

ChatGPT在線上客服、搜索引擎、內(nèi)容生產(chǎn)等方面展現(xiàn)出的巨大潛力，讓國內(nèi)外科技公司紛紛加碼布局訓(xùn)練大模型，一場AIGC軍備競賽打響了。

2月2日，微軟宣布旗下產(chǎn)品將全線整合ChatGPT，同日ChatGPT宣布推出付費(fèi)訂閱服務(wù)。

2月3日，谷歌向AI初創(chuàng)企業(yè)Anthropic投資約3億美元，并宣布將推出類似于ChatGPT的大型語言模型。

2月7日，微軟發(fā)布新品，推出新版搜索引擎必應(yīng)和Edge瀏覽器，新增了和ChatGPT一樣的AI語言模型GPT3.5。

大洋彼岸，北京西二旗的科技園里，百度的算法工程師們也在徹夜備戰(zhàn)，所有的核心人才和高端算力資源全部調(diào)用給了大模型“文心一言”。

作為最大的中文搜索引擎，百度在人工智能的四層技術(shù)架構(gòu)上實(shí)現(xiàn)了全棧布局：

模型層，百度在2019年推出了知識(shí)增強(qiáng)的語義理解框架ERNIE（文心大模型），并廣泛應(yīng)用于閱讀理解、情感分析、智能搜索問答、視頻推薦、CTR預(yù)測等領(lǐng)域。目前，ERNIE系列模型經(jīng)過了多次的迭代，具備了較強(qiáng)泛化能力和性能。

框架層，百度的深度學(xué)習(xí)飛槳平臺(tái)在2022年底已凝聚535萬開發(fā)者，基于飛槳?jiǎng)?chuàng)建了67萬個(gè)模型，服務(wù)20萬家企事業(yè)單位，構(gòu)建起了繁榮的AI技術(shù)生態(tài)。

芯片層，百度自研AI芯片“昆侖芯”已在多場景實(shí)際部署幾萬片，讓文心一言底層算力有所保證。

應(yīng)用層，百度的搜索服務(wù)每天響應(yīng)幾十億次真實(shí)的用戶使用需求，每天進(jìn)行1萬億次深度語義推理與匹配，能夠?yàn)榇竽Ｐ吞峁┳钫鎸?shí)、最及時(shí)的反饋。此外智能云、Apollo自動(dòng)駕駛、小度智能設(shè)備等應(yīng)用也將與文心一言整合。

3月16日，百度版ChatGPT“文心一言”如期發(fā)布，CEO李彥宏演示了文心一言的五個(gè)集中場景：文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。

文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級(jí)網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語音日均調(diào)用數(shù)據(jù)，以及5500億事實(shí)的知識(shí)圖譜等，這讓百度在中文語言的處理上，能夠處于獨(dú)一無二的位置。

扎根中文土壤，文心一言在中文語言和中國文化上有相對更好的表現(xiàn)。在發(fā)布會(huì)展示中，文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應(yīng)的經(jīng)濟(jì)學(xué)理論，還用“洛陽紙貴”四個(gè)字創(chuàng)作了一首藏頭詩。

爭奪這波AI潮入場券的當(dāng)然不止百度。

騰訊稱，在ChatGPT和AIGC相關(guān)方向已有布局，阿里達(dá)摩院正在研發(fā)的類ChatGPT的對話機(jī)器人，目前已開放給公司內(nèi)員工測試�？焓�、京東、360等多家互聯(lián)網(wǎng)企業(yè)也都表示在相關(guān)領(lǐng)域研發(fā)和布局。

美團(tuán)聯(lián)合創(chuàng)始人王慧文在今年2月發(fā)布了一條“AI英雄榜”，高調(diào)地招兵買馬。他設(shè)立了光年之外科技有限公司，自己出資5千萬美元，估值2億美元，并表示：“我當(dāng)前不懂AI技術(shù)，正努力學(xué)習(xí)，所以個(gè)人肉身不占股份，資金占股25%。”

同時(shí)，王慧文與語音搜索應(yīng)用“出門問問”創(chuàng)始人李志飛、真格基金兩位合伙人戴雨森和劉元吃飯的照片流出。李志飛也曾公開表示決心要“做一個(gè)中國的語言大模型”。

大廠們瘋狂卷進(jìn)度的比拼，王慧文求賢若渴的姿態(tài)，體現(xiàn)出這波AIGC熱潮的窗口期之短——一旦沒有及時(shí)聚集足夠的資金和人才，拿出像樣的模型或產(chǎn)品，就會(huì)被趕下牌桌。

但在催命般的產(chǎn)業(yè)倒計(jì)時(shí)中，有些事卻急不來。

ChatGPT的出現(xiàn)，數(shù)據(jù)、算力和算法是關(guān)鍵的三個(gè)要素，需要不斷的量的積累，才有望一朝獲得質(zhì)變。而我國目前在這三方面仍有較大差距。

數(shù)據(jù)方面，中文互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)大量儲(chǔ)存在移動(dòng)端APP中，由于互聯(lián)網(wǎng)巨頭之間數(shù)據(jù)相互封閉，數(shù)據(jù)抓取難度高，數(shù)據(jù)孤島化情況嚴(yán)重。數(shù)據(jù)的質(zhì)量和數(shù)量不足，就無法提供大量模型訓(xùn)練所需的信息。

算力方面，由于英偉達(dá)A100芯片被美國列入限制出售范圍，中國企業(yè)只能使用為數(shù)不多的A100存貨和閹割版的A800，高性能芯片嚴(yán)重缺乏。

算法方面，好的算法能夠使AI具有更強(qiáng)的通用性，并優(yōu)化計(jì)算過程，減少算力負(fù)擔(dān)。我國在AI算法研究、高端算法人才以及具備自研算法實(shí)力的科技公司數(shù)量等方面仍落后于美國。

時(shí)間壁壘已經(jīng)產(chǎn)生，在實(shí)力鴻溝面前，要做出對標(biāo)ChatGPT的模型和產(chǎn)品，只有勇氣和資金是遠(yuǎn)遠(yuǎn)不夠的，中國的參賽者們必須拿出更強(qiáng)的創(chuàng)新意識(shí)和更深的產(chǎn)業(yè)遠(yuǎn)見。

一味跟著OpenAI的步伐只會(huì)掉入陷阱，更為中國式的打法，應(yīng)該考慮產(chǎn)業(yè)巨頭的合縱連橫、另辟蹊徑的技術(shù)路線以及潛在的商業(yè)模式，走不同的路才有希望正面應(yīng)戰(zhàn)。

新一輪的科技革命已經(jīng)開啟，AIGC時(shí)代將深刻改變每一個(gè)行業(yè)的發(fā)展模式，而中國AI大廠們在這場技術(shù)巔峰賽中也將迎來終局之戰(zhàn)。孰勝孰敗，我們拭目以待。