Sora配得上一句「遙遙領(lǐng)先」嗎?
Sora沒(méi)有讓「現(xiàn)實(shí)不存在了」,畢竟現(xiàn)實(shí)中的杠精依舊存在。
文 | 佘宗明
Sora+蘋(píng)果頭顯VisionPro+腦機(jī)接口=?
這注定是個(gè)沒(méi)有標(biāo)準(zhǔn)答案的問(wèn)題。
在e/acc(有效加速主義)思維中,答案也許是「顛覆」「革命」「iPhone時(shí)刻」等大詞不夠用,「未來(lái)已來(lái)」的既視感愈發(fā)強(qiáng)烈。
在EA(有效利他主義)視角里,這可能意味著風(fēng)險(xiǎn)連著風(fēng)險(xiǎn):深度偽造、后真相,意念失控、腦波異樣……
擔(dān)心「被AI替代」、熱議「××行業(yè)已死」,成了Sora在輿論場(chǎng)激起的鏈?zhǔn)椒磻?yīng)。震驚體和重磅發(fā)布體標(biāo)題堆砌,則成了自媒體蹭熱點(diǎn)的標(biāo)準(zhǔn)姿勢(shì)。
在網(wǎng)上,還有些YY達(dá)人用腦補(bǔ)那些難以描述畫(huà)面的方式,代償著《完蛋!我被美女包圍了》玩完后的意猶未盡:戴上VR眼鏡,就能觀看由自己意念發(fā)出的Prompt(提示詞)生成的小視頻,男主角是自己,女主角是劉亦菲楊冪劉詩(shī)詩(shī)熱巴……
▲從Sora生成的視頻中,可以看到女子眼部的細(xì)節(jié)變化。
雖然打開(kāi)方式各異,但現(xiàn)實(shí)中,大多數(shù)人終究是承認(rèn)「二向箔原產(chǎn)地供應(yīng)商」OpenAI的優(yōu)秀的:去年初ChatGPT爆火帶來(lái)的AI大模型熱余溫猶在,今年初文生視頻大模型Sora又將AIGC推向新里程碑,怎一個(gè)「了得」二字了得?
饒是如此,仍有不少人對(duì)「開(kāi)年王炸中的王炸」Sora翻起了白眼——他們手里拿著DAO、DeFi、NFT、Crypto的概念合訂本,準(zhǔn)備在上面再加個(gè)「Sora」。
每場(chǎng)技術(shù)變革,都是在被質(zhì)疑中擴(kuò)散開(kāi)來(lái)的,「泡沫論」幾乎是每個(gè)風(fēng)口都揮不去的陰影。
只不過(guò),對(duì)Sora的質(zhì)疑里,還摻雜了更為復(fù)雜的情緒配方。這類情緒配方,跟「大國(guó)技術(shù)差距」的對(duì)照關(guān)聯(lián),也被民族情緒托起的某種力場(chǎng)強(qiáng)化。
這番景象,讓?xiě)T于自己打倒自己的胡錫進(jìn)都有些坐不住。
在ChatGPT剛問(wèn)世時(shí),面對(duì)「胡錫進(jìn)要被替代」的調(diào)侃,他還能調(diào)侃著回應(yīng)「老胡不依附任何時(shí)髦的東西」。
到了Sora問(wèn)世時(shí),面對(duì)Sora「不代表什么」的論調(diào),他怒斥這是「睜著眼睛硬說(shuō)」「太不負(fù)責(zé)任」「給廣大網(wǎng)民們灌迷魂湯」,還感慨:最可怕的是我們不敢面對(duì)問(wèn)題,在一切都OK甚至很好的自我安慰和陶醉中,變得麻木。
挺耐人尋味的。
01
盡管總有「新工業(yè)革命」之類的強(qiáng)沖擊字眼蹦出來(lái)提醒人們:AI時(shí)代大幕已啟,人類離通用人工智能(AGI)又更近一步,ChatGPT和Sora面世都是標(biāo)志性節(jié)點(diǎn)……可總有些從新盧德主義余燼里竄出的「看空」話語(yǔ),跟「看多」聲量形成對(duì)沖。
在盛產(chǎn)奇觀的簡(jiǎn)中輿論場(chǎng),把Sora看成「又一個(gè)Web3」「下一個(gè)元宇宙」的貶抑話語(yǔ)含量更是超標(biāo)。很多人繡口一吐,就是一個(gè)「奇技淫巧」。
Sora明明憑著具備超長(zhǎng)生成時(shí)間(60s)、單視頻多角度鏡頭、細(xì)節(jié)高度仿真、理解物理世界等優(yōu)勢(shì),實(shí)現(xiàn)了對(duì)同行的降維打擊,引得Runway、Pika Labs、Stable Video幾大競(jìng)品都俯首稱臣。
▲谷歌今年1月發(fā)布的視頻模型Lumiere演示了圖生視頻案例,卻終究難逃被Sora艷壓的命運(yùn)。
可他們卻微微一笑:無(wú)他,大力出奇跡爾。
Sora本是依托兩項(xiàng)核心技術(shù)突破的突破——Spacetime Patch(時(shí)空Patch)技術(shù)和Diffusion Transformer(擴(kuò)散型 Transformer)架構(gòu)。
可他們卻擺了擺手:這些技術(shù)又不新,全靠咱們謝賽寧。
你還想說(shuō)些什么,他們甩出一堆翻車神圖:椅子漂浮、反向跑步、玻璃杯詭異碎裂……然后滿臉不屑地說(shuō):Sora也就比人工智障多走了幾步而已,它能用多個(gè)1分鐘視頻「拼」成2小時(shí)的電影嗎?不能。能表現(xiàn)影視劇中復(fù)雜的人物內(nèi)心活動(dòng)嗎?不能。能生成三維化虛擬世界讓人在里面嗨嗎?不能。
▲Sora生成的視頻中出現(xiàn)了椅子懸浮的反物理學(xué)畫(huà)面。
很顯然,Sora沒(méi)有讓「現(xiàn)實(shí)不存在了」,畢竟現(xiàn)實(shí)中的杠精依舊在。
02
Sora當(dāng)然沒(méi)有免于質(zhì)疑的豁免權(quán)。
Sora引爆科技圈后,滿屏盛贊的同時(shí)就有許多質(zhì)疑聲冒出來(lái)。
點(diǎn)贊的人很多。
馬斯克在X平臺(tái)(原推特)上感慨:「GG Humans」「被人工智能增強(qiáng)的人類,將會(huì)在未來(lái)幾年之內(nèi)創(chuàng)作出最杰出的作品!怪笥植粺o(wú)遺憾地透露:特斯拉早在1年前就掌握了類似OpenAI的視頻生成技術(shù),它的真實(shí)世界模擬和視頻生成是全世界最好的,奈何受限于算力不足。
▲馬斯克在X平臺(tái)上感慨:被人工智能增強(qiáng)的人類,將會(huì)在未來(lái)幾年之內(nèi)創(chuàng)作出最杰出的作品。
在OpenAI推出Sora的當(dāng)天(2月16日)宣布Stable Video Diffusion更新1.1版本后又刪除動(dòng)態(tài)的AI視頻生成初創(chuàng)公司Stability AI CEO埃馬德·莫斯塔克在X平臺(tái)上感嘆:「奧特曼(OpenAI創(chuàng)始人兼CEO)真是個(gè)魔術(shù)師」,并稱Sora可以被視為AI視頻的GPT-3。
Runway的CEO克里斯托瓦爾在X平臺(tái)上發(fā)了句「Game On(比賽開(kāi)始了)」。
Pika創(chuàng)始人郭文景表示:「我們覺(jué)得這是個(gè)很振奮人心的消息,我們已經(jīng)在籌備,將直接對(duì)標(biāo)Sora!
英偉達(dá)高級(jí)研究科學(xué)家兼人工智能代理負(fù)責(zé)人Jim Fan認(rèn)為,Sora代表了文本生成視頻的 GPT-3 時(shí)刻。他斷言,「Sora 是個(gè)數(shù)據(jù)驅(qū)動(dòng)的物理引擎……是個(gè)可學(xué)習(xí)的模擬器或世界模型」。
▲英偉達(dá)高級(jí)研究科學(xué)家Jim Fan認(rèn)為,Sora是個(gè)世界模型。
被譽(yù)為「最懂DiT架構(gòu)科學(xué)家」的謝賽寧說(shuō):Sora將改寫(xiě)整個(gè)視頻生成領(lǐng)域。
360集團(tuán)創(chuàng)始人周鴻祎更是據(jù)此預(yù)言,「AGI實(shí)現(xiàn)將從10年縮短到1年」。
質(zhì)疑者也不乏其人。
Open AI自稱Sora是「世界模擬器」,可很多大神級(jí)科學(xué)家不答應(yīng)。
圖靈獎(jiǎng)得主、Facebook首席AI科學(xué)家楊立昆(Yann LeCun)怒斥,Sora不能理解物理世界。他還順勢(shì)安利了Meta前幾天推出的AI視頻模型 V-JEPA聯(lián)合嵌入預(yù)測(cè)架構(gòu)的優(yōu)越性。
▲楊立昆認(rèn)為,Sora并不能理解物理世界。
前谷歌、Facebook技術(shù)主管Hongcheng也表示:「AI模型不大可能通過(guò)被動(dòng)看訓(xùn)練數(shù)據(jù)視頻,就能掌握物理定律!寡韵轮,再聰明的智能體,也不大可能通過(guò)看太陽(yáng)東升西落的視頻,就能悟出地球圍著太陽(yáng)轉(zhuǎn)。
谷歌AI研究員、Keras之父弗朗索瓦·肖萊分析,從Sora生成的部分視頻看,它是依賴于數(shù)據(jù)插值和潛空間拼貼來(lái)生成圖像,而不是真實(shí)的物理模擬。
在他看來(lái),通過(guò)機(jī)器學(xué)習(xí)模型擬合大量數(shù)據(jù)點(diǎn)后形成的高維曲線(大曲線)在預(yù)測(cè)物理世界方面是存在局限的,因?yàn)楝F(xiàn)實(shí)世界的復(fù)雜性和多樣性不是AI模型能夠通過(guò)有限數(shù)據(jù)就全部學(xué)習(xí)到的。
圍繞Sora到底是不是物理引擎、世界模型的爭(zhēng)論,估計(jì)一時(shí)半會(huì)無(wú)法止息。
03
Sora免不了被質(zhì)疑,但質(zhì)疑跟質(zhì)疑也有區(qū)別。
人家爭(zhēng)論火箭推進(jìn)器燃料用C2H4、N2H4、高級(jí)硼硅烷哪個(gè)好,終歸是科學(xué)范疇的討論,你在旁邊嚷著「得燒柴,最好是燒煤,煤還得精選,水洗煤不行」,就多少有些民科了。
目前看,網(wǎng)上已經(jīng)冒出了很多大聰明,就在用「精選煤思維」看Sora。
秉持「蒸汽機(jī)不就是個(gè)活塞嗎」的簡(jiǎn)化邏輯,他們一眼看穿了Sora的「本質(zhì)」:不就是大力出奇跡嗎?
還有人順帶著拋出一張圖——「Web3.0,顛覆了時(shí)代;Houseclub,顛覆了時(shí)代;GoogleGlass,顛覆了時(shí)代;元宇宙,顛覆了時(shí)代……回頭一看,時(shí)代還是原樣」,硬生生將Sora問(wèn)世的意義拉低到「造詞游戲」的維度。
左一個(gè)「純屬?gòu)仡^徹尾的炒作」,又一個(gè)「一驚一乍沒(méi)出息」,他們就差來(lái)上一句「不過(guò)是奇技淫巧爾」了。
▲由Sora生成的「賽博朋克背景下機(jī)器人的生活故事」。
Sora的驚艷場(chǎng)面,他們選擇性無(wú)視;Sora的翻車畫(huà)面,他們拿著放大鏡看。
也不奇怪:用前現(xiàn)代思維理解現(xiàn)代技術(shù)的人,是難有從明天看今天的「明天觀」的,你跟他們說(shuō)Sora可以像ChatGPT向GPT-4非線性跨越那樣快速進(jìn)化,形同于雞同鴨講。
通用人工智能時(shí)代的大門都已經(jīng)叩開(kāi)了,他們卻站在門外不入,還哼著「全都是泡沫,只一剎的花火」。
跟他們說(shuō)「中美科技差距又……」,更是碰到了他們的逆鱗。
事實(shí)上,在Sora問(wèn)世后,「大國(guó)科技差距」的問(wèn)題總是無(wú)法回避。
在ChatGPT引爆大模型軍備競(jìng)賽后,中國(guó)出現(xiàn)了百模大戰(zhàn),不少國(guó)內(nèi)大模型廠商都聲稱多項(xiàng)能力已經(jīng)趕超ChatGPT。但OpenAI掏出「秘密武器」Sora,又讓許多人認(rèn)清了現(xiàn)實(shí)。
周鴻祎就分析,中美間的AI差距還在擴(kuò)大。
也有人認(rèn)為,差距有是有,但沒(méi)那么大。
如昆侖萬(wàn)維CEO方漢就認(rèn)為,「國(guó)內(nèi)廠商和國(guó)外廠商在文生視頻的差距,不像大模型領(lǐng)域的差距那么大。」從技術(shù)上看,Sora領(lǐng)先國(guó)內(nèi)同行大概半年。
▲Sora跟其他多個(gè)視頻模型的區(qū)別。
差距是大是小,固然言人人殊,但首先得正視差距的存在。
現(xiàn)在的問(wèn)題是,有些人習(xí)慣了錯(cuò)把「順差」當(dāng)「逆差」的思維意識(shí)中,對(duì)自媒體三天兩頭渲染的「光刻機(jī)大突破!」深信不疑,對(duì)「領(lǐng)跑-跟跑」角色錨定的差距卻視而不見(jiàn)。
華大基因CEO尹燁這兩天就撰文說(shuō):
如果把人類已經(jīng)存在的語(yǔ)言、圖像、音頻、視頻等這些資料庫(kù)看成是人類文明的金礦,但是你已經(jīng)有挖掘機(jī)了,我卻被限制只能用鐵鍬,長(zhǎng)此以往會(huì)是什么樣的結(jié)果?
我們?cè)谛酒膯?wèn)題上,可能犯了刻舟求劍的錯(cuò)誤。比如總有一種聲音,認(rèn)為我們能夠突破14納米,甚至認(rèn)為如果我們能追趕到7納米,我們就會(huì)贏,但這個(gè)前提是我們的競(jìng)爭(zhēng)對(duì)手就不進(jìn)步了,就在原地等著。我并不是說(shuō),你追趕到14納米、7納米不重要,而是你要明白,競(jìng)爭(zhēng)對(duì)手會(huì)在同樣的時(shí)間,實(shí)現(xiàn)3納米、2納米,甚至1納米。
我們可以在戰(zhàn)略上藐視,但不能不在戰(zhàn)術(shù)上重視……當(dāng)下?lián)煌耆y(tǒng)計(jì),國(guó)內(nèi)號(hào)稱有大模型的公司,已經(jīng)有300多家,相信大部分還是「多小散亂」,面對(duì)GPT在簡(jiǎn)體中文的世界里,似乎尚能一戰(zhàn),但面對(duì)Sora的橫空出世,可有一個(gè)能打的,甚至是接近的嗎?
說(shuō)到底,縮短差距的前提,永遠(yuǎn)是正視差距。
04
胡錫進(jìn)之所以駁斥那些對(duì)準(zhǔn)Sora的「奇技淫巧論」,究其原因大概就在于,諸如此類的頗具誤導(dǎo)性。
把ChatGPT或Sora的深遠(yuǎn)影響降維,以維持「科技趕超」想象,只會(huì)是自我麻痹。到頭來(lái),面對(duì)技術(shù)革命輕易轉(zhuǎn)過(guò)身去,沒(méi)準(zhǔn)是跟正在到來(lái)的AI時(shí)代擦肩而過(guò)。
要知道,AI時(shí)代的技術(shù)演化不是匍匐向前的,而是跳躍式的——經(jīng)常從一個(gè)斷層躍上另一個(gè)斷層。
眼下我們就已進(jìn)入科技發(fā)展的「最后7分鐘(施拉姆語(yǔ))」時(shí)刻。越是這時(shí)候,我們?cè)讲荒芨恪革B內(nèi)閉關(guān)」。
就在過(guò)去1個(gè)月,全球科技圈發(fā)生了很多事:
1,英偉達(dá)(Nvidia)前不久發(fā)布了在本地運(yùn)行的名為「Chat with RTX」的Demo版?zhèn)性化AI聊天機(jī)器人。高性能AI處理器的加持,會(huì)加速AI+N類終端浪潮的到來(lái)。
2,2月16日,谷歌發(fā)布Gemini1.5,上下文窗口長(zhǎng)度擴(kuò)展到100萬(wàn)個(gè)tokens(GPT4-turbe12.8萬(wàn)tokens),是目前最大的上下文窗口。這其中,Gemini1.5pro能一次處理1小時(shí)的視頻、11小時(shí)音頻、超3萬(wàn)行的代碼庫(kù)、超70萬(wàn)字的代碼庫(kù)。說(shuō)出來(lái)的是「最大」,沒(méi)說(shuō)出來(lái)的是「完爆GPT-4」。
3,2月17日,Meta推出了名為「V-JEPA」的視頻預(yù)測(cè)模型。在此之前,Meta還推出了AI視頻模型Fairy?吹贸鰜(lái),楊立昆對(duì)Sora100個(gè)不服。
4,差不多1個(gè)月前,奧特曼的7萬(wàn)億美元造芯計(jì)劃被曝出,旨在對(duì)標(biāo)英偉達(dá)。從算力集群到芯片制造,奧特曼下了一盤很大的棋。
5,春節(jié)前,阿里巴巴發(fā)布了通義千問(wèn)大模型Qwen-1.5版本,涵蓋了6個(gè)不同參數(shù)規(guī)模的型號(hào)。節(jié)后伊始,OPPO、魅族都宣布,停止傳統(tǒng)智能手機(jī)研發(fā),資源向AI手機(jī)集中。
毫無(wú)疑問(wèn),Sora的出現(xiàn),也是大時(shí)代的注腳。
▲Sora根據(jù)Prompt提示生成的紙工藝品的海洋世界。
在此語(yǔ)境中,我們對(duì)Sora價(jià)值的認(rèn)知鏡框,該是AI時(shí)代的背景框,而不是預(yù)設(shè)立場(chǎng)的思維框架。
2月19日,「天才少年」謝賽寧在朋友圈辟謠「謝賽寧是Sora發(fā)明者」之余,就拋出了一個(gè)問(wèn)題:(大家)在問(wèn)Sora為什么沒(méi)出現(xiàn)在中國(guó)的同時(shí),可能也得問(wèn)問(wèn),假設(shè)真的出現(xiàn)了(可能很快),我們有沒(méi)有準(zhǔn)備好?
目前看,答案一目了然:很多人都沒(méi)做好準(zhǔn)備。
「沒(méi)做好準(zhǔn)備」體現(xiàn)在很多方面。
比如,在硅碳融合的重要關(guān)口,在浪潮已來(lái)的關(guān)鍵節(jié)點(diǎn),有些人依舊是拿著前現(xiàn)代的眼光看現(xiàn)代技術(shù)變革,依然是用狹隘思維看技術(shù)浪潮。
又如,AI產(chǎn)業(yè)發(fā)展需要依托于創(chuàng)新友好型生態(tài)和氛圍。拿AI視頻模型來(lái)說(shuō),它要拼工程化調(diào)參能力、拼算力,更要拼創(chuàng)新生態(tài)與創(chuàng)新土壤。唯有寬松包容的環(huán)境,才能更好地激發(fā)企業(yè)與人才創(chuàng)新的強(qiáng)勁活力、創(chuàng)造的內(nèi)生動(dòng)力。揆諸現(xiàn)實(shí),如果說(shuō),缺芯是外部掣肘,那擺在企業(yè)面前的內(nèi)部掣肘也不少。
科技觀察者王兆洋就假設(shè):OpenAI不是transformer模型發(fā)明者,Stable Video不是diffusion模型發(fā)明者,如果它們誕生在中國(guó),會(huì)不會(huì)也躲不過(guò)被罵「套殼」的命運(yùn)?看到這,雷軍興許會(huì)濕了眼眶。
厄休拉·M. 富蘭克林在《技術(shù)的真相》里說(shuō):「技術(shù)的發(fā)展和運(yùn)用從一個(gè)社會(huì)結(jié)構(gòu)中產(chǎn)生,然后被嫁接在這個(gè)結(jié)構(gòu)之上!
她認(rèn)為,「尺寸是生長(zhǎng)的自然結(jié)果,但生長(zhǎng)本身是不能被強(qiáng)取的,它只能通過(guò)提供一種適宜的環(huán)境而得到培育和鼓勵(lì)。生長(zhǎng)是發(fā)生性的,不是制造出來(lái)的!
某種程度上,「我們?yōu)镾ora的到來(lái)準(zhǔn)備好了嗎」的孿生命題是:我們?yōu)椤窼ora」的培育提供了適宜的社會(huì)結(jié)構(gòu)了嗎?
05
Sora沒(méi)有說(shuō)自己「遙遙領(lǐng)先」,但毋庸諱言,就眼下看,它配得上一句「遙遙領(lǐng)先」。
而彌補(bǔ)跟先行者的差距,靠的自然不是「人家OpenAI的Sora一路狂飆,我們199元的Sora名(割)師(韭菜)課鋪天蓋地」,而是做真正該做的事。
在Sora問(wèn)世后,有人寫(xiě)道:這意味著,未來(lái)的美國(guó)將更加美國(guó),未來(lái)的中國(guó)將更加中國(guó)。
這句話的指向有很多,但最不該有的一個(gè),是「差距Bigger Than Bigger」。
*頭圖為Sora生成的多個(gè)視頻的動(dòng)圖集錦。
?作者 | 佘宗明
?運(yùn)營(yíng) | 李玩
原文標(biāo)題 : Sora配得上一句「遙遙領(lǐng)先」嗎?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專題
- 1 【一周車話】沒(méi)有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋(píng)果偉大100倍!真正改寫(xiě)人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開(kāi)啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市