訂閱
糾錯(cuò)
加入自媒體

SORA放大招?讓馬斯克認(rèn)輸?shù)腁I到底有多猛?

回顧剛剛過去的2023年,如果要問什么東西最火的話,大模型肯定是其中最靚的仔,就在最近用GPT引爆全球大模型賽道的OPEN AI再度給市場(chǎng)一記重拳,甚至連馬斯克都不得不愿賭服輸,這就是全新的視頻生成大模型,這個(gè)全新的大模型到底有多猛?我們?cè)撊绾慰创@件事?

一、視頻生成大模型再放大招?

據(jù)每日經(jīng)濟(jì)新聞的報(bào)道,據(jù)OpenAI官網(wǎng),OpenAI首個(gè)視頻生成模型Sora發(fā)布,完美繼承DALL·E 3的畫質(zhì)和遵循指令能力,能生成長(zhǎng)達(dá)1分鐘的高清視頻。

AI想象中的龍年春節(jié),紅旗招展人山人海。有緊跟舞龍隊(duì)伍抬頭好奇觀望的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各有各的行為。一位時(shí)髦女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動(dòng)感的城市標(biāo)志。

一名年約三十的宇航員戴著紅色針織摩托頭盔展開冒險(xiǎn)之旅,電影預(yù)告片呈現(xiàn)其穿梭于藍(lán)天白云與鹽湖沙漠之間的精彩瞬間,獨(dú)特的電影風(fēng)格、采用35毫米膠片拍攝,色彩鮮艷。

OpenAI表示,公司正在教授人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練出能夠幫助人們解決需要與現(xiàn)實(shí)世界互動(dòng)的問題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長(zhǎng)達(dá)一分鐘的視頻,同時(shí)保證視覺質(zhì)量和符合用戶提示的要求。

Sora模型能夠生成包含多個(gè)角色、特定類型運(yùn)動(dòng)和主體及背景精確細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅能理解用戶在提示中所要求的內(nèi)容,還能理解這些事物在現(xiàn)實(shí)世界中的存在方式。

對(duì)于這款全新的產(chǎn)品,世界知名企業(yè)家馬斯克也不吝贊美之詞,馬斯克回應(yīng)稱:“gg人類(gg humans)。”據(jù)媒體引申,gg是網(wǎng)絡(luò)游戲用語“goodgames”的縮寫,主要用于游戲結(jié)束后,輸贏雙方都可以用。但現(xiàn)在多由失敗方發(fā)出,表示認(rèn)賭服輸、心服口服的意思。在馬斯克帖子的評(píng)論區(qū)里,還有用戶附和道:“gg好萊塢”。

360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎在微博發(fā)文談文生視頻模型Sora。周鴻祎認(rèn)為,Sora意味著AGI實(shí)現(xiàn)將從10年縮短到1年。他分析說,OpenAI訓(xùn)練這個(gè)模型應(yīng)該會(huì)閱讀大量視頻,大模型加上Diffusion技術(shù)需要對(duì)這個(gè)世界進(jìn)行進(jìn)一步了解,學(xué)習(xí)樣本就會(huì)以視頻和攝像頭捕捉到的畫面為主。一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對(duì)世界的理解將遠(yuǎn)遠(yuǎn)超過文字學(xué)習(xí),一幅圖勝過千言萬語,而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過一幅圖,這就離AGI真的就不遠(yuǎn)了,不是10年20年的問題,可能一兩年很快就可以實(shí)現(xiàn)。

二、Sora到底有多猛?

隨著科技的飛速發(fā)展,人工智能(AI)已經(jīng)成為了當(dāng)今世界最為熱門的話題之一。其中,OpenAI的ChatGPT和Sora等模型的出現(xiàn),更是顛覆了我們的認(rèn)知,Sora的出現(xiàn)到底意味著什么?當(dāng)馬斯克都要認(rèn)輸?shù)臅r(shí)候我們到底該怎么看?

首先,Sora的出現(xiàn)無疑是另一大里程碑。ChatGPT作為OpenAI研發(fā)的里程碑式語言模型,其強(qiáng)大的自然語言處理能力和對(duì)上下文理解的深度,在推出后迅速引發(fā)了全球范圍內(nèi)的廣泛關(guān)注和熱議。ChatGPT不僅能夠流暢對(duì)話、解答問題,還能生成具有邏輯性和創(chuàng)造性的文本內(nèi)容,這一突破性進(jìn)展讓人們看到了人工智能在認(rèn)知智能領(lǐng)域取得的重大飛躍。

緊隨ChatGPT之后,OpenAI又推出了視頻生成模型Sora,該模型更是將AI技術(shù)推到了一個(gè)全新的視覺維度。Sora憑借其創(chuàng)新的文本到視頻轉(zhuǎn)換能力,使得AI從理解和生成文本躍升至創(chuàng)作高清視頻內(nèi)容的新高度。通過理解用戶輸入的文字描述,Sora可以自動(dòng)生成包括復(fù)雜場(chǎng)景、多角色動(dòng)態(tài)交互在內(nèi)的長(zhǎng)達(dá)一分鐘的流暢高清視頻,這標(biāo)志著OpenAI在跨模態(tài)學(xué)習(xí)與生成方面取得了重大突破。

其次,Sora的最大突破還是在于理解人類語言并且通感成為視頻。Sora模型的核心優(yōu)勢(shì)體現(xiàn)在它能夠理解人類語言輸入,并基于這種理解進(jìn)行視頻內(nèi)容的創(chuàng)造性生成。通過深度學(xué)習(xí)和跨模態(tài)技術(shù),Sora能夠?qū)⑽谋久枋鲋械某橄蟾拍睢⑶榫、甚至是情感色彩映射到視覺表達(dá)上,生成與描述相匹配且具有一定連貫性的視頻片段。

盡管目前生成的視頻可能在細(xì)節(jié)處理、物理真實(shí)感或者復(fù)雜交互場(chǎng)景等方面還存在不完善之處,但其突破性在于首次實(shí)現(xiàn)了從文本到高質(zhì)量視頻內(nèi)容的有效轉(zhuǎn)化,這為內(nèi)容創(chuàng)作者提供了一種全新的工具,大大提升了創(chuàng)意表達(dá)的效率和可能性。此外,Sora的應(yīng)用價(jià)值也體現(xiàn)在教育、娛樂、廣告設(shè)計(jì)等眾多領(lǐng)域中,它有可能重塑這些行業(yè)的生產(chǎn)方式,并為未來更加智能化的內(nèi)容創(chuàng)作打下堅(jiān)實(shí)基礎(chǔ)。

第三,視頻的變革可能遠(yuǎn)超過文字的變革,而且速度會(huì)更快。在當(dāng)前的互聯(lián)網(wǎng)時(shí)代,視頻已經(jīng)成為人們獲取信息、娛樂休閑的主要方式之一。每天都有大量的視頻內(nèi)容被上傳到網(wǎng)絡(luò)上,涵蓋了新聞、教育、娛樂、廣告等各個(gè)領(lǐng)域。這些豐富的視頻資源為大模型的學(xué)習(xí)提供了寶貴的素材。

通過對(duì)這些視頻進(jìn)行深度學(xué)習(xí)和分析,大模型可以不斷地提取和總結(jié)視頻中的視覺元素、場(chǎng)景轉(zhuǎn)換、敘事結(jié)構(gòu)等規(guī)律,從而提高自身的生成能力。同時(shí),大模型還可以利用這些視頻資源進(jìn)行自我迭代和優(yōu)化,不斷提升自身的性能和效率。

隨著Sora等大模型的快速普及和應(yīng)用,我們可以預(yù)見一場(chǎng)行業(yè)變革正在醞釀之中。對(duì)于內(nèi)容創(chuàng)作者來說,大模型將極大地提高他們的創(chuàng)作效率和質(zhì)量,降低創(chuàng)作成本。他們只需輸入簡(jiǎn)短的文字描述或創(chuàng)意想法,就可以快速生成符合要求的視頻內(nèi)容,大大節(jié)省了時(shí)間和精力。

對(duì)于廣告公司、影視制作公司等企業(yè)來說,大模型將為他們帶來更多的商業(yè)機(jī)會(huì)和創(chuàng)新空間。他們可以利用大模型快速生成廣告宣傳片、宣傳片等視頻內(nèi)容,提高品牌曝光度和用戶黏性。同時(shí),大模型還可以幫助他們實(shí)現(xiàn)個(gè)性化定制服務(wù),滿足客戶的個(gè)性化需求。

第四,人類到底該怎么辦?隨著人工智能技術(shù)的不斷發(fā)展和普及,嚴(yán)防死守來防止其應(yīng)用已經(jīng)變得不再現(xiàn)實(shí)。從長(zhǎng)遠(yuǎn)來看,更好的策略是積極地去理解和利用人工智能,而不是試圖阻止它的發(fā)展。

一方面,人工智能在很多領(lǐng)域已經(jīng)展現(xiàn)出了巨大的潛力和價(jià)值。例如,在醫(yī)療領(lǐng)域,人工智能可以幫助醫(yī)生進(jìn)行疾病診斷和治療方案制定;在交通領(lǐng)域,人工智能可以提高交通流量和安全性;在金融領(lǐng)域,人工智能可以幫助進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策等。因此,通過積極利用人工智能,人類可以創(chuàng)造更多的價(jià)值,提高生活質(zhì)量。

另一方面,理解和利用人工智能也需要人類不斷地進(jìn)行探索和創(chuàng)新。隨著人工智能技術(shù)的不斷發(fā)展,新的應(yīng)用場(chǎng)景和商業(yè)模式也將不斷涌現(xiàn)。通過不斷學(xué)習(xí)和實(shí)踐,人類可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)、經(jīng)濟(jì)、文化等各個(gè)領(lǐng)域的深度融合。

因此,與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過不斷學(xué)習(xí)和創(chuàng)新,人類可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)各個(gè)領(lǐng)域的深度融合,這樣才是人工智能時(shí)代真正的生存之道。

       原文標(biāo)題 : SORA放大招?讓馬斯克認(rèn)輸?shù)腁I到底有多猛?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)