訂閱
糾錯
加入自媒體

OpenAI首個AI視頻模型Sora的顛覆與爭議

【編輯推薦】有人說,這是影響影視行業(yè)和未來技術(shù)發(fā)展的又一顛覆性事件?,也難怪大家驚呼“現(xiàn)實,不存在了!”不過,Sora和文生圖一樣,普遍存在生成內(nèi)容不夠精確,所以離真正顛覆影視行業(yè)還有很大一段距離。可以肯定的是,這些新的工具和產(chǎn)品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來,未來誰能快速掌握這些AI工具和技術(shù)的使用,誰才是真正的掌控者。

太炸裂了!2月16日凌晨,OpenAI在社交平臺X上宣布,正在開發(fā)一款名為Sora的新模型。

Sora可以做什么?它的主要功能是把文本描述轉(zhuǎn)化為視頻,它能夠理解并執(zhí)行詳細(xì)的文本指令,從而生成具有視覺質(zhì)量和連貫性的視頻。這些視頻可以包含多個角色、動作和場景,還可以根據(jù)提示的主題和背景,精準(zhǔn)生成影片內(nèi)容,呈現(xiàn)復(fù)雜的攝影機運鏡,影片長度最多為60秒。除了根據(jù)文字產(chǎn)生影片外,它還能夠從靜態(tài)圖像生成動畫,或擴展現(xiàn)有視頻。

雖然,目前它尚未對大眾開放使用,不過消息一出,它已經(jīng)在網(wǎng)絡(luò)上引發(fā)討論,很多人表示大為震撼。

來看一組展示,一位時尚女性走在霓虹閃爍的東京街頭;一位20多歲的年輕人正在一片云上讀書,中國龍慶祝中國新年……其實它的獨特之處在于,它不再是一種創(chuàng)造性工具,更像是一個“數(shù)據(jù)驅(qū)動的物理引擎”。它不僅了解用戶在提示中提出的要求,然后根據(jù)你的需求生成圖像,還能確定環(huán)境中對象的物理特性,并根據(jù)這些計算渲染視頻。

有人說,這是影響影視行業(yè)和未來技術(shù)發(fā)展的又一顛覆性事件?。也難怪大家驚呼,現(xiàn)實,不存在了!

而這些能夠?qū)崿F(xiàn)背后依靠的是擴散模型,這意味著Sora會從模糊充滿靜態(tài)的視頻開始生成,然后再慢慢將其平滑處理成你看到的精美版本。

我們知道之前發(fā)布的Midjourney和Stable Diffusio也是擴散模型,但不得不說,Sora制作的視頻比它們更長、更有活力、也更流暢。

Sora感覺像是創(chuàng)建了一個真實的視頻,而Midjourney和Stable Diffusio模型感覺像是人工智能圖像的定格動畫。不過Sora目前還是一個未完成的產(chǎn)品,它可能難以消化復(fù)雜的物理或空間細(xì)節(jié),進(jìn)而導(dǎo)致它生成不合邏輯的影片,比如人類在跑步機上跑錯方向、比如可能會生成一個人咬餅干的視頻,但之后餅干可能沒有咬痕。并且可能會難以遵循特定的運鏡軌跡。

OpenAI表示該模型缺乏空間意識可能會混淆左右,并且不理解人或物體如何與場景交互?梢钥闯觯琒ora和文生圖一樣,普遍存在生成內(nèi)容不夠精確的問題,所以,從這個角度而言,它離真正顛覆影視行業(yè)還有很大一段距離。隨著這兩年人工智能熱潮的持續(xù)推進(jìn),相關(guān)產(chǎn)品也備受爭議。但不得不承認(rèn),這些新的工具和產(chǎn)品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來。未來誰能快速掌握這些AI工具和技術(shù),誰才是真正的掌控者。

       原文標(biāo)題 : OpenAI首個AI視頻模型Sora的顛覆與爭議

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號