SORA放大招?讓馬斯克認(rèn)輸?shù)腁I到底有多猛?
回顧剛剛過去的2023年,如果要問什么東西最火的話,大模型肯定是其中最靚的仔,就在最近用GPT引爆全球大模型賽道的OPEN AI再度給市場(chǎng)一記重拳,甚至連馬斯克都不得不愿賭服輸,這就是全新的視頻生成大模型,這個(gè)全新的大模型到底有多猛?我們?cè)撊绾慰创@件事?
一、視頻生成大模型再放大招?
據(jù)每日經(jīng)濟(jì)新聞的報(bào)道,據(jù)OpenAI官網(wǎng),OpenAI首個(gè)視頻生成模型Sora發(fā)布,完美繼承DALL·E 3的畫質(zhì)和遵循指令能力,能生成長(zhǎng)達(dá)1分鐘的高清視頻。
AI想象中的龍年春節(jié),紅旗招展人山人海。有緊跟舞龍隊(duì)伍抬頭好奇觀望的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各有各的行為。一位時(shí)髦女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動(dòng)感的城市標(biāo)志。
一名年約三十的宇航員戴著紅色針織摩托頭盔展開冒險(xiǎn)之旅,電影預(yù)告片呈現(xiàn)其穿梭于藍(lán)天白云與鹽湖沙漠之間的精彩瞬間,獨(dú)特的電影風(fēng)格、采用35毫米膠片拍攝,色彩鮮艷。
OpenAI表示,公司正在教授人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練出能夠幫助人們解決需要與現(xiàn)實(shí)世界互動(dòng)的問題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長(zhǎng)達(dá)一分鐘的視頻,同時(shí)保證視覺質(zhì)量和符合用戶提示的要求。
Sora模型能夠生成包含多個(gè)角色、特定類型運(yùn)動(dòng)和主體及背景精確細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅能理解用戶在提示中所要求的內(nèi)容,還能理解這些事物在現(xiàn)實(shí)世界中的存在方式。
對(duì)于這款全新的產(chǎn)品,世界知名企業(yè)家馬斯克也不吝贊美之詞,馬斯克回應(yīng)稱:“gg人類(gg humans)。”據(jù)媒體引申,gg是網(wǎng)絡(luò)游戲用語“goodgames”的縮寫,主要用于游戲結(jié)束后,輸贏雙方都可以用。但現(xiàn)在多由失敗方發(fā)出,表示認(rèn)賭服輸、心服口服的意思。在馬斯克帖子的評(píng)論區(qū)里,還有用戶附和道:“gg好萊塢”。
360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎在微博發(fā)文談文生視頻模型Sora。周鴻祎認(rèn)為,Sora意味著AGI實(shí)現(xiàn)將從10年縮短到1年。他分析說,OpenAI訓(xùn)練這個(gè)模型應(yīng)該會(huì)閱讀大量視頻,大模型加上Diffusion技術(shù)需要對(duì)這個(gè)世界進(jìn)行進(jìn)一步了解,學(xué)習(xí)樣本就會(huì)以視頻和攝像頭捕捉到的畫面為主。一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對(duì)世界的理解將遠(yuǎn)遠(yuǎn)超過文字學(xué)習(xí),一幅圖勝過千言萬語,而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過一幅圖,這就離AGI真的就不遠(yuǎn)了,不是10年20年的問題,可能一兩年很快就可以實(shí)現(xiàn)。
二、Sora到底有多猛?
隨著科技的飛速發(fā)展,人工智能(AI)已經(jīng)成為了當(dāng)今世界最為熱門的話題之一。其中,OpenAI的ChatGPT和Sora等模型的出現(xiàn),更是顛覆了我們的認(rèn)知,Sora的出現(xiàn)到底意味著什么?當(dāng)馬斯克都要認(rèn)輸?shù)臅r(shí)候我們到底該怎么看?
首先,Sora的出現(xiàn)無疑是另一大里程碑。ChatGPT作為OpenAI研發(fā)的里程碑式語言模型,其強(qiáng)大的自然語言處理能力和對(duì)上下文理解的深度,在推出后迅速引發(fā)了全球范圍內(nèi)的廣泛關(guān)注和熱議。ChatGPT不僅能夠流暢對(duì)話、解答問題,還能生成具有邏輯性和創(chuàng)造性的文本內(nèi)容,這一突破性進(jìn)展讓人們看到了人工智能在認(rèn)知智能領(lǐng)域取得的重大飛躍。
緊隨ChatGPT之后,OpenAI又推出了視頻生成模型Sora,該模型更是將AI技術(shù)推到了一個(gè)全新的視覺維度。Sora憑借其創(chuàng)新的文本到視頻轉(zhuǎn)換能力,使得AI從理解和生成文本躍升至創(chuàng)作高清視頻內(nèi)容的新高度。通過理解用戶輸入的文字描述,Sora可以自動(dòng)生成包括復(fù)雜場(chǎng)景、多角色動(dòng)態(tài)交互在內(nèi)的長(zhǎng)達(dá)一分鐘的流暢高清視頻,這標(biāo)志著OpenAI在跨模態(tài)學(xué)習(xí)與生成方面取得了重大突破。
其次,Sora的最大突破還是在于理解人類語言并且通感成為視頻。Sora模型的核心優(yōu)勢(shì)體現(xiàn)在它能夠理解人類語言輸入,并基于這種理解進(jìn)行視頻內(nèi)容的創(chuàng)造性生成。通過深度學(xué)習(xí)和跨模態(tài)技術(shù),Sora能夠?qū)⑽谋久枋鲋械某橄蟾拍睢⑶榫、甚至是情感色彩映射到視覺表達(dá)上,生成與描述相匹配且具有一定連貫性的視頻片段。
盡管目前生成的視頻可能在細(xì)節(jié)處理、物理真實(shí)感或者復(fù)雜交互場(chǎng)景等方面還存在不完善之處,但其突破性在于首次實(shí)現(xiàn)了從文本到高質(zhì)量視頻內(nèi)容的有效轉(zhuǎn)化,這為內(nèi)容創(chuàng)作者提供了一種全新的工具,大大提升了創(chuàng)意表達(dá)的效率和可能性。此外,Sora的應(yīng)用價(jià)值也體現(xiàn)在教育、娛樂、廣告設(shè)計(jì)等眾多領(lǐng)域中,它有可能重塑這些行業(yè)的生產(chǎn)方式,并為未來更加智能化的內(nèi)容創(chuàng)作打下堅(jiān)實(shí)基礎(chǔ)。
第三,視頻的變革可能遠(yuǎn)超過文字的變革,而且速度會(huì)更快。在當(dāng)前的互聯(lián)網(wǎng)時(shí)代,視頻已經(jīng)成為人們獲取信息、娛樂休閑的主要方式之一。每天都有大量的視頻內(nèi)容被上傳到網(wǎng)絡(luò)上,涵蓋了新聞、教育、娛樂、廣告等各個(gè)領(lǐng)域。這些豐富的視頻資源為大模型的學(xué)習(xí)提供了寶貴的素材。
通過對(duì)這些視頻進(jìn)行深度學(xué)習(xí)和分析,大模型可以不斷地提取和總結(jié)視頻中的視覺元素、場(chǎng)景轉(zhuǎn)換、敘事結(jié)構(gòu)等規(guī)律,從而提高自身的生成能力。同時(shí),大模型還可以利用這些視頻資源進(jìn)行自我迭代和優(yōu)化,不斷提升自身的性能和效率。
隨著Sora等大模型的快速普及和應(yīng)用,我們可以預(yù)見一場(chǎng)行業(yè)變革正在醞釀之中。對(duì)于內(nèi)容創(chuàng)作者來說,大模型將極大地提高他們的創(chuàng)作效率和質(zhì)量,降低創(chuàng)作成本。他們只需輸入簡(jiǎn)短的文字描述或創(chuàng)意想法,就可以快速生成符合要求的視頻內(nèi)容,大大節(jié)省了時(shí)間和精力。
對(duì)于廣告公司、影視制作公司等企業(yè)來說,大模型將為他們帶來更多的商業(yè)機(jī)會(huì)和創(chuàng)新空間。他們可以利用大模型快速生成廣告宣傳片、宣傳片等視頻內(nèi)容,提高品牌曝光度和用戶黏性。同時(shí),大模型還可以幫助他們實(shí)現(xiàn)個(gè)性化定制服務(wù),滿足客戶的個(gè)性化需求。
第四,人類到底該怎么辦?隨著人工智能技術(shù)的不斷發(fā)展和普及,嚴(yán)防死守來防止其應(yīng)用已經(jīng)變得不再現(xiàn)實(shí)。從長(zhǎng)遠(yuǎn)來看,更好的策略是積極地去理解和利用人工智能,而不是試圖阻止它的發(fā)展。
一方面,人工智能在很多領(lǐng)域已經(jīng)展現(xiàn)出了巨大的潛力和價(jià)值。例如,在醫(yī)療領(lǐng)域,人工智能可以幫助醫(yī)生進(jìn)行疾病診斷和治療方案制定;在交通領(lǐng)域,人工智能可以提高交通流量和安全性;在金融領(lǐng)域,人工智能可以幫助進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策等。因此,通過積極利用人工智能,人類可以創(chuàng)造更多的價(jià)值,提高生活質(zhì)量。
另一方面,理解和利用人工智能也需要人類不斷地進(jìn)行探索和創(chuàng)新。隨著人工智能技術(shù)的不斷發(fā)展,新的應(yīng)用場(chǎng)景和商業(yè)模式也將不斷涌現(xiàn)。通過不斷學(xué)習(xí)和實(shí)踐,人類可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)、經(jīng)濟(jì)、文化等各個(gè)領(lǐng)域的深度融合。
因此,與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過不斷學(xué)習(xí)和創(chuàng)新,人類可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)各個(gè)領(lǐng)域的深度融合,這樣才是人工智能時(shí)代真正的生存之道。
原文標(biāo)題 : SORA放大招?讓馬斯克認(rèn)輸?shù)腁I到底有多猛?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無人駕駛車,還未迎來“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬億獨(dú)角獸,AI人才之爭(zhēng)開啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市