訂閱
糾錯
加入自媒體

Web 3.0后下一個風口,AIGC將成未來內(nèi)容趨勢?

2022-11-23 10:25
VR陀螺
關(guān)注

文/VR陀螺 林德

AI,人工智能,從今年年初到現(xiàn)在已然成為互聯(lián)網(wǎng)最熱門、引起網(wǎng)友討論度最高的科技概念之一。

今年4月,一款名為DALL-E 2的AI繪畫模型誕生,在短短幾個月時間內(nèi)便風靡全球,成為今年最火熱的AI繪畫模型,被譽為最強AI畫手。

無論是文藝復(fù)興風格、寶麗來風格,或是愛德華·霍普畫風、莫奈畫風、數(shù)字藝術(shù),亦或是復(fù)古風、二戰(zhàn)歷史攝影風格等等,DALL-E 2都能輕松實現(xiàn),只要給出關(guān)鍵詞,大約60秒便可以產(chǎn)生10張圖像供用戶選擇。

DALL-E 2部分作品(圖源:DALL-E 2)

腦洞無限大、寫實、易操作、更準確的指令理解...各種元素的集合誕生了不少令人眼前一亮的創(chuàng)意作品,DALL-E 2的作品在社交媒體得到許多用戶的喜愛。

在DALL-E 2全網(wǎng)爆紅之前,輸入文字生成圖像,這種存在于想象中的事情成為現(xiàn)實的潮流就已經(jīng)開始流行。在今年年初,AI繪畫工具Disco Diffusion、Midjourney早已受到不少藝術(shù)家、時尚先鋒的青睞,不僅用于娛樂自嗨,商業(yè)用途中也能看見AI的身影。


在獲得羅拉多州博覽會藝術(shù)創(chuàng)作比賽活動一等獎之前,今年六月《經(jīng)濟學人》的期刊封面便是出自Midjourney之手。(圖源:《經(jīng)濟學人》)

AI繪畫平臺Midjourney在Discord上的訂閱人數(shù)也已超過百萬。


截止至9月7日,Midjourney在Discord的訂閱情況(圖源:VR陀螺)

從Disco Diffusion到MidJourney,再到DALL-E 2的全網(wǎng)流行,Text-to-Image(文字生成圖像)從小眾開發(fā)社群火到社交媒體進入大眾眼簾,AI生成圖像的創(chuàng)作方式讓海內(nèi)外的用戶驚呼AI的發(fā)展竟然到了這種程度!

輸入“骨頭山”、“宗教化”、“火焰”、“無動于衷的人們”四組關(guān)鍵詞組獲得的四張AIGC圖像(圖源:VR陀螺)

最近,AI畫畫熱度退散之后,AI寫論文又再度幫助AI破圈。事情源于一篇Reddit上的帖子,發(fā)帖人Urdadgirl69表示他的論文就是由AI代筆完成,而他的老師并沒有發(fā)現(xiàn)作業(yè)的異常情況。


圖源:游戲研究社

更具有沖擊力的是,Meta在十月初發(fā)布的文本轉(zhuǎn)視頻Make-A-Video功能,意味著AI圖像制作領(lǐng)域又有了新的突破,在圖像逼真內(nèi)容豐富的情況下,邁向了動態(tài)的視頻領(lǐng)域。


輸入“一只穿著超人紅色披風在天上飛的狗”獲得的視頻(圖源:Meta)

從“人均AI畫師”到“我讓AI幫我寫論文,不僅拿A,還能賺錢”,AI這個關(guān)鍵詞頻頻出圈。無論是AI生成圖像,還是AI生成文本,或是AI生成視頻,這些都被統(tǒng)稱為AIGC內(nèi)容生成模式。

AIGC,人工智能生成內(nèi)容,顧名思義是由人工智能驅(qū)動的工具創(chuàng)造的內(nèi)容,這種內(nèi)容生產(chǎn)模式在不僅在繪畫、寫作領(lǐng)域成為熱門趨勢,在游戲場景建模、數(shù)字人、AI聊天、科研AI for Science、AI換臉、音樂等領(lǐng)域也有所建樹,可以看到,這種模式正在成為新的主流。

AIGC當?shù),資本的“新頭好”

獲益于頻頻在大眾視野中“刷臉”,AIGC的熱度以及前景讓越來越多的資本將目光放至于此。

今年9月,紅杉資本官方發(fā)表的一篇文章《Generative AI: A Creative New World》》中認為AIGC將會代表新一輪范式轉(zhuǎn)移(認知轉(zhuǎn)移)的開始。

圖源:網(wǎng)絡(luò)

近日,依靠文字生成Instagram標題、Tiktok視頻腳本、廣告營銷文本、電子郵件等內(nèi)容,成立不到兩年時間的AIGC 初創(chuàng)公司 Jasper 宣布自身以15億美元的估值獲得 1.25億美元 A輪融資,搖身一變成為AIGC圈的新興強者。

圖源:Jasper

10月17日,英國開源人工智能公司 Stability AI 宣布獲得 1.01 億美元融資,估值高達 10 億美元,躋身獨角獸企業(yè)行列。

10月21日,根據(jù)澎湃新聞,《華爾街日報》表示谷歌公司正在展開談判,擬向人工智能初創(chuàng)企業(yè)Cohere投資至少2億美元。Cohere的業(yè)務(wù)包括開發(fā)自然語言處理軟件,包括聊天機器人等可以理解人類語音和文本的程序。

此外,微軟正對OpenAI的新一輪投資進行后期談判。OpenAI推出了DALL·E 2項目,允許用戶通過文本生成圖像,即AI作畫。

不僅在海外AIGC企業(yè)有多起融資事件,甚至出現(xiàn)獨角獸企業(yè),在國內(nèi)AIGC類企業(yè)同樣備受資本青睞。

今年1月,超參數(shù)科技宣布完成1億美元B輪融資。

10月,虛擬內(nèi)容 AIGC 技術(shù)服務(wù)商慧夜科技完成千萬元人民幣Pre-A+ 輪融資,由高瓴資本和順為資本領(lǐng)投。

同樣發(fā)生在10月,成立于2021年的生成式AI平臺TIAMAT宣布完成數(shù)百萬美元天使輪融資。據(jù)了解,TIAMAT近4個月內(nèi)的全網(wǎng)曝光量已經(jīng)達到了5000萬,并且這個數(shù)據(jù)還在不斷攀升。

......

AIGC在投資圈已然成為資本重點關(guān)注對象,在科技界,科技大廠們也同樣將其視作重點戰(zhàn)略布局環(huán)節(jié)。

大廠重要戰(zhàn)略布局  AIGC是未來內(nèi)容趨勢

隨著互聯(lián)網(wǎng)的不斷升級,從Web 1.0到現(xiàn)在的Web 2.0,再到未來Web 3.0時代,以門戶網(wǎng)站為主的媒體時代到自媒體時代、社交平臺的興起,用戶對互聯(lián)網(wǎng)的依賴度逐漸上升,內(nèi)容生產(chǎn)方式也在進行著變遷。

在Web 3.0時代中,數(shù)字世界將變得更為清晰,AI也一直被視為元宇宙關(guān)鍵技術(shù)之一、助力數(shù)字孿生的重要利器。從“只讀模式”的PGC(專業(yè)生產(chǎn)內(nèi)容)到用戶自發(fā)參與的UGC(用戶生產(chǎn)內(nèi)容)再到AIGC(AI生產(chǎn)內(nèi)容),內(nèi)容創(chuàng)作門檻正在逐步降低,內(nèi)容生產(chǎn)力無疑將獲得更高的釋放。

不妨想象一下,在虛擬世界里,無論是打造比擬真實場景的外在,還是塑造數(shù)字生物的“思想”內(nèi)在,都需要更高效、更實時的內(nèi)容創(chuàng)作,這也就凸顯了能夠突破人力限制的AI技術(shù)的重要性。

以游戲中的智能NPC為例,若每個NPC以智能體的形式存在,那么它不僅能夠識別所處環(huán)境狀態(tài)的變化,而且能夠根據(jù)環(huán)境狀態(tài)的調(diào)整行為策略,做出符合自身個性特征的行為。在任何場景下,玩家與智能體的每一次互動,智能體都能夠根據(jù)玩家狀態(tài)、環(huán)境狀態(tài)和自身狀態(tài)的參數(shù)做出相應(yīng)的行為,進而在與玩家的互動過程中產(chǎn)生突發(fā)的動態(tài)內(nèi)容,這將對于數(shù)字世界的意義不言而喻。

電影《失控玩家》中自我意識覺醒的智能NPC男主(圖源:網(wǎng)絡(luò))

邁向下一代互聯(lián)網(wǎng)是各大科技巨頭、互聯(lián)網(wǎng)大廠,如今在元宇宙的加持下,數(shù)字化時代開啟新一輪加速,AIGC的背后生產(chǎn)力--人工智能技術(shù)早已被納入巨頭們的重要戰(zhàn)略布局之中。

去年12月,Meta已將其AI團隊并入Reality Labs部門,以開發(fā)元宇宙。

今年1月24日,Meta在一篇博客文章中表示其公司研究團隊正在打造一款新的人工智能超級計算機,并有望在今年下半年沖擊“全球最快AI超算”寶座。

實際上,早在2017年,臉書就發(fā)布了第一代AI超級計算機。據(jù)Meta而言,相較于第一代超算,新的人工智能超級集群(RSC)在運行計算機視覺工作流程的速度上提高了20倍,運行英偉達集體通信庫(nccl)的速度提高了9倍多,自然語言處理能力則提高了三倍多,并且可以從數(shù)萬億例子中學習,在數(shù)百種語言中運作,分析文本、圖像和視頻的內(nèi)容是否有問題。

Meta AI團隊的研究人員Kevin Lee和Shubho Sengupta在博文中表示,RSC將在下一個計算平臺元宇宙中發(fā)揮重要作用。

圖源:網(wǎng)絡(luò)

今年2月,在Meta AI: Inside the Lab活動上,Meta展示了其AIGC向的“探索性工具”原型Builder Bot。在Meta官方發(fā)布的視頻中,隨著扎克伯格“聲聲令下”,公園、海、沙灘、島嶼、云朵等,甚至BGM逐漸形成一個完整的場景。

圖源:Meta

這一切都是由AI驅(qū)動生成的內(nèi)容,通過語音搭建VR場景,Meta稱該工具將“促進元宇宙的創(chuàng)造力”。

可以預(yù)見的是,這項技術(shù)如果取得成功,有很大可能會對其他VR世界和平臺產(chǎn)生影響,打造VR場景將會變得更加容易。如果將Meta的Builder bot技術(shù)整合,元宇宙的內(nèi)容生態(tài)也將獲得新的增長,例如,與已經(jīng)開始測試語音功能的游戲元宇宙平臺Roblox合作打造場景,以豐富生態(tài)內(nèi)容等等。

去年4月,英偉達打造的“工業(yè)元宇宙”創(chuàng)作平臺Omniverse以難辨真假的虛擬黃仁勛出圈,11月份,英偉達推出AI虛擬化身創(chuàng)建平臺Omniverse Avatar說,今年CES 2022上,英偉達宣布Omniverse三項AI新功能,助力AIGC。

從Omniverse到Omniverse Avatar,英偉達皆在幫助用戶更快速地合成所需的數(shù)字內(nèi)容,包括數(shù)字化場景、Avatar化身、甚至僅需一條音軌即可輕松制作3D人臉動動畫等等。

英偉達中國區(qū)Omniverse業(yè)務(wù)發(fā)展經(jīng)理何展曾表示,“從UGC過渡到AIGC,無論是設(shè)計師、創(chuàng)業(yè)公司和很多大的平臺公司都有明顯的趨勢。因為UGC已經(jīng)發(fā)展了很長時間,現(xiàn)在我們更想要快速工業(yè)化生產(chǎn)的平臺,讓大家能夠從AI紅利獲得更好的益處。”

Q版AI黃仁勛(圖源:英偉達)

不止海外大廠對AI,尤其是對AIGC這種新的內(nèi)容模式“給予厚望”,今年7月,國內(nèi)互聯(lián)網(wǎng)大廠百度在百度世界大會活動現(xiàn)場利用AI技術(shù)復(fù)原了《富春山居圖》殘卷,背后的核心技術(shù)便是AIGC。

在大會現(xiàn)場,百度掌門人李彥宏還表示:“AIGC是PGC、UGC之后,全新的內(nèi)容生產(chǎn)方式。它不僅會提升內(nèi)容生產(chǎn)的效率,也會創(chuàng)造出有獨特價值和獨立視角的內(nèi)容!

紅框部分為AIGC內(nèi)容(圖源:網(wǎng)絡(luò))

“未來十年,AIGC將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式?梢詫崿F(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,去生成AI原創(chuàng)內(nèi)容!

從二維向三維過渡  理想中的AIGC究竟有多難?

根據(jù)中國信通院發(fā)表的《人工智能生成內(nèi)容(AIGC)白皮書》,AIGC的發(fā)展階段分為三個,首先是受限于技術(shù)發(fā)展的早期概念階段,到1990年之后的沉淀積累階段,再到2010年至今的快速發(fā)展階段,特別是從2014年起,生成式對抗網(wǎng)絡(luò)(GAN)的提出與迭代更新,以及AI算法的升級讓AIGC迎來了百花齊放的內(nèi)容時代。

但目前AIGC的涉及范圍更多在圖像、視頻、語音等相對二維化的場景應(yīng)用中,而回到元宇宙這個愿景,三維化應(yīng)用場景才是關(guān)鍵,AIGC技術(shù)的應(yīng)用無疑將推動二維互聯(lián)網(wǎng)向三維互聯(lián)網(wǎng)的過渡,但理想的AIGC的難度可想而知。

二維與三維的區(qū)別(圖源:網(wǎng)絡(luò))

理想很豐滿,現(xiàn)實很骨感,這句話形容元宇宙,在某些程度上可以說是非常貼近。而要實現(xiàn)元宇宙內(nèi)容生產(chǎn)上的AIGC化究竟有多難?需要什么?

AIGC技術(shù)的提升背靠GAN和AI算法的支持,根據(jù)中國信通院的研究發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的升級是推動AIGC快速發(fā)展的另一個主要原因,實驗證明,深度神經(jīng)網(wǎng)絡(luò)的學習能力和模型大小呈正相關(guān),伴隨著模型參數(shù)量的增加,相對應(yīng)深度神經(jīng)網(wǎng)絡(luò)的能力一般會取得大幅提升。

即使是模型架構(gòu)各有不同,但可以肯定的是,這些深度學習網(wǎng)絡(luò)的生成邏輯往往都需要大量的數(shù)據(jù)支撐。光是自然語言模型的突破,國內(nèi)外的企業(yè)和高校都投入了巨大的人力、算力,據(jù)悉,模型的參數(shù)量從千萬級已經(jīng)發(fā)展到了千億級別。

但三維世界的數(shù)據(jù)支撐相對而言就十分有限,要想在元宇宙中實現(xiàn)AIGC生產(chǎn)方式,首先需要龐大的三維素材庫。而三維素材的掃描,數(shù)據(jù)的收集顯然比二維更加麻煩,在如今激光雷達LiDAR這類深度攝像還未普及的情況下,三維素材的素材量顯然是不足以支撐一個理想的AIGC模型訓練。

其次是,算力的升級。

相對于二維平面,三維空間相對增加了許多維度,除了語音語義識別、計算及圖像識別之外,還有空間識別例如距離、大小、空間位置等,因此在算力和模型架構(gòu)的升級是必不可少的。

以英偉達自動駕駛的演示案例為例,為了保證安全性,自動駕駛的車輛上采集器的數(shù)據(jù)來源需要非常多,激光雷達、雷達、攝像頭等。

這些采樣得到的數(shù)據(jù)不是單一的,而是多樣性的,包括地圖、環(huán)境位置、車內(nèi)狀況、突發(fā)情況等,因此自動駕駛車規(guī)級的計算機每秒鐘運算的數(shù)據(jù)量是非常巨大的。而要達到高精度的三維場景自主搭建,計算力的升級也是極其重要的一環(huán)。

圖源:CNMO

理想化的元宇宙場景是根據(jù)個人喜好生成符合用戶自身的三維場景、人物形象等,目前,3D建模AIGC化已經(jīng)能在許多案例中看到,無論是Deepfake換臉技術(shù),還是自動生成3D模型的軟件等。但都還局限于XR技術(shù)的發(fā)展,目前3D化的場景與模型都只能在2D平面中看到。


3D建模手辦(圖源:機器之心)

并且,用戶的個性化數(shù)據(jù)需要龐大的用戶基數(shù),但用戶數(shù)據(jù)泄露、非法收集等安全問題也一直被詬病,在虛擬空間中引發(fā)的安全爭議也有不少案例。

此外,理想化AIGC最后一個關(guān)鍵是AI需要具備“意識”形成。

這里的意識不是指自我意識,而是能基于不用的語義信息、環(huán)境、概念等進行創(chuàng)作的創(chuàng)作意識,例如一些智能NPC、虛擬人偶像等的應(yīng)用。

根據(jù)中國信通院的說法,按照技術(shù)的發(fā)展進程和實際應(yīng)用的形態(tài),數(shù)字內(nèi)容的創(chuàng)作能力可劃分為基于模仿的創(chuàng)作和基于概念的創(chuàng)作兩類。

在未來,深度神經(jīng)網(wǎng)絡(luò)的高速發(fā)展下,人工智能將會被不斷刷新,伴隨著的將是人工智能更強的理解能力以及生成能力,數(shù)字內(nèi)容也將到達新的高度。

結(jié)語

科技巨頭們的舉動無疑是標志著人工智能已經(jīng)被置于發(fā)展核心布局的一環(huán),在未來,人工智能將扮演關(guān)鍵角色。在AI的加持下,互聯(lián)網(wǎng)世界的內(nèi)容,無論是多樣性還是數(shù)量都將再次達到新的高峰,毫無疑問,AIGC將在互聯(lián)網(wǎng)內(nèi)容創(chuàng)作迭代上起到多么關(guān)鍵的推進作用。

但作為最飽受爭議的科技之一,人工智能在不斷的發(fā)展、融合之中又在不斷地帶來新的創(chuàng)意,新的爭議,同時AI侵入學術(shù)界、教育界、藝術(shù)界等的事件讓大眾也產(chǎn)生了一定程度的危機感。

水能載舟,亦能覆舟。如同MidJourney的創(chuàng)始人大衛(wèi)·霍爾茨(David Holz)說的一般,“人們把人工智能看作一只老虎,一只危險的、會吃掉人的老虎。不過就像水一樣,水中也有危險,但人們可以游泳、造船、利用水發(fā)電,它既是危險的,又是文明的驅(qū)動力。這是一個機會,它沒有意志,我們可能會淹死在水中,但不意味著水應(yīng)該被禁止。人工智能就是一個新的水源,只要利用得當就會讓人類變更好。”

雖然AIGC對于信息生產(chǎn)的擴展性的意義重大,但同時這需要計算機、數(shù)學、心理學、社會學、哲學等許多學科的交集,共同進步人類才能跨越工業(yè)生產(chǎn)的下一步,這也是眾多科技巨頭仍在探索和努力的方向。


       原文標題 : Web 3.0后下一個風口,AIGC將成未來內(nèi)容趨勢?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號