AI行業(yè)研報:生成式文字后即將爆發(fā)生成式音頻?
作 者 | BT財(cái)經(jīng)
來 源 | 德意志銀行了解更多金融信息 | BT財(cái)經(jīng)數(shù)據(jù)通
在爆發(fā)全球熱潮前,人工智能是經(jīng)過了多年醞釀的。為了正確預(yù)測未來的人工智能創(chuàng)新,我們回到源頭,研究了人工智能應(yīng)用的專利和風(fēng)險投資交易活動。
我們收集了193個世界知識產(chǎn)權(quán)組織(WIPO)成員在2012年至2022年期間公布的175072項(xiàng)人工智能專利,分為五大類。對于風(fēng)險資本投資,我們使用了經(jīng)合組織(OECD)人工智能數(shù)據(jù)庫2012年至2022年92個經(jīng)濟(jì)體的24310筆交易數(shù)據(jù)。
按絕對值計(jì)算,自2012年以來,人工智能領(lǐng)域的風(fēng)險投資活動和專利數(shù)量激增。期間,風(fēng)險投資交易數(shù)量增加了10倍,達(dá)到3884筆,2022年的交易價值幾乎是2012年的50倍,達(dá)到830億美元。與此同時,人工智能專利數(shù)量在2022年增長了7倍,達(dá)到近3.7萬個。
從風(fēng)險投資交易和專利來看,過去10年,超過三分之二的人工智能創(chuàng)新集中在交通、工業(yè)和消費(fèi)等行業(yè)應(yīng)用上。
接下來,我們預(yù)計(jì)生成式音頻(generative audio)將在2024年大規(guī)模出現(xiàn),并顛覆游戲和電影制作等行業(yè)。
1
人工智能走出冬眠
隨著OpenAI的ChatGPT于2022年11月發(fā)布,人們對人工智能的興趣激增,不僅是普通人,企業(yè)也是如此。2022年,公司文件中提到“人工智能”的次數(shù)超過71.5萬次,而2020年僅為13.5萬次。根據(jù)我們的調(diào)查,到2023年4月,41%的美國人已經(jīng)聽說過ChatGPT,而近60%的人表示他們的工作已經(jīng)在某種程度上開始使用ChatGPT。
此外,在5月18日的新聞中,ChatGPT在美國發(fā)布了第一個應(yīng)用程序版本后,現(xiàn)在可以在iPhone上使用。谷歌還于5月5日宣布,將開始推出集成到搜索產(chǎn)品中的生成式人工智能工具。在進(jìn)一步研究之前,我們先對人工智能進(jìn)行簡單的定義——人工智能是一種基于機(jī)器的系統(tǒng),人類給出一組給定的目標(biāo),它可以作出預(yù)測、建議甚至決定,從而可能影響現(xiàn)實(shí)或虛擬環(huán)境。
人工智能其實(shí)已經(jīng)醞釀了好幾年。自2012年以來,與人工智能相關(guān)的風(fēng)險投資交易活動和已公布的專利一直在悄然飆升。例如,風(fēng)投數(shù)量從2012年的332筆增長到2022年的3884筆。2022年,風(fēng)投交易價值達(dá)到830億美元,高于2012年的18億美元。與此同時,自2012年以來,人工智能方面的專利數(shù)量增加了7倍。
人工智能行業(yè)的進(jìn)入門檻一直在降低,這刺激了該領(lǐng)域的商業(yè)創(chuàng)新。例如,自2018年以來,圖像分類系統(tǒng)的訓(xùn)練成本降低了64%,而訓(xùn)練時間減少了94%。包括OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney和Cohere在內(nèi)的眾多初創(chuàng)公司和風(fēng)投公司也紛紛涌現(xiàn)。據(jù)報道,Anthropic最近在C輪融資中籌集了4.5億美元,參與融資的有Alphabet、賽富時(Salesforce)和Zoom。此外,一家倫敦的人工智能公司Builder. Ai在最新一輪融資中籌集了2.5億美元。
為了正確預(yù)測人工智能即將到來的情況,我們還研究了該領(lǐng)域的專利。我們預(yù)計(jì),獲得風(fēng)投的公司大約需要兩到三年時間才能將產(chǎn)品推向市場,甚至需要更長的時間等待專利批準(zhǔn),如七至十年。就專利而言,在公司專利獲得保護(hù)后,他們則需要營銷,選擇商業(yè)伙伴等,這大概需要一到三年時間。
通過世界知識產(chǎn)權(quán)組織Patentscope,我們收集了193個該組織成員在2012年至2022年期間公布的175072項(xiàng)人工智能專利條目,這些專利分為五大類,其中包括部門應(yīng)用(sectoral applications)、服務(wù)平臺(horizontal platforms)、自動化機(jī)器(autonomous machines)和半導(dǎo)體(semiconductors)。在風(fēng)投方面,我們使用的是經(jīng)合組織人工智能數(shù)據(jù)庫涵蓋的92個經(jīng)濟(jì)體的24310筆交易。
1. 人工智能景觀——將創(chuàng)意帶入生活
股票市場反應(yīng)如何
迅速采用ChatGPT和其他新的人工智能的公司股價飆升。例如,2023年1月31日,人工智能軟件企業(yè)C3. ai推出了集OpenAI、谷歌、學(xué)術(shù)研究等人工智能技術(shù)于一體的“生成式人工智能產(chǎn)品套件”。當(dāng)日,該公司股價上漲近22%,自今年年初以來已累計(jì)上漲143%。
人工智能音頻和語音識別軟件公司SoundHound的股價今年迄今已上漲66%。
不僅僅是人工智能軟件公司,人工智能幾乎影響了價值鏈上的所有公司。英偉達(dá)是一家半導(dǎo)體公司,其生產(chǎn)的計(jì)算機(jī)芯片可以運(yùn)行人工智能模型,該公司股價上漲了110%。在大型科技公司之間的人工智能競賽中,Meta也表現(xiàn)出色。
資金流向人工智能
2022年,全球?qū)θ斯ぶ悄艿娘L(fēng)險投資達(dá)到830億美元的峰值,高于2012年的18億美元。Databricks和麻省理工學(xué)院發(fā)現(xiàn),大多數(shù)公司已經(jīng)開始廣泛部署人工智能。在樣本中,到2022年未使用人工智能的公司比例不到6%。
企業(yè)將從人工智能增長中受益
多年來,人工智能研究一直局限于學(xué)術(shù)界,如今正被應(yīng)用于商業(yè)領(lǐng)域。學(xué)術(shù)界是先行者,從學(xué)術(shù)發(fā)表到獲得專利通常需要15年的時間。
然而,越來越明顯的是,人工智能創(chuàng)新爆發(fā)的時機(jī)已經(jīng)成熟。從2012年到2022年,49%的風(fēng)投交易是在過去三年達(dá)成的。同樣,我們的數(shù)據(jù)庫中有52%的人工智能相關(guān)專利在三年內(nèi)發(fā)布。
2. 應(yīng)用領(lǐng)域:人工智能將在2023年成為主流
亞馬遜創(chuàng)始人兼執(zhí)行主席Jeff Bezos表示:“我們現(xiàn)在正在用機(jī)器學(xué)習(xí)和人工智能來解決問題,現(xiàn)在發(fā)生的這一切猶如科幻小說里描述的內(nèi)容。”
過去10年,與人工智能相關(guān)的風(fēng)投交易中,近五分之四是在行業(yè)應(yīng)用領(lǐng)域。另有8%發(fā)生在自動化機(jī)器和汽車領(lǐng)域,還有13%發(fā)生在半導(dǎo)體領(lǐng)域。人工智能相關(guān)專利的比例也類似。
行業(yè)應(yīng)用:人工智能不局限于一個行業(yè)
目前,79%的風(fēng)投交易和61%的專利發(fā)生在我們認(rèn)為的“行業(yè)應(yīng)用”中。根據(jù)我們的定義,這包括消費(fèi)、工業(yè)、資訊科技、運(yùn)輸、醫(yī)療保健、金融服務(wù)業(yè)。
從2012年到2022年,風(fēng)投交易數(shù)量從270筆增加到3006筆,增長了10倍多。2022年,交易總額達(dá)到620億美元,遠(yuǎn)高于2012年的13億美元。在這些領(lǐng)域發(fā)布的專利也在蓬勃發(fā)展。自2012年以來,相關(guān)專利數(shù)量增加了6倍。擁有最多專利的公司都是公認(rèn)的科技巨頭,如IBM、三星(Samsung)、英特爾(Intel)、LG電子(LG Electronics)和高通(Qualcomm)。
服務(wù)平臺:AI工具
自2012年以來,我們看到服務(wù)平臺(horizontal platforms)的專利數(shù)量增長了近6倍,包括人工智能主核(AI core)、自然語言技術(shù)(natural language technology)、人工智能自動化平臺(AI automation platforms)、計(jì)算機(jī)視覺軟件(computer vision software)。服務(wù)型應(yīng)用(Horizontal applications)是人工智能開發(fā)和部署的重點(diǎn)模塊,擁有這類專利的公司包括AT&T、IBM、LG電子、百度以及老牌科技企業(yè)。
自然語言處理(Natural language processing)是一種用于大型語言模型(LLMs)的人工智能工具,隨著ChatGPT的出現(xiàn)而變得流行。自然語言處理的一些例子包括翻譯、自動糾錯、自動文本摘要、聊天機(jī)器人,以及金融領(lǐng)域的信息需求等處理方式。
計(jì)算機(jī)視覺涉及使用人工智能來分析視覺數(shù)據(jù),并做出有意義的預(yù)測,包括面部識別、地理空間分析等。
微軟的Inner Eye技術(shù)已經(jīng)可以幫助檢測腫瘤和異常細(xì)胞。在他們的最新研究中,微軟展示了其技術(shù)如何幫助臨床醫(yī)生。在計(jì)算機(jī)視覺專利數(shù)量最多的五家公司中,有兩家是中國公司,分別是百度和華為。
誰還需要駕照?自動駕駛已經(jīng)到來
在過去十年中,8%的風(fēng)投交易和16%的專利都發(fā)生在“自動化機(jī)器”領(lǐng)域。這類技術(shù)涵蓋兩個關(guān)鍵領(lǐng)域,分別是自動駕駛汽車和智能機(jī)器人。在過去的十年里,這個領(lǐng)域受到了很多關(guān)注。這在很大程度上與特斯拉取得的成功相吻合,特斯拉一直在試驗(yàn)自動駕駛汽車系統(tǒng)。
從2012年到2022年,自動化機(jī)器領(lǐng)域的風(fēng)投交易數(shù)量從22筆增加到363筆。智能機(jī)器人就屬于這一類。這些機(jī)器人能夠在不需要人類干預(yù)和輸入的情況下進(jìn)行一定程度的操作。人工智能通常用于協(xié)助機(jī)器人機(jī)型訓(xùn)練和適應(yīng)。三星、LG電子、英特爾以及中國的大疆公司和滴滴等公司在機(jī)器人專利方面地位穩(wěn)固。
幾年來,自動駕駛汽車也一直是人們討論的焦點(diǎn)。除了特斯拉之外,其他公司也在擴(kuò)大對自動駕駛汽車所需技術(shù)的研究和投資,因此,風(fēng)險投資和專利申請的大幅增加很可能是在這個背景下發(fā)生的。
半導(dǎo)體芯片
英偉達(dá)首席執(zhí)行官黃仁勛表示:“很明顯,人工智能將影響每一個行業(yè)。我認(rèn)為每個國家都需要確保人工智能是其國家戰(zhàn)略的一部分,每個國家都會受到影響。”
半導(dǎo)體占人工智能相關(guān)風(fēng)投交易的13%,占已公布專利的4%,包括處理器設(shè)計(jì)(processor design)、邊緣人工智能軟件(edge AI software)、智能傳感器和設(shè)備(intelligent sensors & devices)。
從2012年到2022年,半導(dǎo)體領(lǐng)域的風(fēng)投交易從40筆增加到515筆。2022年,該領(lǐng)域交易總額達(dá)到94億美元,高于2012年的2億美元。同樣,從2012年到2022年,該領(lǐng)域?qū)@麛?shù)量增長了7倍。
自20世紀(jì)70年代以來,芯片經(jīng)歷了快速的創(chuàng)新,芯片性能每隔幾年就會翻一番。生產(chǎn)商必須跟上發(fā)展的步伐,否則就有被甩在后面的風(fēng)險。隨著技術(shù)變得越來越復(fù)雜,新工具是必要的,這正是人工智能可以發(fā)揮作用的地方。
3. 2024年及以后的新機(jī)遇
生成式音頻可能是下一個大熱門
人工智能現(xiàn)在能夠根據(jù)不同語言、口音和方言的文本輸入創(chuàng)造人類的聲音和合成音頻。它使用了在ChatGPT中流行的生成式人工智能。
從2020年第一季度到2022年第四季度,提到“生成式音頻(generative audio)”的公司文件數(shù)量增加了13倍以上。
隨著音樂和聲音研發(fā)的深入,我們可能會看到新競爭者的爆炸式增長。很快,人們可以輸入文本或圖像來生成音頻內(nèi)容,而不需要音頻專家或計(jì)算機(jī)專家。
這可能會影響游戲、通信、音樂、新聞和醫(yī)療保健等一系列領(lǐng)域。擁有生成式音頻相關(guān)專利最多的公司包括索尼(Sony)、亞馬遜、華為、字節(jié)跳動、Adobe、蘋果和騰訊。
可以生成什么音頻?
生成式音頻分為四個主要類別,包括合成聲音(synthetic voice)、語音互動(speech interaction)、音樂生成(music generation)和音頻編輯(audio editing)。首先,通過深度學(xué)習(xí),人工智能可以高質(zhì)量地合成真實(shí)的人聲,包括音高、音調(diào)和節(jié)奏。語音互動包括虛擬助手等技術(shù),例如蘋果的Siri和亞馬遜的Alexa。隨著技術(shù)的發(fā)展,人類與人工智能之間的“自然”互動可能會越來越多。
音樂生成技術(shù)可以輕松地創(chuàng)造出種類繁多的新音樂。例如Spotify的DJ和Aimi Studio。人工智能音樂已經(jīng)對音樂產(chǎn)業(yè)構(gòu)成了挑戰(zhàn)。
最后,音頻編輯可以使用人工智能來提高音頻錄制質(zhì)量。
2
結(jié)論
人工智能來了,新的創(chuàng)新就在眼前。以專利和風(fēng)險投資等指標(biāo)進(jìn)行衡量,人工智能領(lǐng)域的創(chuàng)新在過去10年呈爆炸式增長。從風(fēng)險投資活動和專利來看,過去十年中,超過三分之二的人工智能創(chuàng)新集中在交通、工業(yè)和消費(fèi)者應(yīng)用等領(lǐng)域,其次是自動化機(jī)器和服務(wù)型應(yīng)用、半導(dǎo)體產(chǎn)業(yè)。
在2023年之后,我們預(yù)計(jì)生成音頻創(chuàng)新將會激增。隨著ChatGPT和DALL-E的到來,我們已經(jīng)看到生成式人工智能引起了世界的關(guān)注。這些技術(shù)將共同改變游戲和電影制作等行業(yè)。
文章系作者個人觀點(diǎn)如有疑問及任何意見反饋可直接在評論區(qū)留言或發(fā)送郵件
原文標(biāo)題 : AI行業(yè)研報:生成式文字后即將爆發(fā)生成式音頻?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【限時免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市