AI與AR可同進(jìn),不可同退?
提到AR,你會想到什么?可以標(biāo)注物體信息的智能眼鏡,抑或抖音在昨日推出的landmark AR技術(shù)?在通常的認(rèn)知中,AR被普遍認(rèn)為為應(yīng)用層新技術(shù)或者說是“智能可穿戴設(shè)備”,相比人工智能(AI)相對的“算法”標(biāo)簽,顯得不夠有深度,那AR和AI之間到底是什么關(guān)系?AR屬不屬于當(dāng)下我們認(rèn)知中的人工智能?
先來簡單梳理下AR的核心技術(shù)。AR(Augmented Reality),是在現(xiàn)實(shí)世界中疊加虛擬信息,也即給現(xiàn)實(shí)做“增強(qiáng)”,這種增強(qiáng)可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓現(xiàn)實(shí)的世界和虛擬的世界融合在一起。其中,對現(xiàn)實(shí)世界的認(rèn)知主要體現(xiàn)在視覺上,這需要通過攝像機(jī)來幫助獲取信息,以圖像和視頻的形式反饋。通過視頻分析,實(shí)現(xiàn)對三維世界環(huán)境的感知理解,也即是說,AR與視頻也有著千絲萬縷的聯(lián)系。
目前AR主要的交互方式包括語音識別和手勢識別。語音識別在目前已經(jīng)取得了較大進(jìn)展,國內(nèi)如百度、科大訊飛、云知聲等都是其中的佼佼者。所以更需要突破的是手勢識別的成熟商業(yè)化,比如國內(nèi)的AI+視頻初創(chuàng)企業(yè)極鏈科技便曾在世界人工智能大會上展出過一款線下互動體驗(yàn)小游戲,如果AR的手勢識別得以突破,便可以將這種操作方式運(yùn)用于更多元的方面。
在AR的流程中,有著這樣幾個關(guān)鍵點(diǎn):
首先是3D環(huán)境理解。要理解看到的東西,主要依靠物體/場景的識別和定位技術(shù)。識別主要是用來觸發(fā)AR響應(yīng),而定位則是知道在什么地方疊加AR內(nèi)容。定位根據(jù)精度的不同也可以分為粗定位和細(xì)定位,粗定位就是給出一個大致的方位,比如區(qū)域和趨勢。而細(xì)定位可能需要精確到點(diǎn),比如3D坐標(biāo)系下的XYZ坐標(biāo)、物體的角度。根據(jù)應(yīng)用環(huán)境的不同,兩種維度的定位在AR中都有應(yīng)用需求。在AR領(lǐng)域,常見的檢測和識別任務(wù)有人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。
在感知現(xiàn)實(shí)3D世界并和虛擬內(nèi)容融合后,需要以一定方式將這種虛實(shí)融合信息呈現(xiàn)出來,這里面需要的就是AR中的第二個關(guān)鍵技術(shù):顯示技術(shù), 目前大多數(shù)的AR系統(tǒng)采用透視式頭盔顯示器,這其中又分為視頻透視和光學(xué)透視,其他的代表有光場技術(shù)、全息投影等。
AR中的第三個關(guān)鍵技術(shù)在于人機(jī)交互,用以讓人和疊加后的虛擬信息互動,AR追求在觸摸按鍵之外自然的人機(jī)交互方式,比如語音、手勢、姿態(tài)、人臉等,用的比較多的語音跟手勢。
人工智能和AR的技術(shù)關(guān)聯(lián):
在人工智能領(lǐng)域有幾個概念常被提及,如深度學(xué)習(xí)、機(jī)器學(xué)習(xí),在學(xué)術(shù)領(lǐng)域包括人工智能在內(nèi)幾大領(lǐng)域均有自己的研究界限,而在普遍意義上,我們常說的是泛意的人工智能,涵括所有“讓機(jī)器像人一樣”的技術(shù)的應(yīng)用方向。
深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的一種技術(shù)方式,而機(jī)器學(xué)習(xí)是為了讓機(jī)器變得智能,去達(dá)到人工智能?梢哉f人工智能是最終目標(biāo),而機(jī)器學(xué)習(xí)是為了實(shí)現(xiàn)這個目標(biāo)延伸出的一個技術(shù)方向。在這其中,還有另一個重要概念為計(jì)算機(jī)視覺,主要來研究如何讓機(jī)器像人去“看”,是目前人工智能概念中的一個重要分支,這也是因?yàn)槿祟惈@取信息最主要的方式之一就是視覺,目前計(jì)算機(jī)視覺已經(jīng)在商業(yè)市場發(fā)揮價值,比如人臉識別;自動駕駛中讀取交通信號和注意行人以導(dǎo)航;工業(yè)機(jī)器人用來檢測問題控制過程;三維環(huán)境的重建圖像的處理等等。這些概念既有區(qū)分也有一定范圍的重疊。
AR究竟是不是人工智能:
對AR從業(yè)者來說,理想的狀態(tài)是用更智能的AR終端去取代智能手機(jī),所以對于用戶來說接觸使用AR首先受影響的是內(nèi)容,其次是終端,AR產(chǎn)業(yè)鏈如果粗暴劃分包括技術(shù)提供商、智能終端研發(fā)公司,以及AR內(nèi)容提供商。在這其中,AR設(shè)備提供商不可避免關(guān)注硬件技術(shù),如底層的芯片、電池、光學(xué)鏡片等,以及硬件本身的性能優(yōu)化,而內(nèi)容提供商更傾向于在現(xiàn)有技術(shù)基礎(chǔ)上優(yōu)化內(nèi)容及表現(xiàn)。所以我們可以說AR技術(shù)提供商,或者說在底層算法研發(fā)上有一定成績的AR公司是人工智能公司。
對公司來說,特別是創(chuàng)企會把底層技術(shù)轉(zhuǎn)化為成熟的產(chǎn)品或服務(wù),這可能是如無人機(jī)、AR智能終端、機(jī)器人等,也可能是行業(yè)解決方案,以達(dá)到商業(yè)目的,并且這已經(jīng)成為在沸騰聲音之后,媒體、企業(yè)以及大眾對AI企業(yè)的期待和要求。
小結(jié):
作為技術(shù)驅(qū)動的商業(yè)領(lǐng)域,無論是AR還是人工智能的其他多數(shù)方向,技術(shù)距離完全成熟還有很長的路程要走,在整個產(chǎn)業(yè)鏈逐漸繁榮,關(guān)注商業(yè)化實(shí)現(xiàn)的同時,也需要有更多如曠視科技、極鏈科技一樣的公司機(jī)構(gòu)去不斷拓展技術(shù)邊界,建立核心競爭力,讓行業(yè)爆發(fā)更大的價值與潛力。如此一來,AI時代中國彎道超車當(dāng)可期。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市