前端成像或?qū)㈤_啟“視覺2.0時(shí)代”
目前國內(nèi)AI視覺,幾乎都把焦點(diǎn)集中在對(duì)圖像的后端處理上。雖然算法足夠優(yōu)秀,但產(chǎn)品落地卻困難重重,原因是忽略了前端成像的重要作用。
“計(jì)算機(jī)視覺的前端成像技術(shù),背后是至少100億數(shù)量級(jí)的龐大需求!”
在日前剛結(jié)束的2018 AWE現(xiàn)場(chǎng),身為眼擎科技CEO的朱繼志,滿懷激動(dòng)的下了這么一個(gè)結(jié)論。
朱繼志說話的語氣非常篤定,因?yàn)樗麄兊膃yemore X42芯片上市不到兩個(gè)月,就已一路高歌,初露崢嶸。而業(yè)內(nèi)對(duì)eyemore X42的看法是:這款全球第一款完全自主研發(fā)并正式對(duì)外發(fā)布的AI視覺成像芯片將“引領(lǐng)AI機(jī)器進(jìn)入視覺2.0時(shí)代”。
既然這款芯片目前在國內(nèi)甚至全球同領(lǐng)域內(nèi)屬于獨(dú)一份,好奇之下,我們不禁就和他多聊了幾句。
2018將是AI落地第一年,視覺市場(chǎng)規(guī)模潛力巨大
近幾年,人工智能的火熱是毋庸置疑的,上到國家兩次將其寫入政府工作報(bào)告,下到雨后春筍般出現(xiàn)的各種AI公司,所有這些都在昭示著一個(gè)嶄新的人工智能時(shí)代即將到來。
同樣的,在眾多的AI技術(shù)和應(yīng)用中,計(jì)算機(jī)視覺是最大的切入點(diǎn)和最具潛力的領(lǐng)域。畢竟,在我們獲取的全部信息中,視覺信息的比例達(dá)到了80%以上,因此,這將是一個(gè)前景無限的市場(chǎng)方向。
計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域幾乎涵蓋了我們所知的所有行業(yè),自動(dòng)駕駛、金融風(fēng)控/交易、安防、新零售、智能手機(jī)、機(jī)器人......
國內(nèi)計(jì)算機(jī)視覺領(lǐng)域,商湯和曠世算是兩只最大的獨(dú)角獸,而他們于去年上演的融資競(jìng)賽更是吸引了無數(shù)業(yè)內(nèi)人士的目光:先是2017年7月,商湯科技B輪融資4.1億美元,接著道10月31日,曠視科技Face++又宣布獲得4.6億美元C輪融資,隨后商湯即傳出接受阿里15億元投資的消息......
不用多說什么,僅從這一連串創(chuàng)紀(jì)錄的融資金額中,我們就可以感受到計(jì)算機(jī)視覺在AI界的熱度。
據(jù)相關(guān)研究報(bào)告預(yù)計(jì),2018年全球計(jì)算機(jī)視覺市場(chǎng)規(guī)模將達(dá)到50億美元左右,而到2020年,中國計(jì)算機(jī)視覺市場(chǎng)規(guī)模將增長至725億元,未來前景極為廣闊。
“2016年是AI的概念年,2017年是demo年,2018年是落地第一年!敝炖^志認(rèn)為,在未來的三年內(nèi),AI會(huì)很快的實(shí)現(xiàn)更為廣泛的落地應(yīng)用 。
“盡管現(xiàn)在整個(gè)產(chǎn)業(yè)很多技術(shù)都還有一些問題,但是其整體架構(gòu)已經(jīng)出來了!敝炖^志說。
深耕前端成像領(lǐng)域,視覺2.0將為產(chǎn)業(yè)生態(tài)帶來質(zhì)變
眾所周知的是,目前國內(nèi)AI視覺領(lǐng)域的科技企業(yè),幾乎都在使用傳統(tǒng)攝像頭,都把焦點(diǎn)集中在對(duì)圖像的后端處理上。這就導(dǎo)致了一個(gè)尷尬的現(xiàn)象:絕大多數(shù)的AI公司算法足夠優(yōu)秀,但前端成像技術(shù)不過硬,導(dǎo)致實(shí)際落地時(shí)機(jī)器的“眼睛”不能適應(yīng)外界光線變化,識(shí)別效果差的尷尬局面。
以自動(dòng)駕駛汽車為例,在諸如車輛經(jīng)過隧道、對(duì)面駛來的車開大燈、夜間紅綠燈被道路景觀燈遮擋/干擾、夜色漆黑伸手不見五指等等異常情況下,往往會(huì)由于識(shí)別不準(zhǔn)而發(fā)生行車事故;
同樣,安防領(lǐng)域也會(huì)因?yàn)榧t外黑白畫面和逆光的人臉發(fā)黑而無法識(shí)別、工業(yè)檢測(cè)中會(huì)有因?yàn)楦吖夂头垂鈱?dǎo)致無法檢測(cè)的情形等等。
“在復(fù)雜的光線環(huán)境下,AI機(jī)器獲取的圖像信噪比會(huì)受到極大影響,這是導(dǎo)致市場(chǎng)上AI視覺產(chǎn)品難以落地的最大原因!敝炖^志認(rèn)為,要徹底解決這一難題,關(guān)鍵在于做好AI視覺產(chǎn)品的前端成像。
要克服AI機(jī)器在復(fù)雜光線下的圖像識(shí)別,就要首先解決圖像的獲取和前端處理。目前,業(yè)內(nèi)主流的解決方案有3種。
第一種就是我們所熟知的激光雷達(dá),在光線不好的情況下,通過主動(dòng)發(fā)射激光并利用光線反射來獲取物體的圖像和三維信息。激光雷達(dá)的優(yōu)點(diǎn)非常明顯,它可以獲得極高的角度、距離和速度分辨率,同時(shí)也具有良好的抗干擾能力。
不過,受限于巨大的體積和昂貴的價(jià)格(各類32線、42線、64線等型號(hào)產(chǎn)品,價(jià)格動(dòng)輒數(shù)萬數(shù)十萬甚至上百萬,雖然在持續(xù)降低,但依然不親民),它正在被邊緣化。正如馬斯克所說的,“激光雷達(dá)就像一根拐杖”。這個(gè)比喻很恰當(dāng),視覺能力不行的時(shí)候,需要依靠激光雷達(dá)這樣的拐杖,但拿著拐杖卻是永遠(yuǎn)跑不快的。
剩下的兩種方案則都是在相機(jī)和成像處理的基礎(chǔ)上加以改進(jìn)。首先是陣列計(jì)算相機(jī)技術(shù),原理有點(diǎn)類似于蜻蜓、蒼蠅等多目昆蟲的復(fù)眼,通過數(shù)個(gè)、數(shù)十個(gè)甚至上百個(gè)相機(jī)組成的陣列,拍攝出擁有億級(jí)以上像素的動(dòng)態(tài)圖像,為AI機(jī)器提供視覺支持。
目前,這一技術(shù)尚在研發(fā)階段,受限于體積和供應(yīng)鏈的制約,其產(chǎn)品也還處在落地的早期階段。
第三種方案,即是眼擎科技所做的,AI視覺前端成像引擎芯片eyemore X42。
據(jù)朱繼志介紹說,眼擎所做的這種方式,像人的眼睛一樣,核心是把人的眼睛視力弄好——解決AI機(jī)器在各種光線下自動(dòng)適應(yīng)光線的能力。
“我們堅(jiān)信,以后AI機(jī)器的眼睛應(yīng)該和我們?nèi)祟愐粯,以后它們的視力一定不?huì)比人眼差,甚至比人眼強(qiáng)。這就是我們創(chuàng)業(yè)的初衷,我們要從根本上解決AI的視力問題。”
眼擎eyemore X42芯片,視覺2.0時(shí)代的AI機(jī)器成像引擎
關(guān)于AI視覺,馬斯克曾經(jīng)提出過“全天候被動(dòng)光學(xué)圖像識(shí)別”的概念,就是要解決復(fù)雜光線,包括弱光、逆光、反光下的精準(zhǔn)識(shí)別,這也是AI機(jī)器要解決的剛需問題。眼擎科技把這種自動(dòng)適應(yīng)光線的視覺,稱之為“視覺2.0”。
2018年1月19日下午,在2018極客公園創(chuàng)新大會(huì)上,國內(nèi)AI視覺成像芯片科技公司眼擎科技正式對(duì)外發(fā)布“eyemore X42”芯片。據(jù)悉,eyemore X42是全球第一款完全自主研發(fā)并正式對(duì)外發(fā)布的AI視覺成像芯片。
數(shù)據(jù)顯示,eyemore X42成像引擎芯片,擁有比傳統(tǒng)ISP高20倍的計(jì)算能力,采用了20多種新的成像算法,集成了超過500種不同場(chǎng)景下的復(fù)雜光線數(shù)據(jù)。
eyemore X42芯片有三個(gè)特點(diǎn):首先它是一顆獨(dú)立成像芯片。目前各種相機(jī)、智能手機(jī)、攝像頭里都有成像功能,但都是被集成在主芯片里面的,只能叫集成成像。而eyemore X42整顆芯片只專注于一件事情,那就是成像。這有點(diǎn)像Intel的CPU帶了集成顯卡功能,但我們知道,只有像NVIdia的專用GPU才一定是未來的主流。
第二個(gè)特點(diǎn),eyemore X42拋棄了傳統(tǒng)的ISP成像架構(gòu),采用了全新的成像引擎架構(gòu),來解決復(fù)雜光線下的成像難題。而傳統(tǒng)的ISP,從架構(gòu)上來講,無論如何也無法完美解決復(fù)雜光線的問題。
第三個(gè)特點(diǎn)是,eyemore X42提供了豐富的API接口,讓做后端圖像識(shí)別的算法工程師,可以很方便的控制成像的過程。
eyemore X42的性能有多強(qiáng)大?也許其發(fā)布會(huì)當(dāng)天現(xiàn)場(chǎng)演示的“微光/暗光環(huán)境下實(shí)現(xiàn)精準(zhǔn)識(shí)別”的實(shí)驗(yàn),就能很好的說明問題。
“如果你問所謂的微光會(huì)微到什么程度?這個(gè)很簡單,我們有一個(gè)基本的標(biāo)準(zhǔn),就是和人眼比,我們就是要超越人眼”,朱繼志說到。
人眼的視網(wǎng)膜里有大約1.25億個(gè)視桿細(xì)胞和視錐細(xì)胞,它們扮演感光器的角色。其中,視桿細(xì)胞感知光線的明暗,而視錐細(xì)胞負(fù)責(zé)感知顏色。到光線的明暗達(dá)到一定程度(過亮或過暗)的時(shí)候,視錐細(xì)胞就停止工作,轉(zhuǎn)而切換到視桿細(xì)胞,因此這時(shí)人眼就只能感受到黑白的灰度,暫時(shí)失去了感知顏色的能力。
“我們現(xiàn)在做的事情是比人眼18個(gè)DB的八倍,在那種情況下。所以,在人眼看不清顏色、只能看清輪廓的情況下,我們能夠精準(zhǔn)的還原顏色!
人對(duì)世界顏色的感知能力是有限的,雖然理論上說人的眼睛可以分辨出出高達(dá)1200萬種顏色,但實(shí)際上遠(yuǎn)遠(yuǎn)低于這個(gè)數(shù)字。但機(jī)器能不能分辨出一百萬種、一千萬種甚至更多種顏色呢?這完全有可能。
我們很難想象的到,一個(gè)機(jī)器超越人眼之后可以做些什么。高維視覺和低維視覺相比,具有無可比擬的優(yōu)越性。
比如看到一朵花,我們看到的只是白色的,但機(jī)器看到的是五顏六色的,因?yàn)榭赡苡?00種白。這就是機(jī)器進(jìn)步的核心能力,能夠看到更多的信息,所以能夠給出更精準(zhǔn)的反饋。
AI實(shí)體化之下,5年內(nèi)視覺芯片將有100億數(shù)量級(jí)需求
隨著AI技術(shù)的進(jìn)一步發(fā)展和應(yīng)用的持續(xù)擴(kuò)大,各種由AI芯片驅(qū)動(dòng)的機(jī)器/設(shè)備持續(xù)出現(xiàn),使得AI已經(jīng)越來越呈現(xiàn)出實(shí)體化的趨勢(shì)。
“得益于人工智能的廣泛應(yīng)用,目前已經(jīng)形成了一個(gè)很大的技術(shù)生態(tài)。在這個(gè)龐大的生態(tài)海洋里,AI機(jī)器這個(gè)新的物種已經(jīng)開始進(jìn)化出來,這些AI機(jī)器將會(huì)迅速進(jìn)入我們的現(xiàn)實(shí)世界!敝炖^志說。
AI機(jī)器區(qū)別于一般機(jī)器的最大特點(diǎn)是,它不是一個(gè)普通的工具,它自己有大腦。我們可以把自動(dòng)駕駛、機(jī)器人、包括工藝檢測(cè)設(shè)備、智能的安防攝像頭/門禁/鎖具等等,都看做一個(gè)AI的機(jī)器。
另一方面,從信息時(shí)代發(fā)展到如今的AI時(shí)代,競(jìng)爭(zhēng)核心已經(jīng)從加工制造工藝/硬件設(shè)備性能的競(jìng)爭(zhēng),升級(jí)為算力和算法的比拼。由此,作為算法和算力承載的芯片,就成了當(dāng)今時(shí)代最大的競(jìng)爭(zhēng)焦點(diǎn)。
而AI機(jī)器需要數(shù)量更多的、性能更強(qiáng)大的芯片,即各種AI芯片。
“AI機(jī)器這個(gè)新物種,就是被各種芯片所驅(qū)動(dòng)的。在比拼算法和算力的時(shí)代,一個(gè)AI機(jī)器所需要的芯片的數(shù)量,也就是芯片的密度,會(huì)呈現(xiàn)數(shù)量級(jí)的增長。”
以目前突然躥紅的比特幣為例,其挖礦的設(shè)備——礦機(jī),就是芯片的需求大戶。在一個(gè)普通的礦機(jī)里,就會(huì)有幾十到數(shù)百顆處理器芯片,而這個(gè)在以前是不可能想象的。
除此之外,基于萬物互聯(lián)場(chǎng)景下的自動(dòng)駕駛汽車,它的視覺系統(tǒng)、路徑規(guī)劃系統(tǒng)、車內(nèi)溫度調(diào)節(jié)、對(duì)外通訊通信等等,每一個(gè)獨(dú)立的處理單元都至少需要一顆芯片;同樣的還有各種機(jī)器人、各種無人機(jī)、安防監(jiān)控、無人超市......
朱繼志認(rèn)為,以后一臺(tái)AI機(jī)器對(duì)各種各樣的芯片的需求,會(huì)有成百上千個(gè)。在視覺2.0的內(nèi)因驅(qū)動(dòng)下,各類AI芯片的大規(guī)模應(yīng)用時(shí)代已然來臨,AI機(jī)器這個(gè)新物種,將為AI芯片開辟一個(gè)龐大的新增市場(chǎng)。
AI機(jī)器對(duì)視覺器官的需求量同樣是巨大的,由此AI視覺芯片的供應(yīng)量也將隨之激增。
在汽車領(lǐng)域,一臺(tái)自動(dòng)駕駛的汽車,將會(huì)安裝10個(gè)視覺攝像頭;在安防領(lǐng)域,所有的監(jiān)控?cái)z像頭,都面臨著人臉識(shí)別的升級(jí);在工業(yè)設(shè)備領(lǐng)域,通過視覺的方式進(jìn)行產(chǎn)品的檢測(cè),將會(huì)成為每一條產(chǎn)線的標(biāo)配,以后每一條產(chǎn)線上都將配置超過10個(gè)智能攝像頭;在無人零售,如Amazon go正在把關(guān)注的重點(diǎn)從商品的標(biāo)簽遷移到每個(gè)顧客的消費(fèi)習(xí)慣,它的每家無人零售店都配置了超過100個(gè)以上的攝像頭。
據(jù)不完全預(yù)測(cè),未來5年內(nèi),各種各樣的AI機(jī)器將會(huì)帶來100億數(shù)量級(jí)的視覺設(shè)備需求,而視覺芯片的需求量將高于這個(gè)數(shù)字。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無人駕駛車,還未迎來“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬億獨(dú)角獸,AI人才之爭(zhēng)開啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市