訂閱
糾錯
加入自媒體

華捷艾米沈瑄:視覺+語音,人機(jī)交互的未來

近年來,在人工智能的浪潮下,AR與VR發(fā)展迅速,并逐漸形成了完整的產(chǎn)業(yè)鏈。值此背景之下,華捷艾米軟件科技有限公司憑借3D視覺感知、自然語言交互以及AR體感等技術(shù),打破了微軟以及蘋果在AR領(lǐng)域的壟斷產(chǎn)業(yè),一躍成為全球第三家AR攝像頭研發(fā)企業(yè)。為此,OFweek人工智能網(wǎng)編輯特別采訪了華捷艾米軟件科技有限公司COO沈瑄,以華捷艾米所面臨的難點為引,共同探討AR體感人機(jī)交互未來的發(fā)展趨勢。以下為采訪文字實錄:

華捷艾米軟件科技有限公司在高交會的展臺

短短數(shù)年,華捷艾米便在AR體感人機(jī)交互和人工智能領(lǐng)域取得了快速發(fā)展,受到業(yè)界認(rèn)可。那么,華捷艾米在這方面做了哪些努力?您認(rèn)為主要的難點問題是什么?

沈瑄:現(xiàn)階段人工智能產(chǎn)業(yè)的主要的難點有三個,一是資金,在深度學(xué)習(xí)的骨架模型方面,我們前期共投入1.5億元人民幣,包括數(shù)據(jù)采集、數(shù)據(jù)標(biāo)記和模型訓(xùn)練、以及芯片的設(shè)計流片等等;二是時間,在2000年至2010年之間,我們借助清華大學(xué)的大型計算機(jī)對模型進(jìn)行訓(xùn)練后,便將樣本導(dǎo)入其中,然后再次訓(xùn)練兩個半月,形成了基本的算法,這是第一部分。第二部分,我們需要將算法固化成芯片,芯片生產(chǎn)有一次流片和二次流片,其流片的良率較低,每一次流片跨度需要3至6個月左右,且每一次流片都需要幾千萬的投入;第三是供應(yīng)鏈的整合,由于是新興的技術(shù),那就需要我們自己來整合上下游的供應(yīng)鏈。

華捷艾米軟件科技有限公司COO沈瑄

目前,華捷艾米公司主要產(chǎn)品有哪些?其市場表現(xiàn)如何?在技術(shù)方面有哪些積累和突破?

沈瑄:我們公司的產(chǎn)品主要有三類,第一個是相關(guān)項目;第二是整機(jī)產(chǎn)品,我們將OTT盒子和攝像頭做成了一體,主要應(yīng)用于教育或者學(xué)習(xí)領(lǐng)域;其三,小型化手機(jī)模組,AR攝像頭應(yīng)用于手機(jī)領(lǐng)域的市場是應(yīng)用于TV市場的十倍。由于手機(jī)集成化很高,如果想添加體感技術(shù)這一功能,則相對較難。相比之下,AR體感技術(shù)嵌入TV則比較簡單,嵌入良率高達(dá)98%,所以短期之內(nèi),我們先推出嵌入TV的產(chǎn)品,將其做好之后,逐步向手機(jī)領(lǐng)域拓展。

華捷艾米公司目前和國內(nèi)一些廠商合作情況如何?對于未來發(fā)展有何具體規(guī)劃?

沈瑄:目前,我們正在和華為以及小米等國內(nèi)手機(jī)廠商溝通。與此同時,我們體感技術(shù)的參數(shù),如分辨率、幀率以及使用的距離等都和目前最先進(jìn)的技術(shù)接近,而未來我們將會重點提升產(chǎn)品的產(chǎn)能與良率。對于未來我們有短期規(guī)劃和詳細(xì)規(guī)劃兩部分,短期規(guī)劃為:加大在3D-AR與AI技術(shù)方面的研發(fā)資金投入,拓展其在手機(jī)、智能安防、機(jī)器人、醫(yī)療康復(fù)等領(lǐng)域的應(yīng)用,并在各領(lǐng)域成立相關(guān)的技術(shù)方案公司。詳細(xì)規(guī)劃如下:2018年成立AI研究院,專注視覺、聽覺、交互等人工智能感知技術(shù)的基礎(chǔ)研究;推出全球首款全能感知通用芯片;2019年嵌入式模組研發(fā)商業(yè)化完成,智能感知算法的全部硬件化IC,嵌入式平板/手機(jī)方案國際領(lǐng)先,推出針對各行業(yè)的智能感知解決方案;2020年成為國內(nèi)第一人工智能感知方案供應(yīng)商。

華捷艾米軟件科技有限公司AR攝像頭

面臨技術(shù)難點,華捷艾米是如何突破的?未來的挑戰(zhàn)與應(yīng)對措施如何?

沈瑄:在一些技術(shù)難點方面,我們也是通過與清華、中科院、武漢大學(xué)以及華東理工等高校合作方式共同解決。至于未來的挑戰(zhàn)主要有兩個方面,其一,在目前AI的風(fēng)口下,規(guī)模過小以及高端人才不足乃是我們公司的短板。當(dāng)然,我們現(xiàn)在也通過融資方式去籌集更多的資金,以擴(kuò)大企業(yè)規(guī)模,同時,我們也會去招募更高級的優(yōu)秀人才;其二,公司在游戲進(jìn)入手機(jī)行業(yè)方面的良率較低,所以我們在融資的時候會稍微注重考慮上游一些,通過產(chǎn)業(yè)鏈上的產(chǎn)業(yè)基金提供的資源,使我們的產(chǎn)能能夠大幅度提升。

目前,人工智能已經(jīng)成為全球關(guān)注的焦點方向,您認(rèn)為人工智能帶來的顛覆效應(yīng)主要表現(xiàn)在哪些方面?目前國內(nèi)現(xiàn)狀如何?未來在哪些領(lǐng)域更具前景?

沈瑄:從目前的發(fā)展情況來看,人工智能帶來的顛覆性主要體現(xiàn)在面部識別這一方面。在人工智能交互方面,以科大訊飛合作為例,我們通過手勢、人臉識別或者語音形成一種新的人機(jī)交互方式。事實上,現(xiàn)在的人機(jī)交互已經(jīng)跨越了多次數(shù)字浪潮,而數(shù)字浪潮至今則經(jīng)歷了四個階段,第一階段則是DOS操作界面,純文本的形式;第二階段,基于Windows的出現(xiàn),其鼠標(biāo)、鍵盤以及瀏覽器窗口形成了一種交互方式;第三階段,以手機(jī)、移動端、觸摸屏為導(dǎo)向,包括近年來的語音+觸摸屏交互方式等;第四階段,則以VR模式為主,通過人臉識別或者語音的形式形成新的交互方式。而未來人機(jī)之間則將通過視覺+語音交互方式,如同人與人之間交流般,回歸最樸質(zhì)自然溝通方式。

未來應(yīng)用領(lǐng)域則比較廣泛,畢竟在應(yīng)用領(lǐng)域方面它需要一點點滲透,而在目前,由于機(jī)器視覺是比較基礎(chǔ)的基礎(chǔ),它可以應(yīng)用的場景很多,比如電視、游戲健身、教育培訓(xùn)、機(jī)器人、醫(yī)療康復(fù)、智能安防以及IOT物聯(lián)網(wǎng)等領(lǐng)域。

作為機(jī)器視覺技術(shù)的領(lǐng)軍者,華捷艾米在未來的發(fā)展方向是什么?是否有進(jìn)軍海外市場的打算?

沈瑄:目前,我們的主要發(fā)展TV或者OTT盒子業(yè)務(wù),明年我們會發(fā)力嵌入式設(shè)備。應(yīng)用場景也會逐漸向游戲、健身以及幼兒教育方面發(fā)展,以此提升用戶體驗感與接受度。

在海外市場,目前我們主推幼兒教育。另外,在國內(nèi)我們將會有更大的市場空間,因為更加了解整個產(chǎn)業(yè)鏈。如目前很多電視劇生產(chǎn)商都在中國,這也為我們提供了一個很好的運(yùn)營渠道,而這些運(yùn)營渠道在海外則無法實現(xiàn)。隨著國家相關(guān)政策的不斷實施,我們也會借此機(jī)會逐步向國外市場發(fā)展。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮瑒(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號