侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

搜狗王小川:無(wú)人駕駛?cè)绻蛔鲩_(kāi)放OS平臺(tái)沒(méi)戲

今天下午,在第五屆世界互聯(lián)網(wǎng)大會(huì)上,搜狗發(fā)布了全球首個(gè)全仿真智能合成主持人。據(jù)搜狗CEO王小川介紹,與微軟小冰之類(lèi)的虛擬主持人不同,這個(gè)“合成”主播除了聲音,還包括唇形及表情。

而在這次大會(huì)開(kāi)幕前兩天,搜狗也發(fā)布其Q3財(cái)報(bào)。財(cái)報(bào)數(shù)據(jù)顯示,其Q3收入2.76億美元,同比增長(zhǎng)7%,但2390萬(wàn)美元的凈利潤(rùn)則同比下滑23%。季報(bào)稱(chēng),這部分收入下降的原因在于,智能硬件產(chǎn)品的銷(xiāo)售下降,因?yàn)樗压窙Q定升級(jí)智能硬件策略,以更好地利用搜狗的人工智能能力并提高產(chǎn)品競(jìng)爭(zhēng)力。而在這次世界互聯(lián)網(wǎng)大會(huì)的專(zhuān)訪中,王小川也對(duì)其人工智能布局、財(cái)報(bào)表現(xiàn)等問(wèn)題言無(wú)不盡。

合成主播是一種“分身”的技術(shù)

記者:實(shí)際上虛擬主播已經(jīng)有過(guò)很多,搜狗這次跟微軟小冰之類(lèi)的產(chǎn)品有什么不同?它會(huì)有什么應(yīng)用場(chǎng)景?

王小川:我們是一個(gè)合成主播,除了聲音、還有表情跟唇形,這是一種“分身”的技術(shù),搜狗一直強(qiáng)調(diào)從助理、翻譯再到分身、問(wèn)答,一脈相承的技術(shù)路線。

作為分身它的使用場(chǎng)景就會(huì)有很多。比如我們現(xiàn)在跟凱叔講故事正在談合作,以前是他來(lái)講故事,但是如果通過(guò)聲音表情合成有可能變成爸爸媽媽來(lái)講故事,應(yīng)用于教育場(chǎng)景。

記者:另一方面,從聲音模擬來(lái)看,搜狗的主播跟高德地圖里的林志玲有什么不同?

王小川:高德地圖用林志玲聲音做導(dǎo)航,需要錄入許多語(yǔ)料,并沒(méi)有學(xué)習(xí)過(guò)程。而我們需要很少的語(yǔ)料,比如說(shuō)一個(gè)主播只需要錄入10分鐘的聲音就可以將其聲音特征模擬到其他的語(yǔ)音內(nèi)容中,這背后是我們有巨大的數(shù)據(jù)量支撐,才能實(shí)現(xiàn)前端更小的數(shù)據(jù)樣本。

記者:科大訊飛此前提過(guò),翻譯的未來(lái)是“人機(jī)耦合”,語(yǔ)音識(shí)別不會(huì)取代同傳,您怎么看,合成主播是否會(huì)取代主播?

王小川:首先AI技術(shù)分為感知與認(rèn)知,在感知方面包括聲影圖像,機(jī)器可以跟人做到基本一樣,但認(rèn)知方面,涉及邏輯性及思考,機(jī)器現(xiàn)在做得很有限,這需要分層次看。

合成主播還是需要人的配合。最起碼新聞稿需要新華社的編輯去寫(xiě),它是單向輸入這個(gè)內(nèi)容。另外,實(shí)際上它是不理解稿子內(nèi)容的,只是表達(dá)視覺(jué)與聽(tīng)覺(jué),所以如果跟內(nèi)容強(qiáng)相關(guān)的表情可能做得不夠好。

關(guān)于財(cái)報(bào):智能硬件不需要賺錢(qián)

記者:從財(cái)報(bào)看,醫(yī)療廣告是目前搜狗廣告收入占比最高的部分,但您提到要降低醫(yī)療廣告收入占比?

王小川:醫(yī)療上,我們首先要做到內(nèi)容權(quán)威,其次內(nèi)容優(yōu)先于廣告,降低醫(yī)療廣告收入也是為了差異化競(jìng)爭(zhēng),如果能讓用戶(hù)喜愛(ài)度提高,流量變大,收入也會(huì)進(jìn)一步提升。目前,我們的醫(yī)療廣告收入占比是低于百度的,我們的用戶(hù)查詢(xún)占比超過(guò)9%,是百度的兩倍,而從收入上看,我們是占比20%,而百度是30%。

記者:從智能硬件上看,作為我們AI一個(gè)體現(xiàn)的智能硬件收入?yún)s下降。

王小川:明年一季度我們也會(huì)做一些大眾化的智能硬件產(chǎn)品,但不是音箱,因?yàn)橐粝涞闹饕?jìng)爭(zhēng)優(yōu)勢(shì)在于便宜,是資金驅(qū)動(dòng)而不是技術(shù)驅(qū)動(dòng),我們會(huì)在生活工作方面做一些新的嘗試。

另外,不管大眾小眾,我們不依賴(lài)于智能硬件去賺錢(qián)。小眾產(chǎn)品,比如翻譯寶,我們做品牌;未來(lái)的大眾產(chǎn)品也是做用戶(hù)量,依賴(lài)于巨大的流量可以去做一些廣告之類(lèi)的其他收入方式。

記者:那我們會(huì)做車(chē)聯(lián)網(wǎng)嗎?

王小川:這不是我們的優(yōu)勢(shì)。單純的AI是不能談賺錢(qián)的,它只是一種技術(shù),不是商業(yè)模式,商業(yè)模式只有兩種,要么賣(mài)服務(wù),向B端賣(mài)整套解決方案;要么賣(mài)產(chǎn)品,去造車(chē)。我們是一家2C公司,又沒(méi)很大的資金量造車(chē)。

記者:那比如說(shuō)百度apoll這種開(kāi)放平臺(tái)模式?

王小川:早期技術(shù)創(chuàng)新是來(lái)自于一個(gè)自我的封閉體系,就像當(dāng)初PC也是IBM把軟件、硬件之類(lèi)的全做了。開(kāi)放是一種商業(yè)模式創(chuàng)新,是促進(jìn)一個(gè)相對(duì)成熟的市場(chǎng)提高效率。從目前看,單純的一個(gè)OS平臺(tái)是不可能做無(wú)人駕駛的,因?yàn)闆](méi)法建立自己的真正核心競(jìng)爭(zhēng)力。

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)