AI的數(shù)據(jù)、算法、算力“輪流坐莊”,NLP到了“數(shù)據(jù)為王”的時(shí)代
它的需求可能只有初中語(yǔ)文即可。但是,NLP的數(shù)據(jù)需求早已超過(guò)這樣的標(biāo)注太多。
例如,客服詢(xún)問(wèn)用戶(hù)是否購(gòu)買(mǎi)此商品時(shí),“我要和家人商量一下”、“我會(huì)考慮”、“我現(xiàn)在不方便,你一會(huì)兒再打過(guò)來(lái)”,標(biāo)注人員得準(zhǔn)確標(biāo)注出暫不購(gòu)買(mǎi),暫不考慮,拒絕購(gòu)買(mǎi)或者興趣較大等多種意圖。
一方面,這依賴(lài)于平臺(tái)進(jìn)行的場(chǎng)景深挖,這也是為什么云測(cè)數(shù)據(jù)智能客服單個(gè)場(chǎng)景的意圖標(biāo)注就分為10-20個(gè)大類(lèi)、上百個(gè)子類(lèi),根據(jù)業(yè)務(wù)需求可能還會(huì)有進(jìn)一步的標(biāo)注細(xì)分,如此數(shù)據(jù)標(biāo)注可以更細(xì)化、直達(dá)需求。
另一方面,這繞不開(kāi)人員能力的持續(xù)培訓(xùn),把“干體力”的標(biāo)注工人轉(zhuǎn)化成懂一些專(zhuān)業(yè)的業(yè)務(wù)人員,典型的如云測(cè)數(shù)據(jù)在金融服務(wù)領(lǐng)域通過(guò)幾個(gè)月的專(zhuān)業(yè)培訓(xùn),培養(yǎng)出銷(xiāo)售人員視角去揣測(cè)用戶(hù)話(huà)語(yǔ)中的意圖。
舉例來(lái)看,在客服溝通中,用戶(hù)回饋“我在開(kāi)車(chē)”這短短的一個(gè)語(yǔ)料數(shù)據(jù),可能需要標(biāo)記出“有車(chē)一族”、“司機(jī)”、“沒(méi)有明顯拒絕”、“可能有興趣”等多個(gè)標(biāo)注給NLP算法,按云測(cè)數(shù)據(jù)自己的說(shuō)法,其培訓(xùn)達(dá)到的目標(biāo),是讓標(biāo)注員工達(dá)到成為專(zhuān)業(yè)員工的水準(zhǔn)。
顯然,在NLP標(biāo)注數(shù)據(jù)的初期階段將各大金融機(jī)構(gòu)的AI客服機(jī)器人訓(xùn)練到大致相當(dāng)?shù)某跫?jí)認(rèn)知智能水平后,再進(jìn)行提升、提高銷(xiāo)售轉(zhuǎn)化或者服務(wù)滿(mǎn)意度,都需要質(zhì)量更高、針對(duì)特定需求更強(qiáng)的NLP標(biāo)注數(shù)據(jù)。
值得一提的是,在NLP領(lǐng)域不是所有標(biāo)注都能通過(guò)人員培訓(xùn)來(lái)解決,醫(yī)療、法律等過(guò)于專(zhuān)業(yè)的領(lǐng)域可能還是依賴(lài)專(zhuān)家標(biāo)注(邀請(qǐng)醫(yī)生、律師等參與標(biāo)注),那是一個(gè)更復(fù)雜的故事了。
4、工具使用,持續(xù)加碼“便捷化”
工欲善其事必先利其器,NLP的標(biāo)注雖然不像CV有很多空間維度的數(shù)據(jù)需求,但工具提升便捷度進(jìn)而提升標(biāo)準(zhǔn)效率和準(zhǔn)確性的價(jià)值仍然不可小覷。
這方面,巨頭的腳步更早,在國(guó)外,Google Fluid Annotation一度是NLP標(biāo)注“最好使”的工具,國(guó)內(nèi),大廠和專(zhuān)業(yè)平臺(tái)的工具也被廣泛使用,云測(cè)數(shù)據(jù)在工具上的創(chuàng)新優(yōu)勢(shì)很明顯。
總體而言,標(biāo)注工具適合自己的才是最好的。這種根據(jù)定制化需求開(kāi)發(fā)貼合實(shí)際需要的數(shù)據(jù)工具對(duì)場(chǎng)景化數(shù)據(jù)的生產(chǎn),發(fā)揮著重要作用。
無(wú)論如何,持續(xù)加碼“便捷化”,是一個(gè)不會(huì)停止的過(guò)程。
NLP數(shù)據(jù)產(chǎn)業(yè)的機(jī)會(huì),將會(huì)是誰(shuí)坐莊?
在AI領(lǐng)域,雖然有大廠走在前列,但市場(chǎng)并沒(méi)有被巨頭壟斷,中型AI平臺(tái)也常常嶄露頭角成為主角。以AI數(shù)據(jù)服務(wù)領(lǐng)域?yàn)槔,像云測(cè)數(shù)據(jù)這種專(zhuān)注于企業(yè)服務(wù)的第三方獨(dú)立平臺(tái),以客戶(hù)為中心的企業(yè)基因,一直貫穿在數(shù)據(jù)交付的始終。
一個(gè)典型的表現(xiàn)是,高精確度的NLP數(shù)據(jù)需要以企業(yè)服務(wù)的心態(tài)與客戶(hù)仔細(xì)對(duì)接需求,例如,用戶(hù)需求的場(chǎng)景是什么,如果是訂票,AI問(wèn)答應(yīng)該主要導(dǎo)向訂票,對(duì)應(yīng)的NLP數(shù)據(jù)也要往這個(gè)方向去標(biāo)注。
這一過(guò)程中需要數(shù)據(jù)服務(wù)人員對(duì)需求進(jìn)行拆解、預(yù)判甚至提前給出建議,與客戶(hù)反復(fù)溝通確認(rèn)達(dá)成一致后,才能真正地去作業(yè)。大廠偏重于技術(shù)架構(gòu)、前沿技術(shù)開(kāi)發(fā)、云服務(wù)器中心大規(guī)模并發(fā)能力等建設(shè),很難俯下身好好完成這件事,這時(shí)候,AI數(shù)據(jù)專(zhuān)業(yè)化平臺(tái)更有優(yōu)勢(shì)。
此外,影響競(jìng)爭(zhēng)格局走向的還有數(shù)據(jù)服務(wù)的安全性。
在數(shù)據(jù)采集與標(biāo)注行業(yè),復(fù)制一份數(shù)據(jù)在技術(shù)上非常簡(jiǎn)單,也能節(jié)省大量的人力和運(yùn)營(yíng)成本,但給客戶(hù)帶來(lái)的損失卻不。ㄓ绕涫潜桓(jìng)爭(zhēng)對(duì)手拿到),保證數(shù)據(jù)隱私性和安全性,在AI激烈的競(jìng)爭(zhēng)環(huán)境下幾乎成為某些客戶(hù)的首要決策標(biāo)準(zhǔn)。
總而言之,高專(zhuān)業(yè)度、高精準(zhǔn)度、高效率、強(qiáng)安全才能贏得AI數(shù)據(jù)客戶(hù)尤其是NLP數(shù)據(jù)客戶(hù)的選擇,不論巨頭還是AI數(shù)據(jù)專(zhuān)業(yè)化平臺(tái)在行業(yè)爆發(fā)式增長(zhǎng)的關(guān)口都在努力,落實(shí)和推進(jìn)了諸多動(dòng)作。NLP數(shù)據(jù)產(chǎn)業(yè)正處在藍(lán)海,一個(gè)不會(huì)由巨頭坐莊的藍(lán)海。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線(xiàn)會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線(xiàn)會(huì)議
-
12月19日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線(xiàn)峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 【一周車(chē)話(huà)】沒(méi)有方向盤(pán)和踏板的車(chē),你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車(chē),還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋(píng)果偉大100倍!真正改寫(xiě)人類(lèi)歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類(lèi)何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開(kāi)啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市