訂閱
糾錯(cuò)
加入自媒體

想“白嫖”?沒門!問答網(wǎng)站向AI訓(xùn)練要錢

近日,全球最大的程序員問答網(wǎng)站StackOverflow宣布:計(jì)劃在今年年中向 AI 算法開發(fā)人員收費(fèi)。

問答網(wǎng)站向AI開發(fā)人員收費(fèi),這是怎么一回事??

最近“人工智能”這顆子彈飛了這么久,想必大家都知道了目前AI進(jìn)化到這種程度,是需要海量的數(shù)據(jù)作為訓(xùn)練支撐的。

數(shù)據(jù)從哪里來?據(jù)《華盛頓郵報(bào)》的一項(xiàng)調(diào)查顯示,訓(xùn)練的數(shù)據(jù)基本都是從網(wǎng)上直接抓取來的,而關(guān)于這些數(shù)據(jù)的實(shí)際來源,幾乎沒人過問。龐雜而巨量的數(shù)據(jù)被投喂給剛出生的AI baby,讓他們快速地成長(zhǎng),直到他們“成年”可以投入使用。之后,AI公司會(huì)以各種名義讓用戶付費(fèi)使用此類服務(wù),就比如OpenAI推出的ChatGPT Plus訂閱服務(wù),微軟提供的代碼生成服務(wù)等等。

AI公司把錢賺到手,資金回籠以便更好地繼續(xù)深入開發(fā)。用戶掏了錢,可以使用更智能的AI服務(wù)。這看似是個(gè)正向的生態(tài)閉環(huán),但是別忘了這里面還有一個(gè)角色:數(shù)據(jù)提供商。從頭到尾都沒人注意到他們的存在,也沒人對(duì)他們說一句:您辛苦了!就更別提錢的事兒了,純粹就是被“薅羊毛”的冤大頭。

眼看著OpenAI這些公司聲名鵲起、名利雙收,這些數(shù)據(jù)提供方坐不住了。在StackOverflow發(fā)表意見之前,知名社區(qū)Reddit 首席執(zhí)行官 Steve Huffman早就直接表示——他們的數(shù)據(jù)很重要,不能免費(fèi)提供給AI訓(xùn)練使用。

StackOverflow 首席執(zhí)行官 Prashanth Chandrasekar 表示認(rèn)同和支持 Reddit 的做法,還說社區(qū)平臺(tái)推動(dòng)了大語言模型(LLM)的發(fā)展,所作出的貢獻(xiàn)也必須得到補(bǔ)償。該CEO甚至表示,現(xiàn)在這些AI模型的大肆運(yùn)用,是在違反社區(qū)的知識(shí)共享許可。為此,他特地在社區(qū)博客po文,闡明「人工智能系統(tǒng)的核心是建立在豐富的人類知識(shí)和經(jīng)驗(yàn)之上。他們通過數(shù)據(jù)訓(xùn)練來學(xué)習(xí)——例如開源代碼和 Stack Overflow 問答!惯@一核心觀點(diǎn)。

“反攻倒算”的不止兩家

除這兩家以外,自打ChatGPT問世以來就急得“跳腳”的馬斯克,也不會(huì)放過這個(gè)反將一軍的機(jī)會(huì)。Twitter早在3月26日就宣布,旗下應(yīng)用的API接口全部收費(fèi),并劃分三種收費(fèi)標(biāo)準(zhǔn),讓企業(yè)客戶“按需購買”。

  • 免費(fèi)版:只有使用 Twitter 登錄的訪問權(quán)限,以及每月僅提供1,500個(gè)發(fā)帖請(qǐng)求。

  • 基礎(chǔ)版:每月100美元,可以獲得50,000個(gè)發(fā)帖請(qǐng)求和10,000個(gè)閱讀請(qǐng)求。

  • 企業(yè)版:并沒有列出具體的價(jià)格。但是承諾提供“滿足您和您客戶特定需求的商業(yè)級(jí)訪問”以及“[來自]專門客戶團(tuán)隊(duì)的托管服務(wù)! 不過,據(jù)外媒 Platformer 此前報(bào)道,企業(yè)版每月的費(fèi)用可能高達(dá)42,000美元

相信這也會(huì)給Reddit和StackOverflow的收費(fèi)提供借鑒。

對(duì)于微軟和OpenAI,馬斯克不光是要招兵買馬正面競(jìng)爭(zhēng),還要“舊賬新算”、“刨根問底”,他認(rèn)為ChatGPT的巨大成功,離不開Twitter提供的數(shù)據(jù)支持。但是現(xiàn)在微軟宣布不再支持Twitter的廣告服務(wù)之后,馬斯克就用“非法訓(xùn)練AI”為借口,威脅微軟要“起訴”。


起不起訴是一回事,惡心你是另一回事。

拒絕“白嫖”的背后

Stack Overflow 作為全球知名的編碼論壇,為開發(fā)者提供協(xié)作與交流的環(huán)境,也是程序員討論編碼問題的主要聚集地。當(dāng)前,市面上很多的 AIGC 都支持輔助編碼、能夠在理解用戶提出的編碼問題基礎(chǔ)上提供生成式代碼、甚至也可以捕捉 Bug 以及 Debug,而大模型之所以擁有這些能力,也有大量相關(guān)編碼問題與數(shù)據(jù)集的支撐。

外界將StackOverflow向AI訓(xùn)練收費(fèi)歸結(jié)于社區(qū)流量下滑。網(wǎng)絡(luò)分析公司 SimilarWeb 最新發(fā)布的一份數(shù)據(jù)指出,開發(fā)人員已經(jīng)越來越多地選擇從 AI 聊天機(jī)器人和 GitHub CoPilot,而非Stack Overflow 上獲取建議。營(yíng)銷平臺(tái) Semrush 的流量監(jiān)測(cè)工具也顯示,近一年來,Stack Overflow 的訪問量持續(xù)下滑。

然而事實(shí)是,自從2022年開始該社區(qū)的流量就處于下滑狀態(tài),GitHub CoPilot 自 2022 年 6 月起普遍可用。在 OpenAI 的 ChatGPT 流量成倍增長(zhǎng)的同時(shí),Stack Overflow 的訪問量一直在穩(wěn)步下降。與去年同期相比,自 2022 年 1 月以來, Stack Overflow (stackoverflow.com) 的流量平均每月下降 6%,3 月份下降了 13.9%。ChatGPT 在 11 月底推出,沒有同比記錄,但它的網(wǎng)站 (chat.openai.com) 已經(jīng)在短時(shí)間內(nèi)成為世界上最熱門的數(shù)字資產(chǎn)之一,比微軟的 Bing 搜索引擎的全球流量還大。它在 3 月份吸引了 16 億人次訪問,在 4 月上半月又吸引了 9.207 億人次。GitHub 網(wǎng)站也出現(xiàn)了強(qiáng)勁增長(zhǎng),3 月份 github.com 的訪問量同比增長(zhǎng) 26.4% 至 5.24 億次。

從訪問數(shù)據(jù)和流量上看,Stack Overflow的關(guān)注度確實(shí)在逐步下降。但與ChatGPT不同的是Stack Overflow服務(wù)的人群更加垂直和專業(yè),ChatGPT的熱度高漲,是因?yàn)槊嫦虻氖歉鼜V泛的受眾。Stack Overflow的“失寵”,不全是因?yàn)镃hatGPT的風(fēng)頭太盛。而Stack Overflow轉(zhuǎn)為向AI訓(xùn)練收費(fèi),也并不全是認(rèn)為L(zhǎng)LMs分割了用戶群體,只是想在這波大浪潮中分一杯羹。用Stack Overflow CEO Chandrasekar的話來說,潛在的額外收入對(duì)確保 Stack Overflow 能夠不斷吸引用戶和維持高質(zhì)量的信息至關(guān)重要。

現(xiàn)在,這些AI科技巨頭們應(yīng)該都知道,為什么“白嫖”是這個(gè)世界上最貴的東西了。因?yàn)槟悴恢朗裁磿r(shí)候,就會(huì)被反過來狠狠地“訛”上一把。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)