訂閱
糾錯(cuò)
加入自媒體

實(shí)現(xiàn)AGI道路上,數(shù)據(jù)科學(xué)家防不勝防的9大陷阱

最近幾個(gè)月,科技研發(fā)的速度也越來越快。微軟宣布將投資10億美元,與科研實(shí)驗(yàn)室OpenAI聯(lián)手打造通用人工智能(AGI),也就是人工智能的最高目標(biāo)。OpenAI的首席執(zhí)行官Sam Altman表示,AGI將成為人類歷史上最重要的技術(shù)。

對(duì)于某些特定的任務(wù),計(jì)算機(jī)能做得比人類好很多。但他們不具備智慧、常識(shí)和批判性思維,因此它們無法像人類那樣去應(yīng)對(duì)一些特殊情況(比如一些未定義的情形、模糊的規(guī)則、模棱兩可甚至自相矛盾的要求)。隨著技術(shù)的發(fā)展,計(jì)算機(jī)也許能做到人類大腦能夠完成的任何事情,但之前微軟的表現(xiàn)并不讓人滿意。

2016年,微軟發(fā)布了聊天機(jī)器人Tay,這家公司稱“它能與人類在線交流,語言隨和風(fēng)趣”。Tay的編程語言讓它表現(xiàn)得像一位千禧一代的女性,在學(xué)習(xí)訓(xùn)練過程中,它就是在模仿千禧一代的講話方式。微軟表示,“你和Tay聊得越久,那么它就會(huì)越聰明。”在不到一天的時(shí)間里,Tay發(fā)送了9.6萬條推特,擁有超過5萬名關(guān)注者。但這個(gè)問題最終出在Tay自己身上,它講的內(nèi)容越來越令人厭惡。“元首是對(duì)的,我討厭猶太人!薄911事件是有內(nèi)幕的!薄拔曳浅S憛捘切┡畽(quán)主義者!盩ay非常善于利用它接收到的詞匯和詞組,但它無法根據(jù)語境來說話,也不理解自己發(fā)送的推特到底是什么意思。因此微軟在16個(gè)小時(shí)后就關(guān)閉了Tay,但不到一周,它又重新上線。后來微軟稱第二次上線是個(gè)意外,并再次關(guān)閉了Tay。

AGI也許是一個(gè)美好的夢想,而數(shù)據(jù)科學(xué)讓我們有機(jī)會(huì)去利用大數(shù)據(jù)和強(qiáng)大的計(jì)算機(jī),作出基于現(xiàn)實(shí)而非空想或偏見的決策。但不幸的是,在數(shù)據(jù)大規(guī)模出現(xiàn)之后,企業(yè)和政府仍然在重復(fù)之前犯過的一些錯(cuò)誤,而且重復(fù)的速度更快。將重要的決策交給機(jī)器,只是實(shí)現(xiàn)了“犯錯(cuò)的自動(dòng)化”。

數(shù)據(jù)科學(xué)不僅僅是數(shù)學(xué)證明、統(tǒng)計(jì)計(jì)算和計(jì)算機(jī)編程。真實(shí)的人類智能也必不可少:比如實(shí)驗(yàn)設(shè)計(jì)、智慧、常識(shí)、懷疑和批判思維等。數(shù)據(jù)科學(xué)家并不是要成為一臺(tái)機(jī)器,不斷地嘗試新模式,不斷地進(jìn)行曲線擬合;他們更應(yīng)該成為一位科學(xué)家。

如果數(shù)據(jù)科學(xué)家想要充分挖掘數(shù)據(jù)科學(xué)的潛力,他們應(yīng)該避免以下九種常見的錯(cuò)誤。

1.使用劣質(zhì)的數(shù)據(jù)

第一代機(jī)械計(jì)算機(jī)的投資者Charles Babbage曾被國會(huì)成員兩次提問:“Babbage先生,如果我們給計(jì)算機(jī)輸入錯(cuò)誤的數(shù)據(jù),那么它會(huì)得到正確的答案嗎?”顯然優(yōu)質(zhì)的數(shù)據(jù)必不可少,而非可有可無。

芝加哥醫(yī)院對(duì)一批膿毒癥患者進(jìn)行過一次研究,它發(fā)現(xiàn),血液pH值較低的患者在出院后,重新回醫(yī)院治療的可能性更低。兩者的相關(guān)系數(shù)達(dá)到了0.96。但是這些數(shù)據(jù)還包含了一些在住院期間死去的患者,也就是說這些患者通過太平間離開了醫(yī)院,是絕對(duì)不可能回來重新治療的。最后將這些死者的數(shù)據(jù)去掉,就會(huì)發(fā)現(xiàn)血液pH值較低的患者反而是更加危險(xiǎn)的。

2.將數(shù)據(jù)的地位放在理論之上

一些數(shù)據(jù)科學(xué)家在沒有理論和常識(shí)的指導(dǎo)下,為了模型搜索大量數(shù)據(jù)。他們認(rèn)為對(duì)于一個(gè)問題的定向思維會(huì)影響新的發(fā)現(xiàn)。然而不幸的是,大多數(shù)時(shí)候泛濫的數(shù)據(jù)都是沒什么意義的。大數(shù)據(jù)領(lǐng)域的一個(gè)悖論就是,我們?yōu)橐粋(gè)模型輸入的數(shù)據(jù)越多,最后發(fā)現(xiàn)它無用或錯(cuò)誤的可能性越大。

一位互聯(lián)網(wǎng)營銷人員在大約100個(gè)國家測試過三種可選的登錄頁面顏色(黃色、紅色和藍(lán)綠色)與它傳統(tǒng)的藍(lán)色之間的對(duì)比,從理論上講,他應(yīng)該會(huì)發(fā)現(xiàn)某些國家采用特定的顏色,會(huì)帶來更高的收入。比如他認(rèn)為英格蘭更喜歡藍(lán)綠色,但實(shí)際上并不是。

3.盲目崇拜數(shù)學(xué)

數(shù)學(xué)家熱愛數(shù)學(xué),非數(shù)學(xué)專業(yè)的人懼怕數(shù)學(xué)。這兩者的組合可能會(huì)催生大量不切實(shí)際的模型。

在經(jīng)濟(jì)大蕭條時(shí)期,由于假定違約事件的發(fā)生是獨(dú)立分布的,許多按揭貸款違約的數(shù)學(xué)模型都失效了。這些人低估了極端事件的可能性,同時(shí)也沒有考慮在經(jīng)濟(jì)大蕭條的背景下,無法按期償還貸款的可能性本身就更高。

4.盲目崇拜計(jì)算機(jī)

常常有人認(rèn)為,計(jì)算機(jī)做某些事情做得很好,所以它們一定有非常高的智能,但要知道適用于特定任務(wù)和普遍適用多項(xiàng)任務(wù)之間還有很大的差別(甚至這些任務(wù)還可能完全不一樣)。我們對(duì)計(jì)算機(jī)的依賴并非百利而無一害。如果認(rèn)為計(jì)算機(jī)比我們更聰明,從而將所有決策交給計(jì)算機(jī),可能會(huì)帶來災(zāi)難性的后果。

5.反復(fù)搗騰數(shù)據(jù)

為了尋找數(shù)據(jù)之間的隱藏關(guān)系,有些人會(huì)把數(shù)據(jù)按照多種方式進(jìn)行分類。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主羅納德·科斯就說過:“如果你不停地操作一些數(shù)據(jù),機(jī)器自己都會(huì)糊涂!钡髷(shù)據(jù)和強(qiáng)大的計(jì)算機(jī)卻助長了這種行為。

一位著名研究員曾在他的助手分析數(shù)據(jù)時(shí),告訴后者“盡可能多地從數(shù)據(jù)中榨取信息”。當(dāng)時(shí)他的助手試圖通過機(jī)器視覺將一間意大利自助餐廳的客人分為“男性、女性、吃中飯的、吃晚飯的、單獨(dú)吃飯的、兩人吃飯的、兩人以上一起吃飯的、點(diǎn)了酒精飲料的、點(diǎn)了軟飲料的”等。最后這些“榨取的信息”變成了四篇“披薩論文”,其中最著名的一篇稱“男性在女性一起吃飯時(shí),會(huì)多吃93%的披薩”。如今他的十幾篇論文都被退回,人也被大學(xué)辭退。

6.自我欺騙

諾貝爾物理學(xué)獎(jiǎng)得主理查德·費(fèi)曼曾向科學(xué)家們提出過一條建議:“首要原則就是不要欺騙你自己——因?yàn)槟阕约菏亲钊菀妆缓!闭嬲目茖W(xué)家是分享自己的理論、質(zhì)疑自己的假設(shè),然后尋找機(jī)會(huì)做實(shí)驗(yàn)來驗(yàn)證或推翻假設(shè)。而擺弄數(shù)據(jù)的人只會(huì)看到自己想看的東西。

曾有一份研究要求一所高校的學(xué)生預(yù)測自己的數(shù)學(xué)測驗(yàn)成績。結(jié)果預(yù)測的平均分?jǐn)?shù)比實(shí)際分?jǐn)?shù)要高,但兩組數(shù)據(jù)之間的相關(guān)系數(shù)高達(dá)0.70。因此作者得出兩條結(jié)論。第一,這些學(xué)生高估了自己的能力。第二,為提高學(xué)生的自信心,打分可以適當(dāng)高一些。對(duì)于第一條,可能是學(xué)生低估了測驗(yàn)的難度。對(duì)于第二條,較高的相關(guān)系數(shù)表明學(xué)生其實(shí)對(duì)自己的數(shù)學(xué)水平很有信心,少數(shù)認(rèn)為自己考不好的,也只是不太熟悉材料。他們并不是太過于悲觀,而是非常現(xiàn)實(shí)。

7.把相關(guān)性當(dāng)作誘因

不論被告知多少遍“存在相關(guān)性并不一定是誘因”,但研究人員總是會(huì)不自覺地忽略這條重要的建議。

2011年,谷歌創(chuàng)建了一個(gè)人工智能項(xiàng)目Google Flu,它用搜索請(qǐng)求來預(yù)測流感的爆發(fā)。當(dāng)時(shí)他們夸下海口:“我們能精準(zhǔn)地預(yù)測出美國各個(gè)地區(qū)未來一周的傳染狀況,每天更新一次!彼麄兎Q模型的精準(zhǔn)度已經(jīng)達(dá)到97.5%,也就是模型預(yù)測結(jié)果和實(shí)際流感案例的相關(guān)系數(shù)已達(dá)到0.975。谷歌是怎么做到的呢?它的數(shù)據(jù)挖掘項(xiàng)目瀏覽了5000萬條搜索請(qǐng)求,并確定了其中45條請(qǐng)求最有可能和流感相關(guān)。由于流感的爆發(fā)具有高度的季節(jié)性,Google Flue更像是一個(gè)季節(jié)檢測器,它會(huì)挑選季候性的搜索詞匯(如圣誕節(jié)、寒假和情人節(jié)等)。當(dāng)離開了歷史數(shù)據(jù),開始真刀真槍地預(yù)測時(shí),Google Flu的準(zhǔn)確率就大大地下降。在發(fā)布報(bào)告后,Google Flu誤報(bào)了未來108周內(nèi)的100起流感案例。從此,Google Flu再也不去預(yù)測流感了。

8.不要對(duì)平均值的回歸過于驚訝

當(dāng)數(shù)據(jù)波動(dòng)時(shí),預(yù)測值可能會(huì)高于檢測值,但隨后就會(huì)繼續(xù)趨于平均值。比如一位高爾夫選手贏了大師錦標(biāo)賽冠軍,不代表下一次他也能贏。并不是說他下次會(huì)倒霉,或者技術(shù)會(huì)退步,也許這次勝利本來就是超水平發(fā)揮。

數(shù)據(jù)也會(huì)在未來回歸平均值,這有點(diǎn)類似于防止一次“發(fā)揮失;虺0l(fā)揮”。例如一家數(shù)據(jù)科學(xué)公司做過一個(gè)實(shí)驗(yàn),它將一位客戶的網(wǎng)頁布局和100多萬域名中20個(gè)常用的布局進(jìn)行比較?蛻魝兘(jīng)常會(huì)抱怨自己的網(wǎng)站表現(xiàn)不佳,認(rèn)為網(wǎng)站本來還能賺更多的廣告營收。因此它給一位數(shù)據(jù)分析師一系列網(wǎng)站域名,這些網(wǎng)站在過去三個(gè)月的營收都在下降,分析師可以根據(jù)它來調(diào)整網(wǎng)頁布局,看看能否提高營收。結(jié)果他成功了,第二天的營收數(shù)額上漲了20%,當(dāng)時(shí)他就仿佛一位萬眾矚目的搖滾歌手。但直到某一天他太忙了,來不及做任何改變,營收就開始下降。所以這些網(wǎng)站仍然屬于那些表現(xiàn)不佳的一類,他們的營收最終會(huì)回歸平均值。

9.不要傷害用戶

不幸的是,在大數(shù)據(jù)時(shí)代,企業(yè)和政府為了預(yù)測和影響我們的行為,都在時(shí)時(shí)刻刻搜集我們的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學(xué)家會(huì)很謹(jǐn)慎地處理這個(gè)過程,充分尊重我們的權(quán)利和隱私。數(shù)據(jù)科學(xué)的黃金法則:對(duì)待別人就像對(duì)待你自己那樣。

一家互聯(lián)網(wǎng)約會(huì)網(wǎng)站做過三個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)一,他們暫時(shí)移除了網(wǎng)站上所有的照片,結(jié)果發(fā)現(xiàn)很少有人愿意主動(dòng)發(fā)信息,這證明了愛情不是“盲目”的。實(shí)驗(yàn)二,他們隨機(jī)隱藏了人們的部分簡介,結(jié)果發(fā)現(xiàn)對(duì)用戶的評(píng)價(jià)沒有太大影響,這證明了愛情是“不會(huì)仔細(xì)閱讀”的。實(shí)驗(yàn)三,他們對(duì)調(diào)了匹配程度評(píng)級(jí),例如將最匹配的人貼上“最不匹配”的標(biāo)簽,反之亦然。第一和第二個(gè)實(shí)驗(yàn)對(duì)用戶沒有太大的傷害,但第三個(gè)就有問題了。因?yàn)橛脩舨幌M约旱纳畋徊缓线m的人打擾。約會(huì)時(shí)遇到一個(gè)錯(cuò)誤的對(duì)象還只是痛苦一時(shí),錯(cuò)過一個(gè)合適的對(duì)象可能會(huì)影響一生。

要避免這些陷阱,必須時(shí)刻留意。為了將數(shù)據(jù)融入科學(xué),我們更應(yīng)該表現(xiàn)得像一位科學(xué)家,而非一臺(tái)機(jī)器。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)