精品综合久久久久久888,国内精品久久

5個(gè)方向，測試文心一言和chatGPT的不同

2023-03-20 14:25

3月16日，百度如約發(fā)布了對(duì)標(biāo)chatGPT的中文版「文心一言」。

百度是國內(nèi)乃至全球大廠中第一個(gè)發(fā)布大語言模型的公司，但同時(shí)李彥宏也承認(rèn)，內(nèi)測體驗(yàn)并不完美，但他表示文心一言的進(jìn)步空間很大。

總的來說，整場發(fā)布會(huì)雖然沒有透露更多內(nèi)容，也沒有面向個(gè)人用戶開放，但百度還是表達(dá)了自己的核心觀點(diǎn)：介紹能力、承認(rèn)差距、展望未來。

而發(fā)布會(huì)后，百度也開放了內(nèi)測權(quán)限，我們?cè)谀玫綑?quán)限后第一時(shí)間與chatGPT做了對(duì)比，看看它們有什么不同。

因?yàn)橹饕獪y試對(duì)象是文心一言，所以這些問題基本都圍繞百度發(fā)布會(huì)上透露的五個(gè)方向：文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。

1 文學(xué)創(chuàng)作

從用詞上來看，文心一言和chatGPT開頭的場景描寫幾乎一模一樣。但整首詩的風(fēng)格卻不同，文心一言自始至終都是壓抑的、悲觀的，chatGPT卻給了一個(gè)堅(jiān)定且有希望的ending。

古詩創(chuàng)作文心一言上來就copy了一首家喻戶曉的詩詞。chatGPT的回答更標(biāo)準(zhǔn)，也作了詩名。

在故事創(chuàng)作上，文心一言似乎有些不合邏輯，人被貓咬了卻把貓抱到了醫(yī)院，直接忽略了人。且結(jié)尾也有些胡言亂語，一邊不能忘記湯姆帶來的恐懼和不安，又要給它建造紀(jì)念碑，視為英雄？

chatGPT的故事似乎更有邏輯性，也更符合我的恐怖要求。

2 商業(yè)文案創(chuàng)作

在商業(yè)文案創(chuàng)作上，文心一言給出的答案更符合我的要求和想法，chatGPT的答案相對(duì)啰嗦。

這一個(gè)則是文心一言完勝，chatGPT不僅用英文回答，而且還搞錯(cuò)了品牌，將悅刻翻譯為YOOZ。

這段開場白文心一言更符合我的需求和想法，chatGPT似乎搞錯(cuò)了對(duì)象。

3 數(shù)理推算

這是一道小學(xué)奧數(shù)題，也難住了文心一言和chatGPT。文心一言直接擺爛，回答的內(nèi)容里有錯(cuò)誤代碼；chatGPT則是一本正經(jīng)的胡說八道，看似步驟很多在一步步解題，實(shí)際上最后的答案也是錯(cuò)的。

第二個(gè)問題是一道從網(wǎng)上down下來的騰訊面試題，文心一言顯然沒有讀懂題意，最后的答案完全風(fēng)馬牛不相及。chatGPT的回答看似步驟合理，但最后的結(jié)果卻是錯(cuò)的。

4 中文理解

一段《三體》中的摘抄，我更喜歡chatGPT的回答，不僅描述片段的大意，還給出了反問。文心一言的答案貌似偏離了題意。

一個(gè)來自趙本山小品的梗，都沒有理解。

5 多模態(tài)生成

因?yàn)閏hatGPT還不具備圖片生成能力，所以只能用文字描述。

總結(jié)：

從上述問題的答案來看，文心一言和chatGPT都不完美。

最直觀的差距，應(yīng)該說是一種感覺。明明知道兩個(gè)都是機(jī)器人，但chatGPT給我一種更像人的感覺。文心一言的優(yōu)勢(shì)，似乎更商業(yè)化一些，在商業(yè)文案創(chuàng)作上完勝chatGPT，這可能是未來全量開放后，被調(diào)用最多的一個(gè)功能。

在測試之后我還試著問了一些帶有價(jià)值觀看法的問題，chatGPT會(huì)表示自己是AI語言模型，不能夠道德判斷或?qū)€(gè)人行為做出價(jià)值評(píng)估。

更大范圍的感觸并不是具體的產(chǎn)品差異，而是背后的技術(shù)差距。百度也承認(rèn)差距的存在，也就意味著我們還有時(shí)間來做完善。

但至少從0到1的突破我們做到了，從1到100就繼續(xù)努力吧。

以上是我們向文心一言和chatGPT提出的問題，考慮到文心一言目前尚在小范圍內(nèi)測，如果你有想問的問題，歡迎留言，我們幫你問。

原文標(biāo)題 : 圍繞5個(gè)大方向，我們測試了文心一言和chatGPT的不同