百度正式發(fā)布文心一言:比ChatGPT差一點(diǎn),但可能更懂中文
過(guò)去幾個(gè)月,ChatGPT 掀起的浪潮一刻也沒(méi)有停歇,包括國(guó)內(nèi)大量公司和科技從業(yè)者在興奮于 ChatGPT 出現(xiàn)的同時(shí),也在期待中國(guó)自己的 ChatGPT。在所有宣稱(chēng)將要推出類(lèi) ChatGPT 產(chǎn)品或大語(yǔ)言模型的公司中,百度是最早官宣的一批,也是第一個(gè)選擇正式發(fā)布的公司。
3 月 16 日,就在 GPT-4 重磅升級(jí)的兩天后,百度如期在北京總部正式發(fā)布了旗下大語(yǔ)言模型——文心一言。發(fā)布會(huì)現(xiàn)場(chǎng),百度創(chuàng)始人兼李彥宏展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案、數(shù)理邏輯推算、中文理解和多模態(tài)生成五個(gè)方面的能力。
圖/百度
不過(guò)根據(jù)李彥宏的說(shuō)法,由于生成式需要輸入較長(zhǎng)的文本和時(shí)間,不適合在現(xiàn)場(chǎng)實(shí)機(jī)演示,故而選擇用錄屏形式展示文心一言的生成效果。坦白講,作為一場(chǎng)商業(yè)產(chǎn)品發(fā)布會(huì),可以理解,畢竟一旦出錯(cuò)將會(huì)極大影響外界的看法和股價(jià),谷歌此前推出生成式 AI 聊天機(jī)器人 Bard 時(shí)就因?yàn)橐粋(gè)「答非所問(wèn)」的錯(cuò)誤:市值蒸發(fā)了上千億美元。
但也要承認(rèn),錄屏的發(fā)布形式始終也讓這場(chǎng)產(chǎn)品發(fā)布會(huì)顯得有些空洞——誰(shuí)也不知道錄屏背后會(huì)有多少次嘗試和人工痕跡,所以才有人調(diào)侃百度發(fā)布了 ChatPPT。反饋到股市上,文心一言不僅沒(méi)有抬升百度股價(jià),甚至在發(fā)布后一度跌超 10%。
李彥宏在發(fā)布會(huì)上也提到,文心一言并不完美,但市場(chǎng)有需求就必須要推出來(lái)。然而并沒(méi)有準(zhǔn)備好的文心一言,是否選對(duì)發(fā)布時(shí)間和節(jié)奏,目前仍未可知。但盡管如此,還是能從這場(chǎng)發(fā)布會(huì)的內(nèi)容中一窺文心一言的面貌,以及百度的野心與困境。
文心一言距離 ChatGPT 有多遠(yuǎn)?
根據(jù)發(fā)布會(huì)上的視頻展示,文心一言面向大眾用戶(hù)的交互界面基本與 ChatGPT 類(lèi)似,都以對(duì)話機(jī)器人形式回應(yīng)用戶(hù)的文本輸入。
圖/百度
但文心一言并沒(méi)有像兩天前發(fā)布的 GPT-4 一樣支持對(duì)圖片信息的總結(jié)和分析——讀圖、識(shí)圖,甚至懂梗圖,OpenAI 就將去年的一張梗圖輸入并附上文字要求 GPT-4 解釋笑點(diǎn),結(jié)果 GPT-4 準(zhǔn)確地指出了「!故恰笇⑦^(guò)時(shí)的巨大 VGA 接口插入現(xiàn)代的小巧智能手機(jī)的反差」。
圖/OpenAI
不同的是,文心一言支持了語(yǔ)音和視頻的輸出!刚Z(yǔ)音」支持只是通過(guò) TTS 語(yǔ)音合成技術(shù)以四川話讀出文本內(nèi)容,并不值得一提,但「視頻」生成的難度明顯更高。僅從錄屏展示來(lái)看,盡管模板痕跡明顯,但生成視頻(視頻素材+字幕)至少還是可堪一用。
而具體文本理解和生成能力上,百度在第一個(gè)「文學(xué)創(chuàng)作」環(huán)節(jié)展示了文心一言的續(xù)寫(xiě)《三體》的創(chuàng)意能力,比如續(xù)寫(xiě)可以從哪些角度出發(fā):
圖/百度
這些回答本身不存在對(duì)錯(cuò),但如果我們對(duì)比下 ChatGPT 的回答,一定程度上能發(fā)現(xiàn)文心一言的文本輸出更「泛泛而談」,ChatGPT 的輸出會(huì)更加具體:
圖/ChatGPT
此外,百度在「商業(yè)文案」環(huán)節(jié)展示了如何用文心一言起公司名,我們也以同樣的問(wèn)題詢(xún)問(wèn)了 ChatGPT:
圖/百度
圖/ChatGPT
一個(gè)值得注意的問(wèn)題是,如果不強(qiáng)調(diào)中文名,ChatGPT 會(huì)自然傾向使用英文名。
就像我們?cè)谥暗奈恼轮刑岬降模琌penAI 在訓(xùn)練 GPT-3.5 和 GPT-4 大語(yǔ)言模型時(shí)的語(yǔ)料庫(kù)、基準(zhǔn)測(cè)試和開(kāi)發(fā)人員都是以英文為主,所以 ChatGPT 在英文的理解和生成能力勝過(guò)包括中文在內(nèi)的其他語(yǔ)言。
這也是百度的優(yōu)勢(shì)所在。
百度可能更懂中文
盡管在整體能力上,很難期待百度一躍超過(guò) ChatGPT 和 OpenAI,但百度文心一言相比 ChatGPT 在中文信息的可靠性上可能會(huì)有一定優(yōu)勢(shì)。除了上面提到的語(yǔ)言?xún)A向問(wèn)題,ChatGPT 不論是 GPT-3.5 還是 GPT-4 版本,訓(xùn)練用語(yǔ)料庫(kù)都截止于 2021 年 9 月,在涉及很多未知信息時(shí)容易編造內(nèi)容,比如在介紹電視劇《三體》演員陣容時(shí)再次「胡編亂造」:
圖/ChatGPT
相較之下,百度文心一言和微軟 Bing Chat 都正確指出了具體的演員陣容,Bing Chat 還提醒了我們另一個(gè) Netflix 版本的電視劇《三體》。
發(fā)布會(huì)上,李彥宏表示,百度和文心一言更懂中文和中國(guó)市場(chǎng),甚至單獨(dú)在五個(gè)環(huán)節(jié)中設(shè)置了「中文理解」的環(huán)節(jié)來(lái)展示。以百度官方演示的「洛陽(yáng)紙貴」為例,ChatGPT 再次出現(xiàn)了「幻覺(jué)」,文心一言和 Bing Chat 基本指出了正確典故,但接下來(lái)只有文心一言正面回答了「當(dāng)時(shí)洛陽(yáng)的紙到底有多貴」:
圖/百度
當(dāng)然,考慮百度選定的問(wèn)題以及錄屏的形式,還很難就此斷定「文心一言在中文上比 ChatGPT(GPT-3.5)更強(qiáng)」,但可以肯定的是,「中文」的優(yōu)勢(shì)一定是百度乃至未來(lái)中國(guó)類(lèi) ChatGPT 產(chǎn)品發(fā)力的重中之重。
而同時(shí)百度也展示了自身在行業(yè)應(yīng)用上的優(yōu)勢(shì)。李彥宏引用百度在人工智能上的四層架構(gòu)——(AI)芯片層、(深度學(xué)習(xí))框架層、模型層、應(yīng)用層時(shí)談到,百度的多層架構(gòu)協(xié)同效應(yīng)將推動(dòng) AI 實(shí)現(xiàn)更快的迭代速度,以及在應(yīng)用上也會(huì)有更高的效率和成本。
文心一言主要分為兩部分,一部分是面向普通用戶(hù),通過(guò)嵌入百度搜索,用戶(hù)可以直接與文心一言大語(yǔ)言模型交互,預(yù)計(jì)類(lèi)似微軟的 Bing 搜索和 Chat 的形式;另一部分面向企業(yè)客戶(hù),提供上述提到的四層人工智能全棧能力,從底層的云計(jì)算能力到深度學(xué)習(xí)框架,再到大模型和應(yīng)用。
圖/百度
事實(shí)上,百度相比 OpenAI 更早開(kāi)啟了 AI 大模型的商業(yè)化進(jìn)程,在百度文心大模型的官網(wǎng)就展示了與不同領(lǐng)域大公司合作開(kāi)發(fā)的行業(yè)大模型,此外還宣布已經(jīng)有 650 家合作伙伴接入了文心一言,包括之前官宣的魅族、攜程、興業(yè)銀行、美通社等。
但最終百度還是在用戶(hù)側(cè)證明文心一言的表現(xiàn)實(shí)力,否則從合作伙伴到客戶(hù)到頭來(lái)只會(huì)放棄百度。
百度必須擁抱 ChatGPT
我們高估了 ChatGPT 的意義嗎?比爾·蓋茨將其比作互聯(lián)網(wǎng)的誕生,微軟 CEO 納德拉說(shuō)它堪比工業(yè)革命,英偉達(dá) CEO 黃仁勛稱(chēng)其為 AI 的「iPhone 時(shí)刻」。
我相信,但好像也無(wú)法篤定未來(lái)一定屬于類(lèi)似 ChatGPT 的產(chǎn)品,不過(guò)可以肯定的是,ChatGPT 將改變搜索引擎的產(chǎn)品形態(tài)和業(yè)務(wù)模式。在這一點(diǎn)上,去年廣告收入(包括搜索廣告收入)占比分別為 60%和 77%的百度、谷歌都一樣,必須面對(duì) ChatGPT 帶來(lái)的沖擊和變革。
另一方面,百度和谷歌在很早就率先擁抱了 AI 技術(shù),并在長(zhǎng)達(dá)十年的時(shí)間跨度上重金投入研發(fā)。百度在 2022 年將全年核心收入的 22.4%,即 214.16 億元投入了核心研發(fā),而據(jù)歐盟委員會(huì)發(fā)布的報(bào)告,谷歌在 2022 年更是投入了 279 億歐元研發(fā)經(jīng)費(fèi),居全球第一。
但在 ChatGPT 之前,龐大的研發(fā)積累始終沒(méi)有找到合適的商業(yè)化出口,頗有些「英雄無(wú)用武之地」。
ChatGPT 帶來(lái)的突破確實(shí)帶來(lái)了出口,或者說(shuō)風(fēng)口。當(dāng)用戶(hù)、開(kāi)發(fā)者和企業(yè)客戶(hù)都在擁抱 ChatGPT,百度不可能放棄,就像李彥宏說(shuō)的,文心一言沒(méi)有準(zhǔn)備好卻還是要發(fā),是因?yàn)橛惺袌?chǎng)需求。
題圖來(lái)自百度
來(lái)源:雷科技
原文標(biāo)題 : 百度正式發(fā)布文心一言:比ChatGPT差一點(diǎn),但可能更懂中文
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 【一周車(chē)話】沒(méi)有方向盤(pán)和踏板的車(chē),你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車(chē),還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 大模型“新星”開(kāi)啟變現(xiàn)競(jìng)速
- 6 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 7 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 8 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 9 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 10 比蘋(píng)果偉大100倍!真正改寫(xiě)人類(lèi)歷史的智能產(chǎn)品降臨
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市