訂閱
糾錯
加入自媒體

知乎版ChatGPT「知海圖AI」加入國產(chǎn)大模型亂斗,稱效果與GPT-4持平

“2023知乎發(fā)現(xiàn)大會”上,知乎創(chuàng)始人、董事長兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎與面壁智能聯(lián)合發(fā)布“知海圖AI”中文大模型。

周源據(jù)介紹,知乎與面壁智能達(dá)成深度合作,共同開發(fā)中文大模型產(chǎn)品并推進(jìn)應(yīng)用落地。目前,知乎和面壁智能合作自研的“知海圖AI”中文大模型已經(jīng)運用進(jìn)了知乎熱榜,知乎首個大模型功能“熱榜摘要”上線并開啟內(nèi)測。

“知海圖AI”借力知乎語言數(shù)據(jù)庫優(yōu)勢,稱與GPT-4效果持平

在知乎創(chuàng)始人、董事長兼 CEO 周源看來,AI 時代的生產(chǎn)力要素可以分為三層,從上到下依次是應(yīng)用場景、專有數(shù)據(jù)、基礎(chǔ)模型。“知海圖AI”具備必須的生產(chǎn)力要素基因。

基礎(chǔ)模型方面,在知乎與面壁智能合作自研的“知海圖AI”中文大模型面世之前,面壁智能已在 2020 年底發(fā)布了首個中文大語言模型 CPM-1,之后又陸續(xù)發(fā)布了 CPM-2、CPM-3 和 CPM-Ant 等模型。在應(yīng)用場景在上,以問答形式為主,知乎搭建了專業(yè)、多元、有價值的“討論場”。專有數(shù)據(jù)方面,知乎的運營模式?jīng)Q定了其積累了大量高質(zhì)量的內(nèi)容、關(guān)系和知識圖譜,在當(dāng)前國內(nèi)互聯(lián)網(wǎng)高質(zhì)量內(nèi)容匱乏的情況下,知乎的優(yōu)勢得天獨厚,的確具備構(gòu)建一個大模型的數(shù)據(jù)量。

目前,知乎和面壁智能合作自研的“知海圖AI”中文大模型,已經(jīng)運用進(jìn)了知乎熱榜,知乎首個大模型功能“熱榜摘要”上線并開啟內(nèi)測。

在知乎這個場景里面,答主的回答千奇百怪、非常開放,甚至?xí)霈F(xiàn)觀點跟提問沒有關(guān)系的情況。這對整個大模型很有挑戰(zhàn)。知乎稱,“知海圖AI”利用超強(qiáng)的語言理解能力對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶,給大家直觀清晰的回答。

面壁智能聯(lián)合創(chuàng)始人、CTO 曾國洋表示,“在這個場景(知乎凌亂的問答區(qū))下抽了40個提問去做評測。評測以后,發(fā)現(xiàn)跟GPT-4在這方面基本持平,我們稍微差一些,但還是蠻不錯的。

國產(chǎn)大模型開啟亂斗,資源稟賦各不相同

人工智能激戰(zhàn)正酣,當(dāng)前各個大廠、創(chuàng)業(yè)企業(yè)開啟亂斗,根據(jù)統(tǒng)計,目前國內(nèi)至少有 15 個大大小小的 AI 大模型正在研發(fā),當(dāng)然各家資源稟賦各不相同。

國內(nèi)已經(jīng)宣布AI大模型項目的企業(yè)/機(jī)構(gòu)

阿里系AI大模型“通義”系列,特點在于“借力阿里超強(qiáng)的中間件優(yōu)勢,構(gòu)建完整生態(tài)”,“通義”系列大模型將深入到電商、設(shè)計、醫(yī)療、法律、金融等行業(yè),服務(wù)超過200個場景。阿里通義大模型打造了國內(nèi)首個AI統(tǒng)一底座,根據(jù)研報梳理,阿里大模型相關(guān)受益標(biāo)的主要包括:恒生電子、千方科技、石基信息、眾信旅游、衛(wèi)寧健康、金橋信息、亞康股份、神州數(shù)碼、易點天下、絲路視覺等。

騰訊系的混元AI大模型于2022年12月推出,是目前國內(nèi)首個低成本、可落地的NLP萬億大模型,且登頂自然語言理解任務(wù)榜單CLUE。騰訊的數(shù)據(jù)、人才和硬件儲備是布局AIGC領(lǐng)域的三大優(yōu)勢:數(shù)據(jù)方面,騰訊現(xiàn)有產(chǎn)品或帶來多樣化、真實度高的數(shù)據(jù)和應(yīng)用場景;此外硬件方面騰訊擁有高性能網(wǎng)絡(luò)平臺、成熟的太極機(jī)器學(xué)習(xí)平臺,為模型訓(xùn)練提供堅實基礎(chǔ)。在生態(tài)鏈方面,騰訊系持股或與騰訊有重要合作標(biāo)的,其中互聯(lián)網(wǎng)傳媒領(lǐng)域的有:世紀(jì)華通、完美世界、三七互娛、巨人網(wǎng)絡(luò)、掌趣科技、電魂網(wǎng)絡(luò)等;版權(quán)領(lǐng)域的有:華策影視、新媒股份、博納影業(yè)、中文在線、平治信息;計算機(jī)領(lǐng)域的有:金山辦公、泛微網(wǎng)絡(luò)、四維圖新、博思軟件、長亮科技、超圖軟件等。

華為系的盤古大模型,首次兼顧了圖像判別與生成能力,能同時滿足底層圖像處理與高層語義的理解需求。盤古NLP大模型的可以賦能智能營銷領(lǐng)域,比如,盤古NLP大模型可以通過文本匹配、意圖識別等關(guān)鍵技術(shù)更好地服務(wù)銷售環(huán)節(jié),取代目前逐漸上升的人力成本和低成功率的智能客服與營銷系統(tǒng),幫助服務(wù)人員快速提升業(yè)務(wù)水平。對于華為盤古大模型生態(tài)鏈,在算力環(huán)節(jié)主要關(guān)注的是給華為做AI芯片服務(wù)的整機(jī)廠商,主要有神州數(shù)碼、拓維信息、四川長虹、同方股份、廣電運通、紫光股份等。

百度系的“文心千帆”大模型平臺,不僅包括文心一言,還包括百度全套文心大模型、相應(yīng)的開發(fā)工具鏈。未來,文心千帆還會支持第三方的開源大模型。從平臺定位上看,文心千帆為一站式企業(yè)級大模型平臺,平臺作為文心大模型服務(wù)的唯一入口,為B端企業(yè)用戶,提供數(shù)據(jù)管理、自動化模型定制微調(diào)以及推理服務(wù)云端部署一站式大模型定制服務(wù),并提供文心一言企業(yè)級推理云服務(wù)。從應(yīng)用場景上看,文心千帆可應(yīng)用于智能對話、智能輸入法等通用場景以及電銷領(lǐng)域商品介紹、推廣文章等特定場景。根據(jù)研報梳理,目前百度AI生態(tài)鏈主要受益標(biāo)的包括三六零、科大訊飛、拓爾思、萬興科技、格靈深瞳、云從科技、淳中科技、?低暋⒋笕A股份等。

目前,BAT 其中兩家 AI 大模型已經(jīng)進(jìn)入試用階段,壓力給到其他廠商研發(fā)團(tuán)隊。在這場軍備競賽中,不乏有趕這場“AI 淘金熱”的隊伍,也有想“給淘金者賣水”的組織,訓(xùn)練 AI 大模型需要大量的計算資源和數(shù)據(jù)進(jìn)行訓(xùn)練,這時候各家大廠/初創(chuàng)團(tuán)隊便要憑本事吃飯,這些平臺將在競爭中重新審視系統(tǒng)性、結(jié)構(gòu)工整的知識類內(nèi)容,這有利于我國科技和生產(chǎn)力的發(fā)展,所以大模型競爭越多越好,最終由用戶來做選擇。

大廠拿所掌握數(shù)據(jù)投喂AI模型,引發(fā)數(shù)據(jù)安全擔(dān)憂

形勢一片火熱,不乏理中客。

互聯(lián)網(wǎng)分析師張京科指出,如今由ChatGPT所引領(lǐng)的大模型浪潮,是科技領(lǐng)域的一次跨時代進(jìn)步,但也存在巨大的用戶隱私安全風(fēng)險。

ChatGPT于2022年11月發(fā)布后,其母公司OpenAI估值已漲至290億美元,上線兩個月后,用戶數(shù)量達(dá)到1億。伴隨“嘗鮮”熱潮而來的是潛在安全風(fēng)險的討論。ChatGPT是一個生成式預(yù)訓(xùn)練變換模型,該模型前期的訓(xùn)練過程是基于人類反饋的監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),在與用戶大量的交互過程中聊天模型本身會將用戶“喂”給它的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),從而不斷“進(jìn)化”。

“如今,互聯(lián)網(wǎng)公司正在嘗試用自己掌握的大數(shù)據(jù)投喂AI模型,很多時候廠商會以格式條款的協(xié)議獲得用戶各種隱私信息的授權(quán),面對這些APP簽訂的協(xié)議,用戶幾乎沒有選擇的余地。各大互聯(lián)網(wǎng)巨頭源源不斷地以用戶信息投喂獻(xiàn)祭,很多用戶也不介意類似的隱私安全風(fēng)險!

張京科指出,這意味著用戶所有的隱私、喜好、聊天、關(guān)系鏈,甚至密碼等等,未來有可能因為一個小小的安全漏洞或者運營事故,而大白于天下。為此,應(yīng)制定更嚴(yán)格的用戶大數(shù)據(jù)使用標(biāo)準(zhǔn)等措施提前進(jìn)行預(yù)防。


聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號