9.11和9.9大模型全錯(cuò),場(chǎng)景將成AI搜索護(hù)城河
前言:
根據(jù)全球研究與咨詢公司Gartner于今年2月發(fā)布的報(bào)告預(yù)測(cè),至2026年,傳統(tǒng)搜索引擎的搜索量預(yù)計(jì)將下降25%。
此預(yù)測(cè)凸顯了隨著生成式人工智能技術(shù)的不斷發(fā)展,人們的搜索習(xí)慣正在發(fā)生顯著變化,進(jìn)而推動(dòng)了AI搜索領(lǐng)域的快速進(jìn)步。
作者 | 方文三
圖片來源 | 網(wǎng) 絡(luò)
9.11與9.9的比較時(shí)大模型[犯渾]
在數(shù)學(xué)領(lǐng)域,比較兩個(gè)小數(shù)的大小是一個(gè)基本問題。然而,當(dāng)這個(gè)問題被提出給當(dāng)前的AI大模型時(shí),卻引發(fā)了一系列的錯(cuò)誤回答。
具體來說,當(dāng)被問及[9.11和9.9哪個(gè)更大]時(shí),多數(shù)AI大模型錯(cuò)誤地認(rèn)為9.11大于9.9,這一錯(cuò)誤源于對(duì)小數(shù)點(diǎn)后數(shù)字的錯(cuò)誤比較。
大部分大模型在處理此類問題時(shí),錯(cuò)誤地將小數(shù)點(diǎn)后的數(shù)字進(jìn)行比較,而忽略了整數(shù)部分的大小。
此次事件中,多個(gè)知名的AI大模型均未能正確回答這一問題,包括但不限于ChatGPT-4o、字節(jié)豆包、月之暗面kimi等。
在對(duì)12個(gè)AI大模型的測(cè)試中,只有阿里通義千問、百度文心一言、Minimax和騰訊元寶給出了正確答案,其余8個(gè)模型均未能正確回答。
在某些場(chǎng)景表現(xiàn)不佳反映了技術(shù)的局限性
從技術(shù)層面來看,大模型在分析文本時(shí),通常會(huì)使用特定機(jī)制將文本拆分成更小的單元進(jìn)行處理,這種拆分方式在處理數(shù)學(xué)問題時(shí)可能不夠嚴(yán)謹(jǐn),容易出現(xiàn)[斷章取義]的情況。
①AI大模型在數(shù)學(xué)能力上的不足,部分源自其技術(shù)架構(gòu)的固有限制。
當(dāng)前的AI大模型主要基于Transformer架構(gòu),該架構(gòu)在處理序列數(shù)據(jù)時(shí)表現(xiàn)出色,但對(duì)數(shù)學(xué)和邏輯推理的精確性存在局限。
Transformer模型依賴于自注意力機(jī)制來捕捉輸入數(shù)據(jù)中的依賴關(guān)系。
然而,這種機(jī)制在處理數(shù)學(xué)表達(dá)式時(shí)可能無法有效捕捉數(shù)學(xué)運(yùn)算的精確順序和邏輯結(jié)構(gòu)。
②AI大模型通常使用浮點(diǎn)數(shù)來表示數(shù)值,但這種表示方式在處理小數(shù)點(diǎn)后的精確比較時(shí)可能會(huì)引入誤差,導(dǎo)致錯(cuò)誤的數(shù)學(xué)判斷。
盡管大模型在訓(xùn)練過程中接觸到了大量數(shù)據(jù),但其泛化能力在數(shù)學(xué)問題上仍顯不足,特別是在處理未見過的數(shù)學(xué)問題或需要復(fù)雜推理的場(chǎng)景。
③大模型的設(shè)計(jì)初衷可能更側(cè)重于文字思維而非數(shù)字思維。
它們?cè)谔幚碜匀徽Z言時(shí)表現(xiàn)出色,但在應(yīng)對(duì)數(shù)學(xué)這種需要精確計(jì)算和嚴(yán)格邏輯的領(lǐng)域時(shí),就顯得力不從心。
④訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性直接影響AI大模型的數(shù)學(xué)能力。
現(xiàn)有訓(xùn)練數(shù)據(jù)集中缺乏對(duì)數(shù)學(xué)邏輯和推理過程的描述,模型未能學(xué)習(xí)到數(shù)學(xué)問題解決的邏輯鏈條。
AI技術(shù)中場(chǎng)景的選擇和適配性至關(guān)重要
雖然[9.11]和[9.9]大模型可能在某些場(chǎng)景下遇到挑戰(zhàn),但將特定場(chǎng)景視為AI搜索的護(hù)城河是一種具有戰(zhàn)略意義的思考方式。
它強(qiáng)調(diào)了場(chǎng)景適配性、定制化優(yōu)化和技術(shù)創(chuàng)新在構(gòu)建競(jìng)爭(zhēng)優(yōu)勢(shì)中的重要性。
在AI搜索領(lǐng)域,這可能意味著通過專有技術(shù)、數(shù)據(jù)資源、用戶體驗(yàn)設(shè)計(jì)等手段,構(gòu)建獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。
不同的應(yīng)用場(chǎng)景可能對(duì)模型的性能有不同的要求。
因此,將特定場(chǎng)景視為AI搜索的護(hù)城河,意味著在這個(gè)特定場(chǎng)景下,通過優(yōu)化模型或整合相關(guān)技術(shù),可以實(shí)現(xiàn)更優(yōu)越的用戶體驗(yàn)和搜索效果。
①定制化優(yōu)化:針對(duì)特定場(chǎng)景,可以調(diào)整和優(yōu)化搜索算法,使其更符合該場(chǎng)景下的用戶需求和信息結(jié)構(gòu)。
②數(shù)據(jù)優(yōu)勢(shì):在特定場(chǎng)景下積累的大量相關(guān)數(shù)據(jù),可以用于訓(xùn)練更精準(zhǔn)的模型,從而提升搜索的準(zhǔn)確性和效率。
③技術(shù)創(chuàng)新:在特定場(chǎng)景下不斷探索和研發(fā)新技術(shù),如語義理解、圖像識(shí)別等,以提供更豐富的搜索功能和服務(wù)。
場(chǎng)景是AI搜索的長期護(hù)城河
在中國當(dāng)前的搜索市場(chǎng)格局中,AI與搜索的融合呈現(xiàn)出兩種主要趨勢(shì)。
①以360和昆侖萬維為代表的企業(yè),通過推出[AI搜索]應(yīng)用,實(shí)現(xiàn)了對(duì)話式搜索的創(chuàng)新體驗(yàn);
②如字節(jié)、騰訊、百度等公司,則選擇將自身的AI技術(shù)融入傳統(tǒng)搜索框中,為用戶提供更智能的搜索服務(wù)。
其中,360AI搜索、天工AI及秘塔AI搜索在體驗(yàn)上仿照了Perplexity的模式,即先給出總結(jié)性的[答案],再通過[參考資料]的形式呈現(xiàn)相關(guān)網(wǎng)頁內(nèi)容。
根據(jù)AIwatch.ai發(fā)布的[全球AI產(chǎn)品增速黑馬榜],360AI搜索在3月份的訪問量環(huán)比增加了1677%;天工AI搜索網(wǎng)頁版在4月份的訪問量達(dá)到400萬,環(huán)比增長120%;
而秘塔AI搜索在推出不到兩個(gè)月的時(shí)間里,便累積了數(shù)百萬的訪問量。
然而,隨著AI搜索熱潮的逐漸降溫,場(chǎng)景適用性、用戶留存等現(xiàn)實(shí)問題開始浮出水面,標(biāo)志著行業(yè)已邁入比拼內(nèi)功的新階段。
在這一階段,競(jìng)爭(zhēng)的核心將不再局限于融資額或產(chǎn)品功能的極端化,而是轉(zhuǎn)向?qū)φ鎸?shí)用戶場(chǎng)景的理解和滿足。
因此,中國AI搜索市場(chǎng)的下半場(chǎng),或?qū)⒕劢褂谀P椭獾睦斫饽芰、爬蟲程序的邏輯思維、數(shù)據(jù)集的全面性,以及在回答時(shí)精準(zhǔn)判斷哪些頁面對(duì)于用戶獲取準(zhǔn)確數(shù)據(jù)最為重要。
綜上所述,AI搜索產(chǎn)品并非僅具備搜索功能。原有的搜索市場(chǎng)參與者通過AI技術(shù)搶奪并留住用戶;
而新進(jìn)入者則借助AI拓寬業(yè)務(wù)邊界,開辟通往搜索領(lǐng)域的新道路。
無論何種AI搜索產(chǎn)品,其本質(zhì)目標(biāo)均在于更好地滿足用戶的搜索需求,即利用AI能力為用戶提供更精準(zhǔn)的內(nèi)容匹配。
經(jīng)過對(duì)比體驗(yàn)發(fā)現(xiàn),當(dāng)前市場(chǎng)上的AI搜索產(chǎn)品在應(yīng)對(duì)泛化信息需求時(shí)表現(xiàn)出色,但在垂直領(lǐng)域的精細(xì)要求下,往往難以提供專業(yè)、準(zhǔn)確、全面的回答。
因此,無論是原生AI搜索還是傳統(tǒng)搜索引擎,在追求低門檻的同時(shí),還需注重產(chǎn)品差異化以形成核心競(jìng)爭(zhēng)力。
同時(shí),應(yīng)警惕因缺乏應(yīng)用場(chǎng)景、數(shù)據(jù)支撐和用戶基礎(chǔ)而導(dǎo)致的市場(chǎng)淘汰,因?yàn)锳I搜索產(chǎn)品的根本驅(qū)動(dòng)力在于用戶需求而非技術(shù)本身。
只有在擁有成熟的應(yīng)用場(chǎng)景和穩(wěn)定的用戶留存基礎(chǔ)上,AI搜索的飛輪才能持續(xù)轉(zhuǎn)動(dòng)。
AI搜索面臨工程化和產(chǎn)品化問題
①在于搜索排序算法的設(shè)計(jì)。相較于傳統(tǒng)搜索引擎主要依賴的基于網(wǎng)頁關(guān)系的算法(如PageRank),其計(jì)算過程相對(duì)簡(jiǎn)化。
然而,AI搜索則引入了深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等高級(jí)模型,這要求在海量數(shù)據(jù)上執(zhí)行大規(guī)模訓(xùn)練與優(yōu)化,對(duì)算法的性能提出了極高的標(biāo)準(zhǔn)。
據(jù)統(tǒng)計(jì),搜索引擎每日需響應(yīng)數(shù)十億次查詢請(qǐng)求,而當(dāng)前主流的大型語言模型在每次查詢時(shí)均需執(zhí)行數(shù)十次參數(shù)計(jì)算,這無疑加劇了整個(gè)過程的難度與復(fù)雜性。
②實(shí)時(shí)輸出成為另一關(guān)鍵挑戰(zhàn)。隨著用戶對(duì)搜索結(jié)果實(shí)時(shí)性要求的提升,任何明顯的延遲都將嚴(yán)重影響用戶體驗(yàn)。
然而,大型模型因其推理過程而常導(dǎo)致反應(yīng)時(shí)間相對(duì)較長。
例如,谷歌的LaMDA對(duì)話模型在單次交互中,因涉及大量自然語言推理與生成,其計(jì)算延遲往往達(dá)到數(shù)秒,這對(duì)于搜索場(chǎng)景下的即時(shí)響應(yīng)需求構(gòu)成了顯著挑戰(zhàn)。
③推理準(zhǔn)確度是AI搜索的另一核心要求。在極短時(shí)間內(nèi)完成復(fù)雜的邏輯推理,以提供最為精準(zhǔn)的搜索結(jié)果,這既需要算法具備高效的計(jì)算能力,又需能夠妥善處理模糊與多義的查詢。
結(jié)尾:
在可預(yù)見的未來,隨著AIPC、AI手機(jī)等智能設(shè)備的日益普及,AI搜索有望成為這些設(shè)備的核心功能構(gòu)成部分。
這些設(shè)備將預(yù)裝AI搜索引擎,進(jìn)而將搜索流量從傳統(tǒng)瀏覽器遷移至AIPC、AI手機(jī)等平臺(tái)。
此舉不僅將重塑傳統(tǒng)搜索行業(yè)的格局,確立AI搜索為流量匯聚的主要渠道;
而且,通過語音或手勢(shì)與AI搜索進(jìn)行交互,用戶將享受到更為自然、高效的信息檢索體驗(yàn)。
部分資料參考:第一財(cái)經(jīng):《AI算不出9.11和9.9哪個(gè)大?六家大模型廠商總結(jié)了這些原因》,科技新和:《AI搜索新貴彎道超車難》,周天財(cái)經(jīng):《AI搜索之戰(zhàn):誰在成為中國的Perplexity》,AI科技評(píng)論:《AI搜索熱潮背后:注定要逾越場(chǎng)景的門檻》,技術(shù)領(lǐng)導(dǎo)力:《AI搜索,正在殺死傳統(tǒng)搜索》
原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨9.11和9.9大模型全錯(cuò),場(chǎng)景將成AI搜索護(hù)城河
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無人駕駛車,還未迎來“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬億獨(dú)角獸,AI人才之爭(zhēng)開啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市