騰訊云發(fā)力行業(yè)大模型,有幾分勝算?
自BERT出現之后,大模型成為AI領域的主流技術趨勢,業(yè)界也因此掀起兩輪熱潮。國內外眾多大廠、創(chuàng)業(yè)公司都在爭先推出各自的大模型,字節(jié)跳動亦被認為將在今年年中推出大模型。
如今騰訊也出手了。6月19日,騰訊云發(fā)布MaaS(模型即服務)能力全景圖,計劃打造一站式行業(yè)大模型精選商店,以協助客戶構建專屬大模型及應用。騰訊云的入場,會給賽道帶來什么?在激烈的競爭中,騰訊云有幾分勝算?
01
助力大模型落地
目前市面上谷歌、微軟、百度、阿里等大廠公布的都是一個基礎的通用大模型。與此前諸多公司急切高調推出的通用大模型不同,騰訊將更多的關注放在了面向B端的行業(yè)大模型身上。
騰訊云MaaS的技術底座是一系列的行業(yè)大模型,包括金融、政府、文旅、傳媒、教育等。
基于這些基礎模型,騰訊云的客戶只要加入自己的場景數據,就可以生成契合自身業(yè)務需要的專屬模型;同時也可根據自身業(yè)務場景需求,“量體裁衣、按需定制”不同參數、不同規(guī)格的模型服務。
如在醫(yī)療健康領域,騰訊云可以幫助醫(yī)療機構構建和部署自己的疾病預測模型,提高診斷準確率和治療效果;在金融領域,騰訊云可以幫助銀行和保險公司構建和部署自己的風險評估模型,提高風險控制能力。
騰訊選擇這個思路,也不難理解。通用大模型需要利用大規(guī)模數據和先進的機器學習技術來訓練和優(yōu)化大型神經網絡模型,但由于很多企業(yè)的業(yè)務數據等都是非常隱私的核心數據,他們根本不會將其放在數據集上進行公開訓練,因此訓練模型的專業(yè)、且高質量的數據收集是非常難的。
同時在通用大模型時,需要大量計算資源和漫長的訓練周期。但是并非每家企業(yè)都有足夠的資源,讓大模型完成訓練和推理,這對企業(yè)來說昂貴且耗時。英偉達曾公布數據顯示,訓練一次大模型,大約100多萬美金。
但大模型在國內落地的需求卻已刻不容緩,為了解決落地問題,推出更有針對性的行業(yè)大模型,并利用數據精調來滿足業(yè)務需要,已經成為國內云服務商曲線解決當下困境的一種選擇。
中金公司指出,騰訊AI大模型內外兼修,騰訊云的大模型能力可應用于騰訊會議等SaaS產品當中,將進一步加強產品的優(yōu)勢及提升變現潛力。
02
大模型落地挑戰(zhàn)重重
在行業(yè)大模型落地的過程中,仍然有不少困難和挑戰(zhàn)需要去解決。
一是計算資源問題。訓練大型模型需要大量的計算資源和存儲資源,與一般服務器相比,GPU服務器的穩(wěn)定性比較低,大模型訓練需要的GPU經常達到上千張卡。
對于許多企業(yè)來說,這可能是一個巨大的負擔,因此尋找更高效的算法和硬件優(yōu)化是解決這一問題的關鍵。
二是數據質量問題。訓練大型模型需要大量的高質量數據,可現實情況卻是,這些數據往往存在噪聲、缺失值等問題,如果導入的數據質量低,那訓練出來的模型也會有問題。
因此,研究人員需要采用各種方法來解決這些問題,例如數據清洗、去噪等,這也導致數據質量或不準確。
三是大模型的應用問題。當把大模型的能力落到某個實際場景的應用產品上時,由于沒有參照,其實是并不好判斷具體該如何用這些模型的。
雖然大模型在某些領域表現出色,但是它們并不一定適用于所有場景。因此,需要根據具體應用場景選擇合適的模型。
此外,大型模型可能會泄露用戶的敏感信息,如醫(yī)療記錄、財務信息等。因此,保護用戶隱私是非常重要的,這需要采取措施確保數據的安全性和隱私性,例如使用加密技術、限制訪問權限等。
總之,大模型的落地面臨著許多挑戰(zhàn),需要克服這些挑戰(zhàn)才能實現其潛力。但從邏輯上講,行業(yè)大模型一定會是在精度相對較低、容錯率較高的行業(yè)先引用,再到精度要求高的地方去。
03
騰訊云有幾分勝算?
在當前的大模型賽道中,谷歌、微軟、亞馬遜等科技巨頭已經占據了主導地位,他們擁有龐大的數據集和先進的算法技術,能夠訓練出具有極高準確性和泛化能力的模型。
此外,國內的百度、阿里巴巴、騰訊等企業(yè)也在積極布局大模型賽道,通過自主研發(fā)和收購等方式獲取更多的技術和數據資源。
騰訊的優(yōu)勢主要是其過去積累的龐大的業(yè)務數據和算力基礎設施,如今騰訊云的解決方案,就是基于這些過去的積累,解決大模型應用落地的痛點。
一方面,騰訊旗下有多個不同的業(yè)務板塊,多年來在金融、傳媒、文旅、工業(yè)等不同領域積累了大量的數據和經驗。以此為養(yǎng)料,騰訊云才能構建起一系列針對不同行業(yè)的行業(yè)大模型,同時針對一些特定的任務進行優(yōu)化,從而確保使用時僅需少了數據就可以達到較好的精調效果。
另一方面,騰訊云在大模型算力方面擁有領先優(yōu)勢。早在今年4月,騰訊云便發(fā)布了面向大模型訓練的新一代HCC高性能計算集群,采用最新一代騰訊云星海自研服務器,結合多層加速的高性能存儲系統,具備3.2Tbps業(yè)界最高互聯帶寬,算力性能提升3倍。
騰訊還有自己的升級框架加速能力太極Angel,是其在人工智能領域的技術積累和創(chuàng)新成果之一,它采用了先進的異步調度優(yōu)化、顯存優(yōu)化、計算優(yōu)化等技術手段,可以顯著提升大模型的訓練和推理速度。
總之,騰訊入場大模型賽道將會對整個行業(yè)產生深遠的影響,推動技術的進步和商業(yè)的發(fā)展。
原文標題 : 騰訊云發(fā)力行業(yè)大模型,有幾分勝算?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調系統高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市