訂閱
糾錯
加入自媒體

騰訊云發(fā)力行業(yè)大模型,有幾分勝算?

2023-06-26 09:14
證券之星
關注

自BERT出現之后,大模型成為AI領域的主流技術趨勢,業(yè)界也因此掀起兩輪熱潮。國內外眾多大廠、創(chuàng)業(yè)公司都在爭先推出各自的大模型,字節(jié)跳動亦被認為將在今年年中推出大模型。

如今騰訊也出手了。6月19日,騰訊云發(fā)布MaaS(模型即服務)能力全景圖,計劃打造一站式行業(yè)大模型精選商店,以協助客戶構建專屬大模型及應用。騰訊云的入場,會給賽道帶來什么?在激烈的競爭中,騰訊云有幾分勝算?

01

助力大模型落地

目前市面上谷歌、微軟、百度、阿里等大廠公布的都是一個基礎的通用大模型。與此前諸多公司急切高調推出的通用大模型不同,騰訊將更多的關注放在了面向B端的行業(yè)大模型身上。

騰訊云MaaS的技術底座是一系列的行業(yè)大模型,包括金融、政府、文旅、傳媒、教育等。

基于這些基礎模型,騰訊云的客戶只要加入自己的場景數據,就可以生成契合自身業(yè)務需要的專屬模型;同時也可根據自身業(yè)務場景需求,“量體裁衣、按需定制”不同參數、不同規(guī)格的模型服務。

如在醫(yī)療健康領域,騰訊云可以幫助醫(yī)療機構構建和部署自己的疾病預測模型,提高診斷準確率和治療效果;在金融領域,騰訊云可以幫助銀行和保險公司構建和部署自己的風險評估模型,提高風險控制能力。

騰訊選擇這個思路,也不難理解。通用大模型需要利用大規(guī)模數據和先進的機器學習技術來訓練和優(yōu)化大型神經網絡模型,但由于很多企業(yè)的業(yè)務數據等都是非常隱私的核心數據,他們根本不會將其放在數據集上進行公開訓練,因此訓練模型的專業(yè)、且高質量的數據收集是非常難的。

同時在通用大模型時,需要大量計算資源和漫長的訓練周期。但是并非每家企業(yè)都有足夠的資源,讓大模型完成訓練和推理,這對企業(yè)來說昂貴且耗時。英偉達曾公布數據顯示,訓練一次大模型,大約100多萬美金。

但大模型在國內落地的需求卻已刻不容緩,為了解決落地問題,推出更有針對性的行業(yè)大模型,并利用數據精調來滿足業(yè)務需要,已經成為國內云服務商曲線解決當下困境的一種選擇。

中金公司指出,騰訊AI大模型內外兼修,騰訊云的大模型能力可應用于騰訊會議等SaaS產品當中,將進一步加強產品的優(yōu)勢及提升變現潛力。

02

大模型落地挑戰(zhàn)重重

在行業(yè)大模型落地的過程中,仍然有不少困難和挑戰(zhàn)需要去解決。

一是計算資源問題。訓練大型模型需要大量的計算資源和存儲資源,與一般服務器相比,GPU服務器的穩(wěn)定性比較低,大模型訓練需要的GPU經常達到上千張卡。

對于許多企業(yè)來說,這可能是一個巨大的負擔,因此尋找更高效的算法和硬件優(yōu)化是解決這一問題的關鍵。

二是數據質量問題。訓練大型模型需要大量的高質量數據,可現實情況卻是,這些數據往往存在噪聲、缺失值等問題,如果導入的數據質量低,那訓練出來的模型也會有問題。

因此,研究人員需要采用各種方法來解決這些問題,例如數據清洗、去噪等,這也導致數據質量或不準確。

三是大模型的應用問題。當把大模型的能力落到某個實際場景的應用產品上時,由于沒有參照,其實是并不好判斷具體該如何用這些模型的。

雖然大模型在某些領域表現出色,但是它們并不一定適用于所有場景。因此,需要根據具體應用場景選擇合適的模型。

此外,大型模型可能會泄露用戶的敏感信息,如醫(yī)療記錄、財務信息等。因此,保護用戶隱私是非常重要的,這需要采取措施確保數據的安全性和隱私性,例如使用加密技術、限制訪問權限等。

總之,大模型的落地面臨著許多挑戰(zhàn),需要克服這些挑戰(zhàn)才能實現其潛力。但從邏輯上講,行業(yè)大模型一定會是在精度相對較低、容錯率較高的行業(yè)先引用,再到精度要求高的地方去。

03

騰訊云有幾分勝算?

在當前的大模型賽道中,谷歌、微軟、亞馬遜等科技巨頭已經占據了主導地位,他們擁有龐大的數據集和先進的算法技術,能夠訓練出具有極高準確性和泛化能力的模型。

此外,國內的百度、阿里巴巴、騰訊等企業(yè)也在積極布局大模型賽道,通過自主研發(fā)和收購等方式獲取更多的技術和數據資源。

騰訊的優(yōu)勢主要是其過去積累的龐大的業(yè)務數據和算力基礎設施,如今騰訊云的解決方案,就是基于這些過去的積累,解決大模型應用落地的痛點。

一方面,騰訊旗下有多個不同的業(yè)務板塊,多年來在金融、傳媒、文旅、工業(yè)等不同領域積累了大量的數據和經驗。以此為養(yǎng)料,騰訊云才能構建起一系列針對不同行業(yè)的行業(yè)大模型,同時針對一些特定的任務進行優(yōu)化,從而確保使用時僅需少了數據就可以達到較好的精調效果。

另一方面,騰訊云在大模型算力方面擁有領先優(yōu)勢。早在今年4月,騰訊云便發(fā)布了面向大模型訓練的新一代HCC高性能計算集群,采用最新一代騰訊云星海自研服務器,結合多層加速的高性能存儲系統,具備3.2Tbps業(yè)界最高互聯帶寬,算力性能提升3倍。

騰訊還有自己的升級框架加速能力太極Angel,是其在人工智能領域的技術積累和創(chuàng)新成果之一,它采用了先進的異步調度優(yōu)化、顯存優(yōu)化、計算優(yōu)化等技術手段,可以顯著提升大模型的訓練和推理速度。

總之,騰訊入場大模型賽道將會對整個行業(yè)產生深遠的影響,推動技術的進步和商業(yè)的發(fā)展。

       原文標題 : 騰訊云發(fā)力行業(yè)大模型,有幾分勝算?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號