屢破世界紀(jì)錄!UC伯克利博士初創(chuàng)AI公司,又獲數(shù)億融資
“站在風(fēng)口上,啥都能飛起來”。
前段時間,UC伯克利博士、新加坡國立大學(xué)校長青年教授尤洋剛剛率領(lǐng)團(tuán)隊斬獲AAAI 2023杰出論文獎,名震AI圈。時隔不到3個月,尤洋又一次引起AI界矚目。這一次是因?yàn)樗膭?chuàng)業(yè)公司。
5月22日,尤洋創(chuàng)立的潞晨科技宣布完成A輪融資,金額高達(dá)數(shù)億元。
據(jù)公司介紹,本輪融資是潞晨科技成立18個月內(nèi)完成的第三輪融資,此次融資資金將主要用于團(tuán)隊擴(kuò)張和業(yè)務(wù)拓展。
尤洋——久負(fù)盛名,成績斐然
尤洋的出名源自他攻讀UC伯克利計算機(jī)博士的一篇論文,189 頁的論文旨在縮小高性能計算(HPC)和機(jī)器學(xué)習(xí)(ML)之間的差距。
早在研究生期間,他就以第一作者身份獲得2015年國際并行與分布式處理大會(IPDPS)的最佳論文。
尤洋
在2015年以計算機(jī)系第一名的成績從清華大學(xué)畢業(yè)后,尤洋前往美國加州伯克利大學(xué)攻讀博士學(xué)位,師從美國科學(xué)院學(xué)院與工程院院士、ACM/IEEE Fellow James Demmel教授。而后者也是潞晨科技首席戰(zhàn)略官。
James Demmel教授
真正讓尤洋在AI業(yè)內(nèi)享負(fù)盛名的是他提出的一系列AI訓(xùn)練方法。
博士期間,尤洋的主要研究方向是高性能計算與機(jī)器學(xué)習(xí)的交叉領(lǐng)域,研究重點(diǎn)為大規(guī)模深度學(xué)習(xí)訓(xùn)練算法的分布式優(yōu)化。
后來,他和他的團(tuán)隊先是打破了ImageNet訓(xùn)練速度的世界記錄,后又以第一作者發(fā)表論文《Imagenet training in minutes》,獲國際并行處理大會(ICPP)最佳論文獎。
在其論文中提出的LARS優(yōu)化器再次刷新了ImageNet訓(xùn)練速度的世界紀(jì)錄,將 AlexNet模型的訓(xùn)練時間壓縮到24分鐘。到這還遠(yuǎn)沒結(jié)束。一年之后,他在谷歌實(shí)習(xí)期間,又作為一作提出了LAMB優(yōu)化器,成功將BERT的預(yù)訓(xùn)練時間,從原本的三天三夜縮短至76分鐘。
LAMB的卓越性能使其成為機(jī)器學(xué)習(xí)領(lǐng)域的主流優(yōu)化器,并陸續(xù)被谷歌,微軟,英特爾,英偉達(dá)等科技巨頭廣泛應(yīng)用。
LAMB優(yōu)化器的性能
后面尤洋成為新加坡國立大學(xué)計算機(jī)系首位擔(dān)任校長青年教授(Presidential Young Professor)的華人
一路而來,尤洋在AI領(lǐng)域創(chuàng)造了豐碩成果和矚目戰(zhàn)績。在2021年7月,他帶著這些成就回國創(chuàng)立了潞晨科技。
以解放AI生產(chǎn)力為使命
2021年7月尤洋回國創(chuàng)立潞晨科技,9月份就作為首位來自中國企業(yè)的獲獎?wù)邩s獲超算領(lǐng)域高性能專委會杰出新人獎。
而在2021年8月份,潞晨科技獲得由創(chuàng)新工場和真格基金合投的超千萬元種子輪融資;2022年9月,又獲得藍(lán)馳創(chuàng)投領(lǐng)投的600萬美元天使輪融資;2023年5月宣布完成數(shù)億A輪融資,本輪融資是潞晨科技成立18個月內(nèi)完成的第三輪融資,此次融資資金將主要用于團(tuán)隊擴(kuò)張和業(yè)務(wù)拓展。
AI熱潮的來臨,讓全球的資本市場都開始關(guān)注AI領(lǐng)域產(chǎn)業(yè)。既有對沖基金巨鱷全力押注AI“領(lǐng)頭羊”企業(yè),又有知名資本青睞AI新秀。
在這一眾備受矚目的AI產(chǎn)業(yè)中,陸續(xù)出現(xiàn)一批大模型解決方案供應(yīng)商。因?yàn)榘ㄎ④、亞馬遜、谷歌在內(nèi)的巨頭都知道,生成式AI能力“涌現(xiàn)”的背后,是恐怖算力的支撐。
起初的算力可以靠“堆料”實(shí)現(xiàn)。但隨著數(shù)量增加,邊際效應(yīng)遞減加快,只堆數(shù)量費(fèi)用又高,效率又低。而且這個算力支出,就算對巨頭來說也是一筆不能忽視的負(fù)擔(dān)。
這個時候,就需要優(yōu)化技術(shù)。
而潞晨科技Colossal-AI和對應(yīng)的企業(yè)版PaaS平臺,其愿景就是幫客戶達(dá)成最小化模型部署成本、最大化計算效率的效果。
他們這對大模型訓(xùn)練中稀缺的內(nèi)存資源試圖進(jìn)行科學(xué)管理,對GPU、CPU、NVME等異構(gòu)資源進(jìn)行動態(tài)管理。
尤洋表示,“我們希望數(shù)據(jù)都能放到GPU里。但是如果GPU放不下了就放CPU里,CPU放不下就放NVMe里,但同時我們需要最小化CPU、GPU、NVMe之間的數(shù)據(jù)移動,這是最重要的”。
此外還有高效N維并行系統(tǒng)、高維張量并行、低延時推理系統(tǒng)等解決方案來幫助企業(yè)解決在大模型訓(xùn)練中遇到的資源損耗問題。
Colossal-AI GitHub星數(shù)
目前這些系統(tǒng)均匯聚在公司的PaaS平臺中,開源版本Colossal-AI目前也已獲得約3萬顆GitHub星星。在具體服務(wù)方式上,尤洋表示,目前客戶可以通過潞晨的PaaS平臺直接訓(xùn)練自己的模型,潞晨也可以幫助客戶訓(xùn)練模型。
尤洋對潞晨科技的目標(biāo)概括為“以解放AI生產(chǎn)力為使命”,輕飄飄的一句話背后是他和團(tuán)隊這么多年以來的努力。
經(jīng)過一段時間的野蠻生長,AI大模型開始進(jìn)入了實(shí)用和落地的階段。衡量一個大模型的優(yōu)劣,也不再單純的只是參數(shù)、token、多模態(tài)等等。成本,永遠(yuǎn)都是實(shí)際生產(chǎn)中最重要的指標(biāo)。
差異化競爭一直是必要的。可以預(yù)見,像潞晨科技這樣的AI企業(yè)將會越來越多。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市