Databricks 崛起啟示錄
02超級加倍
讓所有人感到意外的是,2019年后,Databricks以絕無僅有的加速度在增長。
截至2021年2月,公司已經(jīng)籌集了近20億美元資金,包括由富蘭克林鄧普頓領(lǐng)投的10億美元G輪融資,此時Databricks估值已經(jīng)達到280億美元;在經(jīng)過最新輪融資后,Databricks380億的身價與三年前的62億相比暴增了近13倍。
基本面決定價值,價值決定價格,如果將Databricks的成功僅歸結(jié)于對技術(shù)犀利的洞察,借助了巨人的肩膀和好運氣,這還遠遠不夠。基于開源的創(chuàng)新是Databricks成長的關(guān)鍵,從大數(shù)據(jù)領(lǐng)域殺入云計算和AI,它的產(chǎn)品矩陣里包括DeltaLake、MLflow、Koalas以及開源分析引擎Spark等殺傷利器。
其中,超過80%的用戶使用Delta Lake;MLFlow為數(shù)據(jù)科學(xué)家提供了標準化的開源框架,下載量以每月80萬的速度增長,擁有比Spark更多的用戶;而Koalas可以讓數(shù)據(jù)科學(xué)家在筆記本電腦上使用Pandas編程,調(diào)用幾個API就可以將工作部署到大型的分布式Spark集群上,把Pandas社區(qū)的數(shù)據(jù)科學(xué)創(chuàng)新帶給了Spark用戶。
幫助其他企業(yè)構(gòu)建自己的AI能力,透露出了Databricks的野心:從BI到AI,構(gòu)建一個企業(yè)AI平臺,因為Ghodsi認為,在企業(yè)計算領(lǐng)域,行業(yè)還沒有出現(xiàn)頭部的企業(yè)AI平臺。
除了軟件產(chǎn)品本身,Databricks的業(yè)務(wù)模式也有所不同。
傳統(tǒng)的開源商業(yè)模式是軟件免費,廠商收取支持和服務(wù)費用,這在on-prem里或許可行,但在云的世界就不一定了。Databricks在開發(fā)、軟件運行、運營和托管方面向客戶收費,采用SaaS開源的盈利模式,客戶可以在本地開源平臺下載免費的基礎(chǔ)軟件,同時也可以下載開源公司打造的其他付費版本。
不高估開源,也不低估市場,Ghodsi說:“在云端托管開源項目并把它們租給用戶,客戶流失率更低,利潤增長更快”。SaaS租賃模式下,Databricks的核心知識產(chǎn)權(quán)沒有存放在它所贊助的開源軟件項目中,而是在它用來監(jiān)管云端軟件的工具中,這樣避免了泄露的風(fēng)險。
根據(jù)報告,Databricks最新ARR (年度經(jīng)常性收入)達到6億美元,相當(dāng)于Snowflake同財年12億營業(yè)收入的一半,截至目前,后者市值近670億美元,如果按照兩倍之比來簡單預(yù)估,Databricks380億的估值也比較合理。以新估值計算,Databricks的價值是當(dāng)前ARR的63倍,相較于2020年的4.25億美元,ARR近30%的增長率讓投資者對它未來的收入十分看好。
圖:Snowflake與Databricks定價對比(來源:官網(wǎng))
另一方面,通過對比官網(wǎng)收費方式發(fā)現(xiàn),雖然是平臺租出服務(wù)器的計算資源,但這些服務(wù)器整個系統(tǒng)都建立在主要的云廠商的基礎(chǔ)服務(wù)上。以Snowflake(左)為例,同樣是以每秒粒度使用的計算資源付費,Snowflake是平臺和云廠商打包收費方式,客戶對底層服務(wù)界面(如EC2)和上游的Snowflake的成本花費要一次性付清,但比例是怎樣無從得知,而打包之后Snowflake需要支付給云廠商另外成本,這在無形中增加了費用風(fēng)險。
Databricks(右)的玩法是分開收費,用戶的賬單主要分為兩部分:常規(guī)的底層云廠商服務(wù)器租用成本,以及Databricks在這些服務(wù)器上的功能費用?蛻羰褂玫讓悠鲿r,費用單獨付給云廠商,并不算在Databricks的營收里。
所以如果對比營收,比如2020年的Snowflake營收近6億,但刨去付給云廠商的費用,和Databricks4億多的營收相比,也差不了多少。而這既是Databricks毛利率比Snowflake高的原因,也是前者賺錢能力強的體現(xiàn)。有觀點猜測Databricks遲遲不上市的原因,如果根據(jù)Ghodsi的說法,是為了避免二級市場所帶來的波動,或許收費方式被迫改變等不可預(yù)測因素也在里面。
03天時地利人和
根據(jù)官網(wǎng)顯示,除了為數(shù)據(jù)科學(xué)家、數(shù)據(jù)領(lǐng)導(dǎo)者與數(shù)據(jù)工程師提供角色解決方案,Databricks還利用大數(shù)據(jù)和AI為廣告和營銷、通訊服務(wù)商、教育、能源、聯(lián)邦政府、金融、醫(yī)療等13類行業(yè)提供服務(wù)。
從類別數(shù)量上,Databricks要多于Snowflake,此時全球已經(jīng)有7000 多家組織(包括荷蘭銀行、康泰納仕、H&M 集團、再生元和殼牌)依靠 Databricks 實現(xiàn)大規(guī)模數(shù)據(jù)工程、協(xié)作數(shù)據(jù)科學(xué)、全生命周期機器學(xué)習(xí)和業(yè)務(wù)分析。
通常情況下,企業(yè)客戶在進行數(shù)據(jù)架構(gòu)時,第三方平臺提供數(shù)據(jù)湖方案,在數(shù)據(jù)湖中做一些常見的數(shù)據(jù)工程;同時會有一個數(shù)據(jù)倉庫,存放相當(dāng)于數(shù)據(jù)湖5%-10%的結(jié)構(gòu)化數(shù)據(jù),來做BI等簡單的數(shù)據(jù)分析。
但由于數(shù)據(jù)分裂在兩個系統(tǒng)上,針對同一個客戶問題分析,不同團隊有不同權(quán)限,因而會看到不同版本的同一份數(shù)據(jù),當(dāng)?shù)贸霾煌Y(jié)論后,做商業(yè)決策的團隊不相信數(shù)據(jù),進而導(dǎo)致底層數(shù)據(jù)平臺失信,這是個很致命的問題。
將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)結(jié)合到一個地方,讓客戶在不移動底層數(shù)據(jù)的情況下執(zhí)行數(shù)據(jù)科學(xué)和商業(yè)智能工作,是大數(shù)據(jù)發(fā)展的一個關(guān)鍵變化。于是,Databricks決定力推Lakehouse,能夠直接在數(shù)據(jù)湖的低成本存儲上,實現(xiàn)類似于數(shù)據(jù)倉中的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)管理的功能,可支持BI到AI所有的工作流。
從Databricks的網(wǎng)頁介紹上看,無論是數(shù)據(jù)工程、數(shù)據(jù)科學(xué),還是機器學(xué)習(xí)都要依靠Lakehouse運行,加上過去使用低成本對象存儲的數(shù)據(jù)湖的訪問速度很慢,如今DB SQL提高了分析質(zhì)量和性能,使數(shù)據(jù)湖在大數(shù)據(jù)集上的處理與數(shù)據(jù)倉庫相媲美。
“Lakehouse是一個新賽道,這是一場地盤爭奪戰(zhàn)”,H輪融資之后,Ghodsi表示,這筆資金將主要用于加速Lakehouse的產(chǎn)品創(chuàng)新和市場開拓。與此同時,Databricks透露保留所有主要公共云的選擇和靈活性,并將Lakehouse發(fā)展成傳統(tǒng)數(shù)據(jù)倉庫的替代品。
越來越多的企業(yè)樂于看到Databricks的實力和發(fā)展?jié)摿,這和它本身的商業(yè)邏輯有關(guān),業(yè)內(nèi)傳統(tǒng)企業(yè)如Teradata在營收額上雖高過Databricks好幾個身位,但市值仍徘徊在40多億美元。大劑量的資金注入后,Databricks選擇并購來填補產(chǎn)品路線圖中的空白或不足,重點是機器學(xué)習(xí)和數(shù)據(jù)初創(chuàng)公司,以及擴大與云公司的合作伙伴關(guān)系。
“云、開源、機器學(xué)習(xí),這三個方面已成為每家企業(yè)戰(zhàn)略的核心。我們真的很幸運能夠處在這三大趨勢的中心位置上!盙hodsi在接受采訪時說到。如果說2019年前看好Databricks的小部分風(fēng)投是賭趨勢,如今匆匆進場的其他機構(gòu)也并沒有遲到,因為在他們眼里,這家獨角獸仍具備難以估量的增長能力。
本文系新眸原創(chuàng)
原文標題 : 「數(shù)據(jù)新星」Databricks 崛起啟示錄
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市