Databricks 崛起啟示錄

新眸大公司研究組作品
作者|葉靜
編輯|桑明強
在數據庫領域,如果問當下誰最火,那Databricks一定排得上號。
去年8月,距離10億美元的G輪融資剛過去7個月,Databricks再次獲得16億美元H輪融資,身價搖身一變成380億美元,成為外界一致認為的超級獨角獸。一直以來,數據領域備受關注,如果從2007年開始計算,全球的數據量至今已經膨脹了近200倍,數字化被寫入戰略規劃成了各類行業的共識。
在數據量井噴的背景下,上云趨勢也越來越明確,以Snowflake、Databricks為代表的大數據公司應運而生,前者基于AmazonS3打造了云端的數據倉庫,后者除了推出Lakehouse(湖倉一體),現在又押寶機器學習,試圖包管數據在抵達機器學習之前的所有流程。
不同的是,Databricks已經從原來的infra向更廣泛場景延伸,和昔日的伙伴Snowflake同臺競技。與此同時,以AWS為代表的云巨頭,也都曾戰略性投資過Databricks,但現在也都在自研數據分析套件,競合關系漸趨白熱化,讓數據基礎設施的戰火撲朔迷離。
01從0到1
企業的性格往往被它的創始人和技術背景所決定。
十幾年前在UC Berkley的AI實驗室里,Ghodsi和伙伴發起Spark項目:做一個能夠更輕松處理大量數據和機器算法的引擎,并且開源了代碼。相比較多數開源項目,面向的都是底層技術性強要求的infra工程師,spark面向更廣泛的客戶群,同時在上層加了很多的新的API,降低了技術門檻。
因為沒有優秀的開發者社區運營和推廣團隊,Spark變現比較難,之后團隊成員決定成立Databricks,以商業化方式推動Spark社區發展。即便Spark是過去硅谷的頂流產品,但這并沒有讓AWS等巨頭買賬,他們選擇繞過Databricks,直接將Spark集成到自己的產品里。在Databricks賣產品還不如辦Spark峰會收入高的時候,Amazon EMR已經針對Spark實現了幾億營收。
Databricks創始團隊走了一條不被大眾熟知的激進的路:云。
雖然不管對公司還是客戶來說,云可以更快部署,也更容易維護,但正如聯合創始人Reynold Xin所說,大部分的人知道云是未來,但絕不是現在。當時只有小部分風投注資這家初創企業,New Enterprise Associates的投資者Pete Sonsini說:“我們在Databricks的軟件收入為零時投資,認為他們會在大流行中加速發展,也許是一兩個月,每個人都無法及時知道會發生什么”。和Databricks一樣,他們也在賭未來。

圖:Databricks年度融資及估值變動
2013到2015這三年,雖然有硅谷風投支持,Databricks也借力這些資金吸引人才,推出了基于云端的簡化大數據處理平臺Databricks Cloud,但不管是招主管、找融資還是見客戶,Databricks都會被質疑:真的不支持on-prem嗎?
因為背靠Spark,很多客戶甚至愿意年付幾千萬美金讓Databricks提供咨詢定制化項目,但Databricks做的是一個給數據工程師的平臺,這是當時大部分公司聞所未聞的玩法,也是前幾年商途不順的原因之一。值得一提的是,彼時的云界開源前輩Cloudera曾改名“Cloud Era”,可在當時的市場情況下,最終還是轉向了on-prem做定制和售后支持才得以存活。
在這種邏輯下,云廠商把開源軟件拿來經過簡單的封裝,再作為服務賣出去。由于這個過程只需要簡單的部署和調試,工程成本極低,定價也不高,巨頭從中賺走了大部分,這對Databricks來說相當于吸血,怎樣和有錢有人的云巨頭對抗,是Databricks亟需在技術上打造的壁壘。
他們賭的另一條路,是不做數倉。
彼時數據倉庫競爭過于激烈,以亞馬遜為首的巨頭占據了大部分市場份額,Databricks繼續小眾打法:避開紅海,嘗試切入一個新興卻可能會有爆炸性增長的小市場,針對數據科學家、數據工程師和AI的方向做產品。
開源小公司的優勢在于更懂項目,迭代更快,能夠聚焦、死磕產品性能,而公有云大廠很難在單一方向投入最好的工程師。隨著數據量的爆發,云的生態優勢逐漸被認可,加上當時市面上也沒有大量競品,這給Databricks的產品帶來了機會。
另一方面,在2019年微軟投資Databricks之前,正巧CEO納德拉推動云為先的戰略,兩家合作的Azure Databricks進入了微軟的企業許可協議。微軟從一個大數據競爭劣勢的云產品搖身成為業界領先,形成了云巨頭三足鼎立的局面;因為幾乎所有大企業都和微軟有ELA,共生效應之下,客戶原本買云買Office的預算自然流向了Databricks。
有人將Databricks創始團隊比作一群幸運的加州嬉皮士RD,他們信仰技術,信仰來源,信仰共享和長期主義,這些也都成為了Databricks的底色。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













