Databricks
![]() | |
![]() | |
Тип | бізнес і програмне забезпечення ![]() |
---|---|
Правова форма | приватна компанія ![]() |
Галузь | індустрія програмного забезпечення ![]() |
Засновано | 2013 ![]() |
Засновник(и) | Алі Годсі[en], Енді Конвінскі, Арсалан Таваколі-Шираджі, Іон Стоіка[en], Матей Захарія, Патрік Венделл, Рейнольд Сін[en] |
Штаб-квартира | Сан-Франциско[1] ![]() |
Президент | Ion Stoicad ![]() |
Очільник(и) | Алі Годсіd ![]() |
Виторг | ▲ $813 млн. (2022)[2] |
Співробітники | 4000 осіб (2022)[3] |
databricks.com(англ.) ![]() | |
![]() ![]() |
Databricks — американська компанія з корпоративного програмного забезпечення, заснована творцями Apache Spark[4]. Databricks розробляє веб-платформу для роботи зі Spark, яка забезпечує автоматизоване керування кластерами[en] та блокноти[en] в стилі IPython.
Databricks виріс з проекту AMPLab[en] в Каліфорнійському університеті в Берклі, який був залучений до створення Apache Spark, фреймворка розподілених обчислень з відкритим кодом, побудованого на основі Scala. Компанію заснували Алі Годсі[en], Енді Конвінскі, Арсалан Таваколі-Шираджі, Іон Стоіка[en], Матей Захарія[5], Патрік Венделл і Рейнольд Сін[en].
У листопаді 2017 року компанія була анонсована як сторонній сервіс Microsoft Azure через інтеграцію Azure Databricks[6].
Компанія розробляє проект з відкритим кодом Delta Lake, який спрямований на забезпечення надійності озер даних, при використанні у машинному навчанні та задачах поширених у науці про дані[7].
У червні 2020 року Databricks придбала інструмент з відкритим кодом Redash, який допомогає науковцям і аналітикам даних візуалізувати та створювати інтерактивні інформаційні панелі своїх даних[8].
У лютому 2021 року Databricks разом з Google Cloud забезпечили інтеграцію з рушієм Google Kubernetes і платформою BigQuery від Google[9]. Fortune оцінив Databricks як одне з найкращих великих «робочих місць для міленіалів» у 2021 році[10]. Тоді ж компанія заявила, що її продукцією користуються понад 5000 організацій[11].
У серпні 2021 року Databricks завершила свій восьмий раунд фінансування, зібравши 1,6 мільярда доларів і оцінка компанії склала 38 мільярдів доларів[12].
У жовтні 2021 року Databricks здійснила друге придбання німецької компанії 8080 Labs, яка створила платформу для розробки без використання коду[en]. Інструмент дослідження даних, створений цією компанією, який не вимагає кодування при використанні, — bamboolib[13].
У вересні 2013 року Databricks оголосила, що залучила 13,9 мільйона доларів від Andreessen Horowitz, і заявила, що прагне запропонувати альтернативу системі MapReduce від Google[14][15]. Microsoft була відомим інвестором Databricks у 2019 році, залученим у Series E на невизначену суму[16][17]. Компанія залучила фінансування в розмірі 1,9 мільярда доларів, включаючи 1 мільярд доларів США Series G віл холдінгу Franklin Templeton та отримала грошову оцінку в 28 мільярдів доларів у лютому 2021 року. Серед інших інвесторів — Amazon Web Services, CapitalG[en] (компанія, що розвивається в рамках Alphabet, Inc.) і Salesforce Ventures[11].
Серія | Дата | Сума (млн дол.) | Провідні інвестори |
---|---|---|---|
A | 2013 | 13.9[14] | Andreessen Horowitz |
B | 2014 | 33[18] | New Enterprise Associates[en] |
C | 2016 | 60[19] | New Enterprise Associates[en] |
D | 2017 | 140[20] | Andreessen Horowitz |
E | Feb. 2019 | 250[21] | Andreessen Horowitz |
F | Oct. 2019 | 400[22] | Andreessen Horowitz |
G | Jan. 2021 | 1,000[23] | Franklin Templeton Investments |
H | Aug. 2021 | 1,600[24] | Morgan Stanley |
Databricks розробляє та продає хмарну платформу даних, використовуючи маркетинговий термін «Lakehouse», що є словозлиттям на основі термінів «сховище даних» та «озеро даних[en]»[25]. Lakehouse від Databricks базується на фреймворку Apache Spark з відкритим кодом, який дозволяє виконувати аналітичні запити до напівструктурованих даних без використання традиційної схеми бази даних[26].
Delta Engine від Databricks був запущений у червні 2020 року як новий механізм запитів, який розташовується поверх Delta Lake, щоб підвищити продуктивність запитів[27]. Він сумісний з Apache Spark і MLflow, які також є проектами з відкритим кодом від Databricks[28].
У листопаді 2020 року компанія Databricks представила Databricks SQL (раніше відома як SQL Analytics) для запуску бізнес-аналітики та звітності на основі озер даних. Аналітики можуть запитувати набори даних безпосередньо за допомогою стандартного SQL або використовувати конектори продуктів для безпосередньої інтеграції з інструментами бізнес-аналітики, такими як Tableau, Qlik, Looker і ThoughtSpot[en][29].
Databricks також пропонує платформу для інших задач, зокрема для машинного навчання, зберігання та обробки даних, потокової аналітики та бізнес-аналітики[30].
Компанія також створила проекти з відкритим кодом Delta Lake, MLflow і Koalas, які охоплюють інженерію даних[en], науку про дані та машинне навчання[31]. Окрім створення платформи Databricks, компанія спільно організувала масові відкриті онлайн-курси по Spark[32] та конференцію для спільноти Spark під назвою Data + AI Summit[33], раніше відому як Spark Summit.
Штаб-квартира Databricks знаходиться в Сан-Франциско[34]. Також компанія працює в Канаді, Великій Британії, Нідерландах, Сінгапурі, Австралії, Німеччині, Франції, Японії, Китаї, Індії та Бразилії.
- ↑ https://www.cnbc.com/2020/06/16/databricks-disruptor-50.html
- ↑ Databricks reaches $813M ARR.
- ↑ http://archive.today/2022.08.05-113318/https://www.wsj.com/amp/articles/databricks-says-it-has-surpassed-1-billion-in-annualized-revenue-11659693601
- ↑ Dwoskin, Elizabeth (9 червня 2016). This is where the real action in artificial intelligence takes place. Washington Post. Процитовано 16 серпня 2016.
- ↑ Zaharia, Matei. Matei Zaharia. Процитовано 16 серпня 2016.
- ↑ Microsoft makes Databricks a first-party service on Azure. TechCrunch (амер.). Процитовано 6 квітня 2021.
{{cite web}}
: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання) - ↑ Databricks launches Delta Lake, an open source data lake reliability project. VentureBeat (амер.). 24 квітня 2019. Процитовано 6 квітня 2021.
- ↑ Databricks acquires Redash, a visualizations service for data scientists. TechCrunch (амер.). Архів оригіналу за 25 березня 2022. Процитовано 6 квітня 2021. [Архівовано 2022-03-25 у Wayback Machine.]
- ↑ Databricks brings its lakehouse to Google Cloud. TechCrunch (амер.). Архів оригіналу за 27 липня 2021. Процитовано 18 лютого 2021. [Архівовано 2021-07-27 у Wayback Machine.]
- ↑ 100 Best Large Workplaces for Millennials. Fortune. 16 червня 2021. Процитовано 16 липня 2021.
- ↑ а б Konrad, Alex (2 лютого 2021). Databricks Raises $1 Billion At $28 Billion Valuation, With The Cloud's Elite All Buying In. Forbes (англ.). Процитовано 29 липня 2021.
- ↑ Mellor, Chris (1 вересня 2021). Databricks raises data lake of cash at monstrous $38bn valuation. Blocks & Files. Процитовано 4 вересня 2021.
- ↑ Eric Rosenbaum (6 жовтня 2021). $38 billion software start-up Databricks makes acquisition to leave code behind. CNBC. Процитовано 20 лютого 2022.
- ↑ а б Harris, Derrick (25 вересня 2013). Databricks raises $14M from Andreessen Horowitz, wants to take on MapReduce with Spark. Архів оригіналу за 15 січня 2022. Процитовано 28 вересня 2014. [Архівовано 2022-01-15 у Wayback Machine.]
- ↑ Lorica, Ben (25 вересня 2013). Databricks aims to build next-generation analytic tools for Big Data. O'Reilly Media. Процитовано 28 вересня 2014.
- ↑ Databricks raises $250M at a $2.75B valuation for its analytics platform. TechCrunch (амер.). Архів оригіналу за 19 жовтня 2022. Процитовано 8 квітня 2021. [Архівовано 2022-10-19 у Wayback Machine.]
- ↑ Novet, Jordan (5 лютого 2019). Microsoft used to scare start-ups but is now an 'outstandingly good partner,' says Silicon Valley investor Ben Horowitz. CNBC (англ.). Процитовано 6 квітня 2021.
- ↑ Miller, Ron (30 червня 2014). Databricks Snags $33M In Series B And Debuts Cloud Platform For Processing Big Data. TechCrunch. Процитовано 28 вересня 2014.
- ↑ Shieber, Jonathan. Databricks raises $60 million to be big data's next great leap forward. TechCrunch. Процитовано 16 грудня 2016.
- ↑ Databricks Secures $140 Million to Accelerate Analytics and Artificial Intelligence in the Enterprise. Databricks (амер.). Процитовано 16 травня 2019.
- ↑ Databricks' $250 Million Funding Supports Explosive Growth and Global Demand for Unified Analytics; Brings Valuation to $2.75 Billion. Databricks (амер.). Процитовано 5 лютого 2019.
- ↑ Databricks announces $400M round on $6.2B valuation as analytics platform continues to grow. TechCrunch (амер.). Архів оригіналу за 6 вересня 2020. Процитовано 24 жовтня 2019. [Архівовано 2020-09-06 у Wayback Machine.]
- ↑ Databricks raises $1B at $28B valuation as it reaches $425M ARR. Tech Crunch (амер.). Процитовано 14 лютого 2021.
- ↑ Databricks raises $1.6B at $38B valuation as it blasts past $600M ARR. Tech Crunch (амер.). Процитовано 1 липня 2021.
- ↑ Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei (January 2021). Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics (PDF). Conference on Innovative Data Systems Research. Процитовано 29 липня 2021.
- ↑ With massive $1B infusion, Databricks takes aim at IPO and rival Snowflake. SiliconANGLE (амер.). 1 лютого 2021. Процитовано 8 квітня 2021.
- ↑ Databricks Cranks Delta Lake Performance, Nabs Redash for SQL Viz. Datanami. 24 червня 2020. Процитовано 8 квітня 2021.
- ↑ Databricks launches Delta Lake, an open source data lake reliability project. VentureBeat (амер.). 24 квітня 2019. Процитовано 8 квітня 2021.
- ↑ Databricks launches SQL Analytics. TechCrunch (амер.). Процитовано 8 квітня 2021.
{{cite web}}
: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання) - ↑ Brust, Andrew. Databricks, champion of data "lakehouse" model, closes $1B series G funding round. ZDNet (англ.). Процитовано 8 квітня 2021.
- ↑ The Two Sigma Ventures Open Source Index. Two Sigma Ventures (англ.). Процитовано 8 квітня 2021.
- ↑ Databricks to run two massive online courses on Apache Spark. Databricks (амер.). 2 грудня 2014. Процитовано 16 грудня 2016.
- ↑ Data + AI Summit. Databricks (амер.). Процитовано 8 квітня 2021.
- ↑ staff, CNBC com (16 червня 2020). 36. Databricks. CNBC (англ.). Процитовано 8 квітня 2021.
- Damji, Jules; Wenig, Brooke; Das, Tathagata; Lee, Denny (2020). Learning Spark (PDF) (English) . O'Reilly Media. ISBN 978-1-492-05004-9.