Tags Anu Sudarsan Dain Sundstrom datalake datawarehouse David Phillips Eric Hwang facebook Grzegorz Kokosiński Hive Kamil Bajda-Pawlikowski Karol Sobczak Lukasz Osipiuk Martin Traverso Matt Fuller Piotr Findeisen PrestDB Presto Presto Software Foundation PrestoSQL Starburst Teradata Trino Wojciech Biela
Focus: La licorne de l’analytique Starburst a été valorisée 3,35 milliards en moins de 5 ans
L’histoire de Starburst commence (déjà vu…) par un projet open source initié par un géant d’Internet.
Pour résoudre les problèmes de performance et d’évolutivité de ses 250 pétaoctets de données, liés à la technologie Hive, Facebook confie le développement d’une nouvelle solution à quatre de ses ingénieurs en 2012.
Martin Traverso, David Phillips, Dain Sundstrom et Eric Hwang lancent le développement de Presto pour réaliser des requêtes performantes à l’échelle, en accédant à des données déjà stockées via des connecteurs. Donc, sans les recopier.
En bref: un moteur de requête distribué (évoluant donc à l’échelle) et utilisant le langage SQL pour adresser des informations stockées dans toute base de données ou datalake avec des “requêtes fédérées”. Presto est mis en production en 2013, et déposé en open source par Facebook dans la foulée dès l’automne (licence Apache, mais pas Projet Apache).
Le projet retient très vite attention des géants d’Internet, confronté au même problème de mise à l’échelle comme Netflix, LinkedIn et autres.
L’article revient sur l’histoire de cette licorne, qui n’a pas fini de faire parler d’elle.
Un tableau reprend les principaux faits et chiffres de la société.
Lire aussi notre interview de Justin Borgman, cofondateur et CEO de Starburst.