Presto
Home » Technologien »
(Big) Data Warehouse
Presto ist eine verteilte SQL-Query-Engine, die interaktive Anfragen an Datenquellen jeder Größe ermöglicht. Ursprünglich wurde Presto von Facebook entwickelt. Ziel war es, ein Tool zu schaffen, das auch Anfragen an große Datenmengen so schnell beantwortet wie kommerzielle Data Warehouse Lösungen. Facebook nutzt Presto für das 300 Petabyte große Data Warehouse des Unternehmens. Seit Ende 2013 ist das Tool als Open Source-Projekt offen verfügbar. Weitere prominente Nutzer sind Airbnb und Dropbox.
Analysen und Reports auf Basis verschiedener Datenquellen
Presto kann nicht nur auf Hadoop-Clustern mit HDFS operieren, sondern auch auf anderen Datenquellen wie traditionellen relationalen Datenbanken oder Cassandra. Presto ermöglicht außerdem, Daten aus diesen heterogenen Datenquellen miteinander zu verbinden. So können Aggregate aus der “neuen” und “alten” Welt berechnet und daraus individuelle Berichte erstellt werden. Presto übernimmt im Data Warehouse-Kontext den Part der Datenanalyse, sprich Online Analytical Processing (OLAP). Es ist kein Ersatz für relationale Datenbanken wie MySQL, PostgreSQL oder Oracle und unterstützt kein Online Transaction Processing (OLTP).