Aktivieren von Echtzeitanalysen für Hadoop Data Lakes mit GridGain

In diesem Webinar wird erläutert, wie eine In-Memory-Computing-Plattform wie GridGain oder Apache Ignite vorhandene Data-Lake-Architekturen modernisieren und Echtzeitanalysen ermöglichen kann, die sich über Betriebs-, Verlaufs- und Streaming-Datensätze erstrecken.
Data Lakes wie die von Hadoop eignen sich hervorragend für Analysen und Berichte in großem Maßstab.
Hadoop lässt sich horizontal und kostengünstig skalieren und erledigt lange Betriebsabläufe über große Datenmengen hinweg.
Das stetige Anwachsen der Anforderungen an Echtzeitanalysen, bei denen Vorgänge nicht in Minuten, sondern in Sekunden, sondern in Millisekunden ausgeführt werden müssen, hat Hadoop-basierte Lösungen vor neue Herausforderungen gestellt.
In dieser Sitzung auf Englisch beschreibt Denis Magda, GridGain-Vizepräsident von Product und Apache Ignite PMC Chair, Folgendes:

  • Auswahl des richtigen Bereitstellungsmodus und der richtigen Zuständigkeiten bei der Arbeit mit GridGain und Hadoop 
  • Festlegen, welche Vorgänge von GridGain behandelt und welche an Hadoop gesendet werden sollen
  • Verwenden von Spark-DataFrames zum Ausführen von Abfragen mit zusammengeschlossenen Datenbanken (auch als datenbankübergreifende Abfragen bezeichnet), die sich über GridGain und Hadoop erstrecken 
  • So führen Sie das erste Laden von Daten von Hadoop nach GridGain durch
  • Einrichten der bidirektionalen Synchronisation zwischen Hadoop und GridGain


 

Presented by
Denis Magda
Director of product management, GridGain Systems
Share This
Registrieren Sie sich für dieses Webinar