Activation de l'analyse en temps réel pour Hadoop Data Lakes avec GridGain

Ce webinaire explique comment une plate-forme informatique en mémoire telle que GridGain ou Apache Ignite peut moderniser les architectures data lake existantes, permettant ainsi des analyses en temps réel couvrant des ensembles de données opérationnelles, historiques et en flux continu.
Les Data Lakes, tels que ceux fournis par Hadoop, constituent un excellent choix pour l'analyse et la création de rapports à grande échelle.
Hadoop évolue à l'horizontale et est rentable et permet de mener à bien des opérations de longue durée couvrant de grands ensembles de données.
Cependant, la croissance continue des exigences en matière d'analyse en temps réel - où les opérations doivent être terminées en quelques secondes plutôt qu'en quelques minutes, ou en millisecondes plutôt qu'en quelques secondes - a créé de nouveaux défis pour les solutions basées sur Hadoop.
Au cours de cette session en Anglais, Denis Magda, vice-président des produits de GridGain et président du conseil Apache Ignite PMC, décrit:

  • Comment choisir le bon mode de déploiement et les bonnes responsabilités lorsque vous travaillez avec GridGain et Hadoop
  • Comment déterminer quelles opérations doivent être gérées par GridGain et lesquelles doivent être envoyées à Hadoop
  • Comment utiliser Spark DataFrames pour exécuter des requêtes fédérées (ou bases de données croisées) couvrant GridGain et Hadoop
  • Comment effectuer le chargement initial des données de Hadoop à GridGain
  • Comment configurer la synchronisation bidirectionnelle entre Hadoop et GridGain

 

Presented by
Denis Magda
Director of product management, GridGain Systems
Share This
Inscrivez-vous à ce webinaire