Analyse de données pour Hadoop 2.X Hortonworks avec HBase

2 jours (14 heures) - Tarif sur demande

 Formation Perspectives et évolution de la DSI

PROGRAMME

Jour 1

GENERALITES

• Rappels rapides sur l'écosystème Hadoop

• Hortonworks

• HDFS

• Yarn

• Mise en pratique : lancement d’une tâche MapReduce

INTRODUCTION A HBASE

• Fonctionnement général

• Mise en pratique :
- Utilisation du client HBase
- Importation d’une table MySQL avec Sqoop

ARCHITECTURE

• Fonctionnement et cycle de vie des régions HBase

• Orchestration du cluster avec Zookeeper

• Mise en pratique : manipulation des noeuds ZooKeeper

SERVICES ET OPERATIONS

• HMaster et RegionServer

• Opérations : get, put, scans

• Mise en pratique : prise en main des fichiers de configuration


Jour 2


COMMANDES

• Manipulation des données

• Manipulation des tables

• Réparations

• Réplication de clusters

• Mise en pratique : utilisation des commandes

CONFIGURATION ET DISTRIBUTIONS

• Configuration HBase et Zookeeper

• Distributions HBase

• Backups

• Mises en pratique :
- Backup et snapshots
- Exports avec Pig, imports avec Importtsv

CONCEPTION D’UN SCHEMA HBASE

• Modèle de données HBase

• Designer les clés de lignes : patterns et techniques

• Modèle de table pour une application de messagerie

• Familles de colonnes

• Mise en pratique :
- Familles de colonnes
- Etude de cas : application de suivi de colis

OPTIMISATION

• Blocs, caches, filtres de bloom, memstore, logs

• Filtres de colonnes

• Mise en pratique : manipulation des filtres de bloom

DEMONSTRATION : REALISATION D’UN CLIENT JAVA HBASE

OBJECTIF

Découvrir le fonctionnement de HBase
Savoir configurer et utiliser HBase
Modéliser une table HBase
Prendre en main et utiliser les différents outils à disposition

PUBLIC

Architecte
Administrateur
Développeur de logiciel
Analyste

PRÉREQUIS

Connaissance de l’environnement Linux
Connaissance des bases de données relationnelles

Demande d'informations


Liste des sous-pages