Administrer la plateforme Hadoop 2.X Hortonworks

4 jours (28 heures) - 25500 Euros HT

Certification 280 Euros HT

 Formation Perspectives et évolution de la DSI

PROGRAMME

Jour 1


INTRODUCTION À LA PLATEFORME HADOOP 2.X HORTONWORKS

• L’architecture de Hadoop 2.X

• The Hortonworks Data Platform (HDP)

• Mise en pratique : « Se connecter à son cluster »

LE SYSTÈME DE FICHIERS DISTRIBUÉ HDFS

• Architecture de HDFS

PRÉREQUIS D’UNE INSTALLATION

• Prérequis logiciels et matériels

• Mise en pratique : « Configurer l’environnement et installer la HDP 2.X »

CONFIGURER HADOOP

• Configuration d’Ambari

• Mises en pratique :
- « Ajouter un noeud au cluster »
- « Contrôler les services de la HDP »

S’ASSURER DE L’INTÉGRITÉ DES DONNÉES

• Architecture de contrôle d’intégrité et de réplication

• Commandes d’administration d’HDFS

• Mise en pratique : « Vérifier les données sur HDFS avec fsck »


Jour 2


CONFIGURER HDFS

• Introduction à la configuration d’HDFS

• Les webservices d’HDFS

• Mise en pratique : « Monter HDFS sur un système de fichiers local »

L’ARCHITECTURE DE YARN ET DE MAPREDUCE

• Architecture de YARN

• Architecture de MapReduce

• Ordonnancement des tâches dans YARN

• Mise en pratique : « Dépanner un programme MapReduce »

• Mise en pratique : « Configurer le Capacity Scheduler »

TRAITEMENT DES DONNÉES SUR HADOOP 2.X

• L’ingestion de données dans Hadoop

• Mise en pratique : « Utiliser distcp pour copier des données vers un cluster »


Jour 3


ADMINISTRATION DE HIVE

• Architecture de Hive

• Administration des bases et des tables Hive

• Mise en pratique : « Comprendre les tables Hive »

TRANSFÉRER DES DONNÉES AVEC SQOOP

• Architecture de Sqoop

• Mise en pratique : « Utiliser Sqoop »

DÉPLACER LES DONNÉES D’USAGE AVEC FLUME

• Architecture de Flume

• Configuration de Flume

• Mise en pratique : « Installer et tester Flume »

GESTION DES WORKFLOWS AVEC OOZIE

• Architecture de Oozie

• Configuration de Oozie

• Mise en pratique : « Lancer des workflows Oozie »

SUPERVISION DES SERVICES HDP

• Architecture d’Ambari

• Supervision avec Ambari et les outils Java


Jour 4


MAINTENANCE DES NOEUDS ET SERVICES DE LA HDP

• Architecture d’un cluster Hadoop

• Ajouter et retirer des noeuds et services

• Mise en pratique : « Ajouter et retirer des noeuds »

SAUVEGARDE ET RESTAURATION

• Configurer les mécanismes de sauvegarde et de restauration d’HDFS

• Mise en pratique : « Utiliser les snapshots HDFS »

TOPOLOGIES RÉSEAU

• Configurer une topologie réseau dans Hadoop 2.X

• Mise en pratique : « Configurer une topologie réseau »

ARCHITECTURE DE LA HAUTE DISPONIBILITÉ D’HDFS

• Architecture de haute disponiblité

• Mise en pratique : « Configurer HDFS en mode haute disponibilité avec Ambari»

SÉCURITÉ

• Architecture de sécurité dans Hadop 2.X

• Mise en pratique : « Sécuriser un cluster Hadoop 2.X »

OBJECTIF

Dimensionner un cluster Hadoop
Installer un cluster Hadoop
Configurer un cluster Hadoop
Sécuriser un cluster Hadoop
Maintenir un cluster Hadoop

PUBLIC

Architecte
Administrateur

PRÉREQUIS

Connaissances de l’environnement Linux

Demande d'informations


Liste des sous-pages