4 jours (28 heures) - 25500 Euros HT
Certification 280 Euros HT
INTRODUCTION À LA PLATEFORME HADOOP 2.X HORTONWORKS • L’architecture de Hadoop 2.X • The Hortonworks Data Platform (HDP) • Mise en pratique : « Se connecter à son cluster » LE SYSTÈME DE FICHIERS DISTRIBUÉ HDFS • Architecture de HDFS PRÉREQUIS D’UNE INSTALLATION • Prérequis logiciels et matériels • Mise en pratique : « Configurer l’environnement et installer la HDP 2.X » CONFIGURER HADOOP • Configuration d’Ambari • Mises en pratique : - « Ajouter un noeud au cluster » - « Contrôler les services de la HDP » S’ASSURER DE L’INTÉGRITÉ DES DONNÉES • Architecture de contrôle d’intégrité et de réplication • Commandes d’administration d’HDFS • Mise en pratique : « Vérifier les données sur HDFS avec fsck » Jour 2 CONFIGURER HDFS • Introduction à la configuration d’HDFS • Les webservices d’HDFS • Mise en pratique : « Monter HDFS sur un système de fichiers local » L’ARCHITECTURE DE YARN ET DE MAPREDUCE • Architecture de YARN • Architecture de MapReduce • Ordonnancement des tâches dans YARN • Mise en pratique : « Dépanner un programme MapReduce » • Mise en pratique : « Configurer le Capacity Scheduler » TRAITEMENT DES DONNÉES SUR HADOOP 2.X • L’ingestion de données dans Hadoop • Mise en pratique : « Utiliser distcp pour copier des données vers un cluster » Jour 3 ADMINISTRATION DE HIVE • Architecture de Hive • Administration des bases et des tables Hive • Mise en pratique : « Comprendre les tables Hive » TRANSFÉRER DES DONNÉES AVEC SQOOP • Architecture de Sqoop • Mise en pratique : « Utiliser Sqoop » DÉPLACER LES DONNÉES D’USAGE AVEC FLUME • Architecture de Flume • Configuration de Flume • Mise en pratique : « Installer et tester Flume » GESTION DES WORKFLOWS AVEC OOZIE • Architecture de Oozie • Configuration de Oozie • Mise en pratique : « Lancer des workflows Oozie » SUPERVISION DES SERVICES HDP • Architecture d’Ambari • Supervision avec Ambari et les outils Java Jour 4 MAINTENANCE DES NOEUDS ET SERVICES DE LA HDP • Architecture d’un cluster Hadoop • Ajouter et retirer des noeuds et services • Mise en pratique : « Ajouter et retirer des noeuds » SAUVEGARDE ET RESTAURATION • Configurer les mécanismes de sauvegarde et de restauration d’HDFS • Mise en pratique : « Utiliser les snapshots HDFS » TOPOLOGIES RÉSEAU • Configurer une topologie réseau dans Hadoop 2.X • Mise en pratique : « Configurer une topologie réseau » ARCHITECTURE DE LA HAUTE DISPONIBILITÉ D’HDFS • Architecture de haute disponiblité • Mise en pratique : « Configurer HDFS en mode haute disponibilité avec Ambari» SÉCURITÉ • Architecture de sécurité dans Hadop 2.X • Mise en pratique : « Sécuriser un cluster Hadoop 2.X » |