DÉCOUVRIR HADOOP 2.X
• L’architecture de Hadoop 2.X
• The Hortonworks Data Platform (HDP)
LE SYSTÈME DE FICHIERS DISTRIBUÉ HDFS
• Architecture fonctionnelle de HDFS
- Exercice d’interaction en ligne de commande avec HDFS
ALIMENTER HDFS EN DONNÉES
• Prise en main de l’outil Flume
• Prise en main de l’outil Sqoop
- Utilisation de Sqoop pour transférer des données entre Hadoop et Microsoft SQL Server
LE FRAMEWORK MAPREDUCE
• Architecture et fonctionnement général de MapReduce
- Exemples d’utilisation d’un job MapReduce
Jour 2
INTRODUCTION À PIG• Types et mots-clés dans Pig
- Exploration de données avec Pig
• Mots-clés et fonctionnalités avancées dans Pig
• Jointures dans Pig
• Astuces d’optimisation de scripts Pig
- Analyse de cas d’usages métier divers avec Pig
Jour 3
PROGRAMMATION HIVE• Types et mots-clés dans Hive
• Concept de table et base de données dans Hive
• Présentation et explication des types de jointures
- Démonstration de jointures
- Analyse de cas d’usages métier
UTILISER HCATALOG• Fonctionnement et utilisation de HCatalog
- Démonstration du fonctionnement de HCatalog
Jour 4
PROGRAMMATION HIVE AVANCÉE• Les vues dans Hive
• Les différents formats de stockage des tables Hive
• Optimisation de scripts Hive
- Illustration des fonctions avancées
LE DRIVER ODBC DE HIVE• Connexion de Microsoft Excel à Hadoop
HADOOP 2.X ET YARN• Architecture de YARN
- Démonstration d’une application YARN
CRÉER ET UTILISER UN WORKFLOW OOZIE• Workflow et coordinateur Oozie
• Actions possibles avec Oozie