Développer des applications pour Hadoop 2.X Hortonworks sous Windows

4 jours (28 heures) - 25500 Euros HT

 Formation Perspectives et évolution de la DSI

PROGRAMME

Jour 1
DÉCOUVRIR HADOOP 2.X

• L’architecture de Hadoop 2.X

• The Hortonworks Data Platform (HDP)

LE SYSTÈME DE FICHIERS DISTRIBUÉ HDFS

• Architecture fonctionnelle de HDFS
- Exercice d’interaction en ligne de commande avec HDFS

ALIMENTER HDFS EN DONNÉES

• Prise en main de l’outil Flume

• Prise en main de l’outil Sqoop
- Utilisation de Sqoop pour transférer des données entre Hadoop et Microsoft SQL Server

LE FRAMEWORK MAPREDUCE

• Architecture et fonctionnement général de MapReduce
- Exemples d’utilisation d’un job MapReduce


Jour 2


INTRODUCTION À PIG

• Types et mots-clés dans Pig
- Exploration de données avec Pig

• Mots-clés et fonctionnalités avancées dans Pig

• Jointures dans Pig

• Astuces d’optimisation de scripts Pig
- Analyse de cas d’usages métier divers avec Pig


Jour 3


PROGRAMMATION HIVE

• Types et mots-clés dans Hive

• Concept de table et base de données dans Hive

• Présentation et explication des types de jointures
- Démonstration de jointures
- Analyse de cas d’usages métier

UTILISER HCATALOG

• Fonctionnement et utilisation de HCatalog
- Démonstration du fonctionnement de HCatalog


Jour 4


PROGRAMMATION HIVE AVANCÉE

• Les vues dans Hive

• Les différents formats de stockage des tables Hive

• Optimisation de scripts Hive
- Illustration des fonctions avancées

LE DRIVER ODBC DE HIVE

• Connexion de Microsoft Excel à Hadoop

HADOOP 2.X ET YARN

• Architecture de YARN
- Démonstration d’une application YARN

CRÉER ET UTILISER UN WORKFLOW OOZIE

• Workflow et coordinateur Oozie

• Actions possibles avec Oozie

OBJECTIF

Identifier les principaux composants de l’écosystème Hadoop
Expérimenter les outils d’exploration et d’analyse de données
Connecter Hadoop à Microsoft SQL Server et Excel

PUBLIC

Analyste
Statisticien
Développeur

PRÉREQUIS

Connaissances de base en programmation
Une connaissance du SQL et une familiarité avec Microsoft Windows sont un plus
Pas de connaissance préalable d’Hadoop requise

Demande d'informations


Liste des sous-pages