Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

23 vues

TP 4

Transféré par

nafissa bridah

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

TP 4

Transféré par

nafissa bridah

0% ont trouvé ce document utile (0 vote)

23 vues14 pages

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

0% ont trouvé ce document utile (0 vote)

23 vues14 pages

TP 4

Transféré par

nafissa bridah

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 14

Rechercher à l'intérieur du document

Traitement

du Big Data
TP 4
Analyse du dataset Olympix

Nassim Bahri M1 DSSD

Objectifs du
TP
implémentation d'un job MapReduce
permettant d'analyser le contenu du
dataset olympix_data.csv
Présentation
L'objectif de ce TP sera l'implémentation d'un job MapReduce permettant
d'analyser le contenu du dataset olympix_data.csv.

Le fichier olympix_data.csv à est disponible sur ce lien :

https://github.com/BigDataESEN/datasets/blob/main/olympix_data.csv
Présentation
Les colonnes de ce fichier sont décrites comme suit :

0 Nom de l'athlète 5 Nom de la discipline (sport)

1 Age de l'athlète 6 Nombre de médailles d'or

2 Nom du pays 7 Nombre de médailles en argent

3 Année de participation 8 Nombre de médailles en bronze

4 Date de la cérémonie de clôture 9 Nombre total de médailles

Implémentation
Commençons par créer un projet Maven dans IntelliJ IDEA. Nous utiliserons dans
notre cas JDK 1.8.

Ouvrir le fichier pom.xml, et ajouter les dépendances suivantes pour Hadoop,

HDFS et Map Reduce :

1. hadoop-common
2. hadoop-mapreduce-client-common
3. hadoop-mapreduce-client-core
4. hadoop-hdfs
Implémentation
<dependencies>
Pour ajouter une bibliothèque java, il faut juste
<dependency>
<groupId>org.apache.hadoop</groupId> chercher son nom de le repository de maven.
<artifactId>hadoop-common</artifactId>
<version>3.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-common</artifactId>
<version>3.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-core</artifactId>
<version>3.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId> Choisissez la version.
<version>3.3.2</version>
<scope>test</scope>
</dependency>
</dependencies>
Implémentation
1- Créer la classe OlympixMapper, contenant ce code :
Implémentation
2- Créer la classe OlympixReducer, contenant ce code :
Implémentation
3- Créer la classe Olympix, contenant ce code :
Implémentation
3- Créer la classe Main, contenant ce code : (suite)
Tester Map Reduce sur
votre cluster

Il faut suivre les étapes décrite dans le TP 3

Correction

Le code source du job est disponible

sur l'adresse suivante :

https://github.com/BigDataESEN
/OlympixMapReduce
Références

https://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-
mapreduce-client-core/MapReduceTutorial.html

https://kontext.tech/column/hadoop/265/default-ports-used-by-hadoop-
services-hdfs-mapreduce-yarn
Merci pour votre
attention

Vous aimerez peut-être aussi

Compte Rendu TP 1 Big Data
Document6 pages
Compte Rendu TP 1 Big Data
Gaith Belkacem
Pas encore d'évaluation
Spring Boot par la pratique: Développer les services Rest avec Spring-Boot et Spring-RestTemplate
D'Everand
Spring Boot par la pratique: Développer les services Rest avec Spring-Boot et Spring-RestTemplate
Bertrand Nguimgo
Pas encore d'évaluation
Master 2 Miage-Mbds Projet Big Data Analytics: Analyse de La Clientèle D'un Concessionnaire Automobile Pour La Recommandation de Modèles de Véhicules
Document20 pages
Master 2 Miage-Mbds Projet Big Data Analytics: Analyse de La Clientèle D'un Concessionnaire Automobile Pour La Recommandation de Modèles de Véhicules
Asil
Pas encore d'évaluation
Cours Big Data Avancee Chp2 Data-Ingestion
Document46 pages
Cours Big Data Avancee Chp2 Data-Ingestion
MarwenCherif
Pas encore d'évaluation
Packet Tracer Syslog Avec Topologie Complete
Document3 pages
Packet Tracer Syslog Avec Topologie Complete
Fawzi Ben Salah
100% (1)
Aide Memoire Tuyauterie - Complet
Document60 pages
Aide Memoire Tuyauterie - Complet
jp_rabi
0% (5)
TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
Document6 pages
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
chebinega
Pas encore d'évaluation
tp2 Map Reduce
Document5 pages
tp2 Map Reduce
Raja Bs
Pas encore d'évaluation
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Document7 pages
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Siham DL
Pas encore d'évaluation
TP1 Hadoop
Document7 pages
TP1 Hadoop
Anass Hamzaoui
Pas encore d'évaluation
API Rest Avec Spring Boot
Document40 pages
API Rest Avec Spring Boot
anasriahmed19
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
Examen Big DATA
Document4 pages
Examen Big DATA
zaki worker
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
tp4 - Framework - Struts 2
Document5 pages
tp4 - Framework - Struts 2
halabimeryem89
Pas encore d'évaluation
ExpressTuto - DEV205-P1
Document6 pages
ExpressTuto - DEV205-P1
Hamza Chalout
Pas encore d'évaluation
CBD TP
Document6 pages
CBD TP
zemer
Pas encore d'évaluation
Cours Spring Fondamentaux
Document59 pages
Cours Spring Fondamentaux
Baghdadi Abs
Pas encore d'évaluation
React Redux Tutoriel 1
Document9 pages
React Redux Tutoriel 1
hachemfst
Pas encore d'évaluation
Openldap Server
Document52 pages
Openldap Server
ichbin1199
Pas encore d'évaluation
Active Directory
Document5 pages
Active Directory
Amunox
Pas encore d'évaluation
Chapitre3 NoSQL Avec Redis
Document44 pages
Chapitre3 NoSQL Avec Redis
Godni Rodney
Pas encore d'évaluation
coursNodeJs PDF
Document66 pages
coursNodeJs PDF
rodrigue ntchounkeu
Pas encore d'évaluation
Introduction À Laravel - Cours
Document21 pages
Introduction À Laravel - Cours
Jean marc Konan
Pas encore d'évaluation
SujetEvaluation2017 Correction
Document5 pages
SujetEvaluation2017 Correction
Abdo Elmamoun
100% (4)
TP1 Hadoop3.1.2
Document20 pages
TP1 Hadoop3.1.2
fatima ezzahrae el ghatous
Pas encore d'évaluation
tp1 IRS
Document7 pages
tp1 IRS
Zohra CHANNOUF
100% (1)
Projet PHP
Document13 pages
Projet PHP
Houdadine Abdou
Pas encore d'évaluation
Formation Node Expressjs 617c0eb091742
Document41 pages
Formation Node Expressjs 617c0eb091742
Adil Khalki
Pas encore d'évaluation
Supervision Avec Nagios
Document28 pages
Supervision Avec Nagios
Ali Amaniss
67% (3)
Cours Android
Document111 pages
Cours Android
Abdelhamid El Guarti
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
Document12 pages
TP N°2 - Exemple Word Count Avec Hadoop
ines
Pas encore d'évaluation
Nodejs
Document20 pages
Nodejs
Mohamed El Haddad
Pas encore d'évaluation
Tutorial Spring MVC Crud Jpa Hibernate Postgresql
Document39 pages
Tutorial Spring MVC Crud Jpa Hibernate Postgresql
neji jlassi
100% (1)
TP1 Big Data Installation
Document9 pages
TP1 Big Data Installation
inesabdelali11
Pas encore d'évaluation
Construire Un Tableau de Bord Analytique Avec Django
Document29 pages
Construire Un Tableau de Bord Analytique Avec Django
Hassam
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
Bootstrap Abdali
Document49 pages
Bootstrap Abdali
Youssef
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
Atelier 1 - Projet Spring Boot
Document10 pages
Atelier 1 - Projet Spring Boot
Jouhaina Nasri
100% (1)
Pr. C. Azroumahli: String
Document4 pages
Pr. C. Azroumahli: String
Amine Elyakhloufi
Pas encore d'évaluation
AM2020 1-Copier
Document4 pages
AM2020 1-Copier
Sia Boualem
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
Spring Boot-2
Document31 pages
Spring Boot-2
Jouhaina Nasri
Pas encore d'évaluation
Scala
Document33 pages
Scala
Zouhair Ng
Pas encore d'évaluation
Récupérer Des Données Hadoop Avec Python - Makina Corpus
Document3 pages
Récupérer Des Données Hadoop Avec Python - Makina Corpus
Ahmed Mohamed
Pas encore d'évaluation
TD10
Document6 pages
TD10
broaymene
Pas encore d'évaluation
TP1 Producing SOAP Web Service
Document10 pages
TP1 Producing SOAP Web Service
zineb elfadili
Pas encore d'évaluation
Tuto Spring Jpa
Document17 pages
Tuto Spring Jpa
langageccc
Pas encore d'évaluation
Application 1 - Hadoop - MapReduce
Document10 pages
Application 1 - Hadoop - MapReduce
mahmoud rim
Pas encore d'évaluation
TP4-5 Spark
Document21 pages
TP4-5 Spark
Mazozi safae
Pas encore d'évaluation
TP ASP Net Core MVC
Document8 pages
TP ASP Net Core MVC
BOUZAZI
Pas encore d'évaluation
BigData2A TD3 4 Enonce - 2
Document9 pages
BigData2A TD3 4 Enonce - 2
Souhail Ben Afia
Pas encore d'évaluation
Tutorial Spring MVC Crud Spring Data Postgresql
Document31 pages
Tutorial Spring MVC Crud Spring Data Postgresql
neji jlassi
Pas encore d'évaluation
Programmer en JavaScript
D'Everand
Programmer en JavaScript
Preston Prescott
Évaluation : 4.5 sur 5 étoiles
4.5/5 (2)
Programmer en Java
D'Everand
Programmer en Java
Troy Dimes
Évaluation : 5 sur 5 étoiles
5/5 (4)
Fascicule Php/Mysql: web, #1
D'Everand
Fascicule Php/Mysql: web, #1
Akram Teka
Pas encore d'évaluation
Exploration de la collection d’images: Dévoiler des paysages visuels en vision par ordinateur
D'Everand
Exploration de la collection d’images: Dévoiler des paysages visuels en vision par ordinateur
Fouad Sabry
Pas encore d'évaluation
Initiation à l'écosytème Hadoop
D'Everand
Initiation à l'écosytème Hadoop
Juvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5 (1)
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
D'Everand
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
YVES SITBON
Pas encore d'évaluation
TD3 - Les Fonctions Et Les Modules en Python - CorrigÇ
Document10 pages
TD3 - Les Fonctions Et Les Modules en Python - CorrigÇ
nafissa bridah
Pas encore d'évaluation
TD5 - Programmation OrientÇe Objet
Document1 page
TD5 - Programmation OrientÇe Objet
nafissa bridah
Pas encore d'évaluation
Cours Tableau de Bord
Document55 pages
Cours Tableau de Bord
nafissa bridah
100% (1)
Les Graphiques Dans Power BI
Document3 pages
Les Graphiques Dans Power BI
nafissa bridah
Pas encore d'évaluation
Chapitre 2 - Les Collections de Données en Python
Document61 pages
Chapitre 2 - Les Collections de Données en Python
nafissa bridah
Pas encore d'évaluation
TD4 - Les Fichiers en Python - CorrigÇ
Document4 pages
TD4 - Les Fichiers en Python - CorrigÇ
nafissa bridah
Pas encore d'évaluation
TD2 - Les Collections de Donnçes en Python - CorrigÇ
Document8 pages
TD2 - Les Collections de Donnçes en Python - CorrigÇ
nafissa bridah
Pas encore d'évaluation
AZUUURE
Document30 pages
AZUUURE
nafissa bridah
Pas encore d'évaluation
TD 1 Imp
Document4 pages
TD 1 Imp
nafissa bridah
Pas encore d'évaluation
Big Data Et Cloud - Part Exam
Document69 pages
Big Data Et Cloud - Part Exam
nafissa bridah
100% (1)
GDP 22 23 - L3 - CHAP2 - VF
Document70 pages
GDP 22 23 - L3 - CHAP2 - VF
nafissa bridah
Pas encore d'évaluation
CV TN
Document1 page
CV TN
nafissa bridah
Pas encore d'évaluation
PFE Book 2023-2024: 12 Novembre 2023
Document83 pages
PFE Book 2023-2024: 12 Novembre 2023
nafissa bridah
Pas encore d'évaluation
TD 6 Imp
Document5 pages
TD 6 Imp
nafissa bridah
Pas encore d'évaluation
Definition Couplage For Et Couplage Leger
Document2 pages
Definition Couplage For Et Couplage Leger
nafissa bridah
Pas encore d'évaluation
Les Processus Autorégressifs 12-12-2021 (Partie Finie)
Document20 pages
Les Processus Autorégressifs 12-12-2021 (Partie Finie)
nafissa bridah
100% (1)
TP 5
Document25 pages
TP 5
nafissa bridah
Pas encore d'évaluation
JavaScript Cours
Document53 pages
JavaScript Cours
Abdoulaye Diallo
100% (1)
Documentation Zero Shell
Document7 pages
Documentation Zero Shell
Maximaint Djan
Pas encore d'évaluation
Vsphere Replication 84 Admin
Document166 pages
Vsphere Replication 84 Admin
issamosissam
Pas encore d'évaluation
Sage 100cloud Structure Des Bases Sage 100cloud Description Des Tables de Types Fichier Et Paramètres
Document489 pages
Sage 100cloud Structure Des Bases Sage 100cloud Description Des Tables de Types Fichier Et Paramètres
ouambiwilfred
Pas encore d'évaluation
Word 2000
Document31 pages
Word 2000
Abd El Madjid Benmorsli
Pas encore d'évaluation
18 Nf19 Kaa Liste Sujets Expose
Document3 pages
18 Nf19 Kaa Liste Sujets Expose
khuloud84
Pas encore d'évaluation
TP CATIA Assemblage
Document2 pages
TP CATIA Assemblage
Conception & Fabrication Mécanique
Pas encore d'évaluation
Prototype Pratique STI2022 Tunisie
Document4 pages
Prototype Pratique STI2022 Tunisie
ahlem.kalai.c2i
Pas encore d'évaluation
College Polyvalent Suzanna
Document2 pages
College Polyvalent Suzanna
corguifo
Pas encore d'évaluation
FAS3270 Specifications
Document2 pages
FAS3270 Specifications
Domgouo Kenmoé Silver
Pas encore d'évaluation
UML - Introduction
Document22 pages
UML - Introduction
AbdelhalimBoujemaa
Pas encore d'évaluation
Évaluation Des Connaissances en Informatique
Document5 pages
Évaluation Des Connaissances en Informatique
Lilia Flih
Pas encore d'évaluation
Securité Informatique
Document139 pages
Securité Informatique
جمال سحنون البيضاوي
100% (1)
TD KVM
Document8 pages
TD KVM
iaqowefsccydbebytv
Pas encore d'évaluation
Chapitre 1 - Intro
Document20 pages
Chapitre 1 - Intro
Sabri Mahmoud
Pas encore d'évaluation
Introduction Systéme Exploitation
Document3 pages
Introduction Systéme Exploitation
ben brahem mariem
Pas encore d'évaluation
VB PDF
Document63 pages
VB PDF
abou02
Pas encore d'évaluation
Rapport Greencom Fin-1
Document56 pages
Rapport Greencom Fin-1
Souhail Ghalim
Pas encore d'évaluation
12 JavaScript Revisions
Document8 pages
12 JavaScript Revisions
catalinamihaelapopa
Pas encore d'évaluation
Interaction Homme Machine
Document63 pages
Interaction Homme Machine
Romeo RAJAONARISON
Pas encore d'évaluation
Manuel FTP Webdeploy Webdav Si Vous Avez Choisi Un Acces Par FTP
Document41 pages
Manuel FTP Webdeploy Webdav Si Vous Avez Choisi Un Acces Par FTP
maîga
Pas encore d'évaluation
Lecon 1 W Generalites Outils Metiers Et Langages de Developpement Web PDF
Document30 pages
Lecon 1 W Generalites Outils Metiers Et Langages de Developpement Web PDF
josh
Pas encore d'évaluation
Installer Une Interface Graphique Sur CentOS
Document7 pages
Installer Une Interface Graphique Sur CentOS
ludovic vedrine
Pas encore d'évaluation
Tutorial Catia v5R19
Document70 pages
Tutorial Catia v5R19
Chokri Atef
Pas encore d'évaluation
ACOO Cours1
Document38 pages
ACOO Cours1
Mohamed Amine
Pas encore d'évaluation
Exemple Introductif de RFEM - Logiciel de Calcul de Structure
Document53 pages
Exemple Introductif de RFEM - Logiciel de Calcul de Structure
Grégoire Dupont
100% (1)
Lab 2.1 - Service de Nommage - HOST - TXT Et BIND
Document16 pages
Lab 2.1 - Service de Nommage - HOST - TXT Et BIND
IBRAHIMA DIOUF
Pas encore d'évaluation
Manuel de Jaws PDF Creator
Document85 pages
Manuel de Jaws PDF Creator
Maroin Ibn Chebbi
Pas encore d'évaluation