Chapitre 1
Chapitre 1
Chapitre 1
M1 - SII (2022-2023)
Plan du cours
1) Introduction au Big Data
4) Acquisition de données
Changement en volume
4
Les V du Big Data
5
La Volumétrie (Volume)
En 2021, en 1 minute
d’internet 3 787 915
giga bytes de données
transférées
6
Les V du Big Data
7
La vitesse (vélocité)
Origine Google
8
La vitesse (vélocité)
MapReduce
9
La valeur
o Valeur stratégique
o Valeur opérationnelle
o Nouvelles opportunités
10
La variété
Le Big Data
Mégadonnées
Publications de congrès
12
- Le client contacte le maître
Les débuts du Big Data - Distribution des données
- Commodity hardware
Google File System
13
Les débuts du Big Data
Map = Traitement de chaque élément
MapReduce Reduce = Regroupement
14
Les débuts du Big Data
MapReduce a tout son intérêt dans le Big Data car il permet le passage
à l’échelle de traitements sur de gros volumes de données.
15
Le projet Hadoop
Hadoop est un framework open source écrit en Java et fait partie des
projets de la fondation Apache depuis 2008. Il a été conçu pour
réaliser des traitements distribués sur des données massives.
16
L’écosystème Hadoop
17
L’écosystème Hadoop
18
L’écosystème Hadoop
19
Exemple d’application
20