Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

7 vues

Chapitre 1

Transféré par

Tareb Nesrine amira

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Chapitre 1

Transféré par

Tareb Nesrine amira

0% ont trouvé ce document utile (0 vote)

7 vues20 pages

Copyright

Formats disponibles

PPTX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pptx, pdf ou txt

0% ont trouvé ce document utile (0 vote)

7 vues20 pages

Chapitre 1

Transféré par

Tareb Nesrine amira

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pptx, pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 20

Rechercher à l'intérieur du document

BIG DATA

CHAPITRE 1 : INTRODUCTION AU BIG DATA

M1 - SII (2022-2023)
Plan du cours
1) Introduction au Big Data

2) Fondements de l’environnement Hadoop

3) Les modèles de données : les architectures NoSQL

4) Acquisition de données

5) Exploitation des données

2
Qu’est ce que le BIG DATA

 Changement en volume

 Changement d’origine des données (origines variées)

 Changement de structure (semi-structurées, non-structurées)

 Capacités de stockage accrues (stockage dans le Cloud)

 Changement des traitements (batch, flux etc…)

 Evolution des usages (Avertissements, traitements des flux)

3
Qu’est ce que le BIG DATA

Le Big Data fait référence aux volumes de données dynamiques,

volumineux et disparates créés par des personnes, des outils et
des machines. Elle nécessite une technologie innovante et
évolutive pour collecter, héberger et analyser analytiquement la
grande quantité de données collectées afin d’obtenir des
informations en temps réel sur les clients, les risques, les
bénéfices, la performance et la gestion de la productivité d’une
entreprise. (Source : Le Cabinet d’Audit E&Y)

4
Les V du Big Data

5
La Volumétrie (Volume)

En 2021, en 1 minute
d’internet 3 787 915
giga bytes de données
transférées

6
Les V du Big Data

7
La vitesse (vélocité)

Augmentation des besoins de

traitement :

Comment conserver une bonne vitesse ?

Traitement Big Data

Origine Google

8
La vitesse (vélocité)

MapReduce

Traitement parallélisé en Batch

Traitement périodique

9
La valeur

 La maitrise des 3V génère de la valeur

o Valeur stratégique
o Valeur opérationnelle
o Nouvelles opportunités

10
La variété
Le Big Data
Mégadonnées

Structurées Semi-structurées Non-structurées

 Données de reconnaissances faciales

 Logs
 Données sociales
 Mobiles
 Capteurs (IoT : Internet des objets)
11
Les débuts du Big Data

Google

Début des années 2000

Indexation du web entier

Publications de congrès

12
- Le client contacte le maître
Les débuts du Big Data - Distribution des données
- Commodity hardware
Google File System

13
Les débuts du Big Data
Map = Traitement de chaque élément
MapReduce Reduce = Regroupement

14
Les débuts du Big Data

MapReduce a tout son intérêt dans le Big Data car il permet le passage
à l’échelle de traitements sur de gros volumes de données.

Cependant, il faut une infrastructure logicielle dédiée qui permette

d’exécuter le schéma MapReduce de manière distribuée sur un cluster
de machines.

Cette infrastructure c’est le framework Hadoop de la fondation

Apache.

15
Le projet Hadoop

Hadoop est un framework open source écrit en Java et fait partie des
projets de la fondation Apache depuis 2008. Il a été conçu pour
réaliser des traitements distribués sur des données massives.

• La version stable la plus récente est la version 3.3.1

• Hadoop est composé principalement :
 du modèle de programmation MapReduce
 du système de gestion de fichiers HDFS

16
L’écosystème Hadoop

17
L’écosystème Hadoop

18
L’écosystème Hadoop

19
Exemple d’application

Vous aimerez peut-être aussi

Reprogrammation Moteur
Document43 pages
Reprogrammation Moteur
brayan filin
100% (3)
Introduction Big Data
Document58 pages
Introduction Big Data
jouini
Pas encore d'évaluation
Ch1 Big Data
Document21 pages
Ch1 Big Data
Tareb Nesrine amira
Pas encore d'évaluation
Big Data Et Data Mining
Document14 pages
Big Data Et Data Mining
Retro Store
Pas encore d'évaluation
Chap1-Big Data Pour Entreprise Et Ecosystème Hadoop - Oct 2023
Document37 pages
Chap1-Big Data Pour Entreprise Et Ecosystème Hadoop - Oct 2023
Khalid Harrati
Pas encore d'évaluation
Bigdata
Document11 pages
Bigdata
meftahi najet
Pas encore d'évaluation
Cours de Big Data LF2 IG ESB
Document32 pages
Cours de Big Data LF2 IG ESB
dramanediarra9553
Pas encore d'évaluation
BigData MAB CHAPITRES 1 ET 2
Document104 pages
BigData MAB CHAPITRES 1 ET 2
mahjoub nouha
Pas encore d'évaluation
Juno SlidesCarnival
Document43 pages
Juno SlidesCarnival
Maria Boulefaa
Pas encore d'évaluation
Big Data
Document15 pages
Big Data
cindy ange
Pas encore d'évaluation
Support Site
Document37 pages
Support Site
Christian Nguepnang
Pas encore d'évaluation
Big Data - Part1
Document30 pages
Big Data - Part1
Beji Maram
Pas encore d'évaluation
Presentation 2013 Bigdata GSF PDF
Document67 pages
Presentation 2013 Bigdata GSF PDF
Nour Imane
Pas encore d'évaluation
Cours Big Data-3
Document64 pages
Cours Big Data-3
memecasse28
Pas encore d'évaluation
Big Data
Document10 pages
Big Data
Smaïl Ben
Pas encore d'évaluation
ESCT - 2023 - 2024 - 3LMKG - Big - Data en Assurance Avec Python 17 02 2024
Document39 pages
ESCT - 2023 - 2024 - 3LMKG - Big - Data en Assurance Avec Python 17 02 2024
khlifiyassine71
Pas encore d'évaluation
Big DATA MASTER 2 G - Nie Logiciel - R - Seau v1.0 R
Document58 pages
Big DATA MASTER 2 G - Nie Logiciel - R - Seau v1.0 R
triocom223
Pas encore d'évaluation
Cours Big Data
Document26 pages
Cours Big Data
memecasse28
Pas encore d'évaluation
Cours Big Data
Document38 pages
Cours Big Data
ayadii safa
Pas encore d'évaluation
Introduction Au BigData
Document27 pages
Introduction Au BigData
hajar.filali4
Pas encore d'évaluation
Big Data
Document11 pages
Big Data
Salah
Pas encore d'évaluation
Introduction A Big Data
Document48 pages
Introduction A Big Data
br18
Pas encore d'évaluation
Chapitre 03 Partie 01
Document49 pages
Chapitre 03 Partie 01
khliaissa46
Pas encore d'évaluation
Leçon1 - Introduction Au Big Data
Document42 pages
Leçon1 - Introduction Au Big Data
Mido pro
Pas encore d'évaluation
Big Data Mining & Text Mining (Artefacts Team 4BI4)
Document35 pages
Big Data Mining & Text Mining (Artefacts Team 4BI4)
Hazem Ben Sassi
100% (1)
Cours: Préparation À La Certification: Big Data
Document42 pages
Cours: Préparation À La Certification: Big Data
Safa Zayeti
Pas encore d'évaluation
C01
Document16 pages
C01
Serigne Ndour
Pas encore d'évaluation
Big Data Trends Slideshare Edits FR-FR
Document13 pages
Big Data Trends Slideshare Edits FR-FR
Niubi
Pas encore d'évaluation
Big Data Version1
Document14 pages
Big Data Version1
Amd Yousra
Pas encore d'évaluation
Complement
Document28 pages
Complement
emma
Pas encore d'évaluation
Chapitre1: Introduction: Big Data
Document31 pages
Chapitre1: Introduction: Big Data
MIMOUNI WAFAA
Pas encore d'évaluation
Chapitre 1 Big Data
Document19 pages
Chapitre 1 Big Data
ouma ima
Pas encore d'évaluation
Cours 1 Architecture - Big Data Fondements de BIG DATA
Document49 pages
Cours 1 Architecture - Big Data Fondements de BIG DATA
alaska8fouad
Pas encore d'évaluation
Chapitre 1 - Le Big Data
Document33 pages
Chapitre 1 - Le Big Data
zq5f26ftgp
Pas encore d'évaluation
Documentation Big DATA R
Document43 pages
Documentation Big DATA R
triocom223
Pas encore d'évaluation
Big Data Et Machine Learning (3e Éd) (Pirmin Lemberger Marc Batty (Lemberger Etc.)
Document378 pages
Big Data Et Machine Learning (3e Éd) (Pirmin Lemberger Marc Batty (Lemberger Etc.)
Guy-Franck Kossi
Pas encore d'évaluation
Partie Hadoop Et Ecosystème
Document93 pages
Partie Hadoop Et Ecosystème
Safa '
Pas encore d'évaluation
BD Nosql Part1
Document23 pages
BD Nosql Part1
NIKIEMA Francklin Powell
Pas encore d'évaluation
1 Big Data Analytics Enabled Smart Financial-Converti FR
Document44 pages
1 Big Data Analytics Enabled Smart Financial-Converti FR
Yassine Feif
Pas encore d'évaluation
Les Enjeux Du Big Data Pour La Mise en Place Des Smart-Grids
Document19 pages
Les Enjeux Du Big Data Pour La Mise en Place Des Smart-Grids
Salim Mehenni
Pas encore d'évaluation
BIG DATA Et R
Document6 pages
BIG DATA Et R
Šməì Ĺĕ
Pas encore d'évaluation
Coursbigdatachap1 170929114637 PDF
Document52 pages
Coursbigdatachap1 170929114637 PDF
hamdi ouardi
Pas encore d'évaluation
Intro BIG DATA
Document34 pages
Intro BIG DATA
Fernovy Gesner
Pas encore d'évaluation
Chap1 2 3 4 5
Document45 pages
Chap1 2 3 4 5
syslinux2000
Pas encore d'évaluation
Chap1 IntroBigData
Document31 pages
Chap1 IntroBigData
Cyrine Akacha
Pas encore d'évaluation
Chapitre 1
Document23 pages
Chapitre 1
Anass Roman
Pas encore d'évaluation
BigData Chapitre0 1
Document30 pages
BigData Chapitre0 1
Ridouan YOUNS
Pas encore d'évaluation
Bigdata Opensource
Document21 pages
Bigdata Opensource
Kent Mermet Au Louis
100% (1)
Cours Base de Données II V 2020 - 2023-12-04 18-52-30
Document309 pages
Cours Base de Données II V 2020 - 2023-12-04 18-52-30
Mehdi Bayi
Pas encore d'évaluation
Inbound 8189111358623730193
Document66 pages
Inbound 8189111358623730193
alebdi
Pas encore d'évaluation
Big Data
Document13 pages
Big Data
capodelcapo
100% (1)
Cours 2 Architecture - Big Data Hadoop - HDFS
Document54 pages
Cours 2 Architecture - Big Data Hadoop - HDFS
alaska8fouad
Pas encore d'évaluation
Master M2 Big Data - Conduite de Projet Big Data
Document53 pages
Master M2 Big Data - Conduite de Projet Big Data
Sofiane Soo
100% (1)
Cours Framework Big DATA - DR SEBRI (3153)
Document14 pages
Cours Framework Big DATA - DR SEBRI (3153)
Salma Khlifi
Pas encore d'évaluation
Résumé Big Data
Document6 pages
Résumé Big Data
El Moumne Nihal
Pas encore d'évaluation
Big Data
Document16 pages
Big Data
Chemli Takwa
Pas encore d'évaluation
Titre PDF
Document2 pages
Titre PDF
Anonymous 1P2S4tbM
Pas encore d'évaluation
Les Bases de Données Nosql: Pr. Soussi Nassima
Document112 pages
Les Bases de Données Nosql: Pr. Soussi Nassima
Sokaina Elharouri
Pas encore d'évaluation
Big Data
Document24 pages
Big Data
El Arbi Abdellaoui Alaoui
100% (1)
Initiation à l'écosytème Hadoop
D'Everand
Initiation à l'écosytème Hadoop
Juvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5 (1)
Le Big Data: Que fait-on de nos données numériques ?
D'Everand
Le Big Data: Que fait-on de nos données numériques ?
. Numerica
Pas encore d'évaluation
RDGI0048 Fra C DriverIrbppourPromia
Document42 pages
RDGI0048 Fra C DriverIrbppourPromia
Andy Cholakian
Pas encore d'évaluation
Base HTML11
Document6 pages
Base HTML11
Ab Godrar
Pas encore d'évaluation
SOMFY Ax24Ns Notice 20060101
Document12 pages
SOMFY Ax24Ns Notice 20060101
Jean-Claude Noel
Pas encore d'évaluation
Câblage D
Document4 pages
Câblage D
YASSINE
Pas encore d'évaluation
Guide USAGER - Duplicata
Document6 pages
Guide USAGER - Duplicata
kinavuidiceline
Pas encore d'évaluation
22-Eclairage de Securite Et Alarme Incendie
Document18 pages
22-Eclairage de Securite Et Alarme Incendie
Walid Jaf
Pas encore d'évaluation
Les Symbol Pneumatiques
Document7 pages
Les Symbol Pneumatiques
وليد تلي
100% (1)
Instaurer La Confiance en Ligne, Une Affaire de Pros
Document20 pages
Instaurer La Confiance en Ligne, Une Affaire de Pros
Gueye Makhtar
Pas encore d'évaluation
Approche de La Maintenance
Document6 pages
Approche de La Maintenance
Zalfeni Aymen
100% (1)
TECHNOLOGIE DES CIRCUITS LOGIQUES (TTL - Cmos) PDF
Document3 pages
TECHNOLOGIE DES CIRCUITS LOGIQUES (TTL - Cmos) PDF
Farid Afifi
Pas encore d'évaluation
Découvrir Le Métier de Community Manager
Document18 pages
Découvrir Le Métier de Community Manager
Kouakou Obed Charité Moaé
Pas encore d'évaluation
CELULOSA
Document176 pages
CELULOSA
lusanz1515
Pas encore d'évaluation
Vb. Net: Parcours
Document39 pages
Vb. Net: Parcours
Énomis Douyou
Pas encore d'évaluation
TD Ressorts 2020
Document11 pages
TD Ressorts 2020
workshop cam2021
Pas encore d'évaluation
Nouveau Document Microsoft Office Word
Document15 pages
Nouveau Document Microsoft Office Word
Abbassi Karim
Pas encore d'évaluation
Kit Butée D'amortisseur Auto Pas Chères Retrait 1h Ou Livraison 72h Carter-Cash
Document1 page
Kit Butée D'amortisseur Auto Pas Chères Retrait 1h Ou Livraison 72h Carter-Cash
drogbayoann
Pas encore d'évaluation
APsystems-Energy-Communication-Unit-ECU-C-User-manual - Rev1.6 - FR
Document34 pages
APsystems-Energy-Communication-Unit-ECU-C-User-manual - Rev1.6 - FR
ponpon1013
Pas encore d'évaluation
Rapport Sam Update2
Document38 pages
Rapport Sam Update2
meite moustapha
Pas encore d'évaluation
Module D
Document31 pages
Module D
axell sama
Pas encore d'évaluation
DHB - 99900-08-03 LICCON1
Document147 pages
DHB - 99900-08-03 LICCON1
mourad ouanene
Pas encore d'évaluation
Leçon 6&7
Document15 pages
Leçon 6&7
armel tchongouang
Pas encore d'évaluation
TD #2-Système Lean-Kanban
Document2 pages
TD #2-Système Lean-Kanban
M'sakni Mouhamed Youssef
Pas encore d'évaluation
Rapport HVAC IBERAL
Document6 pages
Rapport HVAC IBERAL
Azeddine LA
100% (1)
Ec - GMP332 - TP Fab - Bwanga - Abanda
Document23 pages
Ec - GMP332 - TP Fab - Bwanga - Abanda
Yannick Atsina
Pas encore d'évaluation
Document2 Fiches Individuelles Cumulees de La Liste Provisoire D (263 Candidats Retenus)
Document526 pages
Document2 Fiches Individuelles Cumulees de La Liste Provisoire D (263 Candidats Retenus)
patiencedalahai3
Pas encore d'évaluation
Comment Savoir Quel Programme Utilise Le Port TCP 80, 8080 Ou Autres - Faq
Document1 page
Comment Savoir Quel Programme Utilise Le Port TCP 80, 8080 Ou Autres - Faq
Arold Stone
Pas encore d'évaluation
Offre Apprentissage CEREMA NC DLAB ADL DATA Scientist VF
Document3 pages
Offre Apprentissage CEREMA NC DLAB ADL DATA Scientist VF
Tony Lefevre
Pas encore d'évaluation
TS ISO 12100 Dec 2013 Publié
Document2 pages
TS ISO 12100 Dec 2013 Publié
Faress Rabi
Pas encore d'évaluation
Document Divalto
Document28 pages
Document Divalto
Raouf
Pas encore d'évaluation