Résumé BI

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 5

Business Intelligence: Un ensemble de solutions informatiques permettant l’analyse des données de

l’entreprise, afin d’en dégager les informations qualitatives nouvelles qui vont fonder des décisions,
qu’elles soient tactiques ou stratégiques

Entrepôt de Données (DATA WAREHOUSE): Un ED est une collection de données


thématiques, intégrées, non Volatiles et historisées, organisées pour la prise de décision.”

 Thématiques : thèmes par activités majeures


 Intégrées : divers sources de données
 Non volatiles : ne pas supprimer les données du DW
 Historisées : trace des données, suivre l'évolution des indicateurs.
Concepts d’un entrepôt de données :
Fait : C’est le sujet d’analyse. Il permet d’observer une activité. Il lui est associé un niveau de
granularité.
Exemple : CA, Qté vendue, Montant des ventes…
Mesure : C’est une valeur numérique en général représentant une métrique pour analyser
une activité.
Des opérations d’agrégation permettent de l’observer à de niveaux différents.
Exemple : CA mensuel, CA trimestriel, CA annuel…
Dimension : Elle représente un axe d’analyse selon lequel le fait est observé. Son niveau de
granularité doit être le même que celui des faits. Elle contient des attributs.
Exemple : CLIENT, PRODUIT, TEMPS, REGION…
Attribut de dimension : Ceux sont des descripteurs textuels qui permettent de décrire les
faits à analyser.
Exemple : CLIENT, PRODUIT, TEMPS, RÉGION…
Hiérarchie : Les dimensions peuvent être déployées en hiérarchies fonctionnelles,
organisationnelles, spatiales ou temporelles..
Exemple : MOIS, TRIMESTRE, SEMESTRE, ANNÉE…
---------------------------------------------------------------------------------------------------
Dans un modèle multidimensionnel, tous les faits ont un même niveau de granularité
quelque soit les dimensions choisies
Exemple : Pour la dimension TEMPS : c’est le jour ; pour un fait : c’est le montant de ventes
d’’un produit…
Il existe 3 formes de modèles multidimensionnels :
1. Le modèle en étoile (Star schema)
Le modèle en étoile est une représentation fortement dénormalisée qui assure un haut niveau de
performance des requêtes même sur de gros volumes de données.

Une ''table'' de faits : identifiants des tables de dimensions et une ou plusieurs mesures
Plusieurs tables de dimension : descripteurs des dimensions
Une granularité définie par les identifiants dans la table des faits.
Avantages :

 Facilité de navigation

 Performances.

 Gestion des agrégats

 Fiabilité des résultats

Inconvénients :

 Redondances dans les dimensions

 Alimentation complexe.
2. Le modèle en flocon de neige (Snowflaked schema)

 Le modèle de l’ED doit être simple à comprendre


 On peut augmenter sa lisibilité en regroupant certaines dimensions
 On définit ainsi des hiérarchies
 Celles-ci peuvent être géographiques, temporelles, organisationnelles,
fonctionnelles…
3. Le modèle en constellation (Factflaked schema)

Le processus d’ETL
L'ETL (Extract, Transform, Load) est un processus d'intégration des données qui permet de
transférer des données brutes d'un système source, de les préparer pour une utilisation en
aval et de les envoyer vers une base de données
Principales forces de l'ETL

 Optimisé pour les structures de données


 Périodique, par lots (batch)
 Déplacer de gros volumes de données en une seule étape
 Transformations de données complexes (calculs, agrégations…)
 Planification contrôlée par l'administrateur
 Nombreux outils avec API pour accroître la productivité
 Réutilisation des objets et des transformations ETL
ETL Principaux défis

 Commercialisation des outils lente


 Gestion des changements
 Données transférées indépendamment du besoin réel
 Sollicite beaucoup les systèmes de stockage
 Données de la source d'origine deviennent indépendantes une fois dans l’ED
 Grandes exigences pour la staging area
 Flux de données unidirectionnels (de la source vers la cible)
 Pas de support de mise à jour de multi-sites

Pour prendre les bonnes décisions, il faut savoir :


• Pourquoi le CA a-t-il baissé?
• Comment a-t-il baissé?
• Dans quelle gamme de produits?
• Dans quels pays, quelles régions?
• Dans le portefeuille de clientèle de quels commerciaux?
• Dans quels segments de distribution?
• N avait-on pas une baisse semblable en octobre chaque année?
Système Informatique Décisionnelle (SID) : Terme générique qui englobe les applications,
l’infrastructure, les outils et les meilleures pratiques permettant l’accès et l’analyse de
l’information afin d’améliorer et d’optimiser les décisions et les performances.
Pourquoi Construire un Système Décisionnel?
• Avoir une vision globale homogène et cohérente des informations manipulées par les
différents départements
• Accéder directement à l’information nécessaire
• Donner un sens unique aux données de gestion (marge, CA...)
Donnée
• Résultat direct d’une mesure
• Peut être collectée par un outil de mesure, ou peut être présente dans une base de
données
• Ne permet pas de prendre de décision sur une action à lancer
Information
• Donnée à laquelle un sens et une interprétation ont été donnés
• Permet au responsable de prendre une décision sur une action
Connaissance
• Résultat d’une réflexion sur les informations analysées
• Se base sur les expériences, les idées, valeurs, avis de personnes consultées
Sagesse
• État d’esprit général de discernement final sur le contenu et de jugement de bon sens
• Permet de lancer des actions d’adaptation de l’organisation, des personnes, des processus
et outils
ODS(Operational Data Store)

est une base de données conçue pour centraliser les données issues de sources hétérogènes afin de
faciliter les opérations d'analyse et de reporting

 Data Mart

Magasin de données orienté sujet, non volatile, mis à la disposition des utilisateurs dans un contexte
décisionnel décentralisé, ciblé pour un usage particulier

Data Mining

Ensemble d’outils, méthodes et technologies d’analyse mises en œuvre pour définir des tendances,
pour segmenter l’information ou pour établir des corrélations entre les données

Vous aimerez peut-être aussi