Memoire-De-Master-2 APPLICATION DES ZABBIX
Memoire-De-Master-2 APPLICATION DES ZABBIX
Memoire-De-Master-2 APPLICATION DES ZABBIX
Département D’Informatique
Thème
Promotion : 2015-2016
Remerciements
Introduction Générale…………………………………………………................1
1. Introduction…..………………….…………………………………………....2
5. Conclusion …………………………………………………………………..13
Page i
Chapitre 02 : Etat de l’art sur les systèmes de supervision
1. Introduction…………………………………………………………….. .. ...14
2. La supervision informatique…………………………………………………14
Page ii
4 .4.5 CMDB (Configuration Management DataBase)………………………..21
4.6.1 Ping……………………………………………………………………….24
4.6.3 MRTG……………………………………………………………………24
4.6 .4 RRDTOOL………………………………………………………………25
5. Conclusion…………………………………………………………………...25
1. Introduction………………………………………………………………….26
2. Nagios de nagios…..………...……………………………………………….26
4. Pré-requis ……………………………………………………………………33
5.Conclusion………………………………………………………………… ...44
Page iii
Page iii
Liste des tableaux
Page iv
Figure28 : Remplir les champs ……………….……………………………………………..42
Page vi
Listes des figures
Figure 1 : Logo de SONELGAZ……………………………………………………………. .2
Page v
Page v
Liste des sigles
ACL Access Control List
AIX Aix-en-Provence
BMC Bicycle Manufacturing Company
CGI Common Gateway Interface
CIM Common Information Modem
CMDB Configuration Management DataBase
DMTF Distributed Management Task Force
GPL gaz de pétrole liquéfié
HP hypertext
HTTP Hypertext Transfer Protocol
ICMP Internet Control Message Protocol
IHM Interactions homme-machine
Page vii
Introduction générale
Actuellement la plupart des entreprises sont équipées d’un réseau local au minimum, et
de réseaux de longues distances pour les plus importantes d’entre elles. Leurs parcs
informatiques englobent une dizaine voir une centaine d’équipements, engendrés par des
serveurs de bases de données et des serveurs de traitements.
Vu que ces systèmes informatiques sont au cœur des activités des entreprises, leur
maitrise devient primordiale. Ils doivent fonctionner pleinement et en permanence pour
garantir la fiabilité et l’efficacité exigée, et surtout travailler à réduire les problèmes de
défaillances, les pannes, les coupures et les différents problèmes techniques qui peuvent
causer des pertes considérables.
De ce fait, les administrateurs réseau font appel à des logiciels de surveillance et de
supervision de réseaux afin de vérifier l'état du réseau en temps réel de l'ensemble du parc
informatique sous leur responsabilité. Et être aussi informer automatiquement (par email, par
SMS) en cas de problèmes. Grâce à un tel système, les délais d'interventions sont fortement
réduits et les anomalies peuvent être aussitôt prises en main avant même qu’un utilisateur peut
s’en apercevoir.
Ainsi, la supervision des réseaux s’avère nécessaire et indispensable. Elle permet entre
autre d’avoir une vue globale du fonctionnement et des problèmes pouvant survenir sur un
réseau mais aussi d’avoir des indicateurs sur la performance de son architecture.
Dans ce cadre, le présent rapport se base sur trois axes principaux :
- Présenter les notions de base de la supervision informatique et de ses logiciels les plus
utilisés actuellement.
- Etudier la solution choisie parmi plusieurs en énumérant ses fonctionnalités et apports.
- la réalisation, et la mise en place de cette solution.
Page 1
Chapitre 1 Présentation du cadre de stage
Chapitre 2 Etat de l'art sur les systèmes de supervision
Chapitre 3 Présentation et mise en place de l’outil Nagios
Chapitre 1 présentation du cadre de stage 2016
Page 1
Chapitre 1 présentation du cadre de stage 2016
1. Introduction
Historique
Page 2
Chapitre 1 présentation du cadre de stage 2016
En 2002, la loi n° 02-01 du 5 février 2002 ouvre le secteur de la production d'énergie
électrique à la concurrence et met fin à son monopole. En 2003, elle produisait 29 milliards de
kilowattheures par an, vendait 4,6 milliards de mètres cubes de gaz par an. En 2006, elle
employait environ 28 000 personnes [9].
Page 3
Chapitre 1 présentation du cadre de stage 2016
3. Etude de l existant
Page 4
Chapitre 1 présentation du cadre de stage 2016
Ayant un très grand nombre de serveurs à gérer, l’administrateur est incapable de vérifier
leurs disponibiliteé (en ligne ou pas), de déterminer la qualité des services qu’ils offrent, ni
détecter la défaillance des équipements (charge CPU, Etat mémoire, surcharge du disque….),
ni les surcharges et pénurie temporaire des ressources. Le seul moyen de détecter ces
anomalies ne peut se faire que par la réception des différentes plaintes et réclamations des
clients.
Se souciant de sa réputation et concerné par la satisfaction et le confort de ses clients, la
société veut à tout prix éviter la confrontation à des clients mécontents d’où éviter le risque de
les perdre, et ce en travaillant à offrir une meilleure qualité de services à ses clients en
anticipant les pannes et en évitant les arrêts de longue durée gênant les services qui peuvent
causer de lourdes conséquences aussi bien financières qu’organisationnelles.
Le but de ce projet est donc de trouver une solution optimale pour la gestion des serveurs
et le monitoring de ses équipements en premier lieu, offrir la possibilité de devenir « pro actif
» face aux problèmes rencontrés en un second lieu, et finalement et le plus important, de
pouvoir détecter et interpréter en un simple coup d’œil les causes et origines des problèmes
rencontrés afin de les fixer le plus rapidement possible.
La gestion des serveurs distants et le monitoring de ses équipements étant le plus grand
souci de l’administrateur, nous avons jugé nécessaire de mettre en évidence un outil pour
contrôler le fonctionnement du réseau, d’étudier les données collectées et de définir des seuils
d’alertes qui peuvent servir pour le déclenchement des alertes lors de détection des problèmes.
Il s’agit donc et sans doute d’une mise en place d’un système de supervision qui pourra
grâce aux différentes fonctionnalités qu’il offre, anticiper les pannes en suivant
méticuleusement le fonctionnement du système et en surveillant le statut des serveurs, des
divers services réseaux et d’offrir des renseignements supplémentaires voir charge CPU,
espace disque, mémoire disponible, etc.
Un système de supervision offrira à l’administrateur la possibilité de réagir le plus
rapidement possible face aux pannes qui peuvent intervenir afin d’éviter un arrêt de
production de longue durée.
Page 5
Chapitre 1 présentation du cadre de stage 2016
4. Etude de choix
S’assurant que la supervision est un marché porteur, les sociétés se pressent de plus en
plus à investir dans des produits permettant la supervision et une meilleure gestion des
réseaux. Deux familles apparaissent, celle proposant des solutions généralistes pour la
supervision des Réseaux , des serveurs, des applications, des sites web,… comme les logiciels
Patrol (BMC), d’Unicenter (Computer Associate), de la gamme openview (HP)...
D‟autres offrent une supervision des domaines plus spécifiques citant comme logiciel
panorama (Altaworks) qui gère uniquement l’aspect sécurité ou PathWAI (Candle) qui se
penche principalement sur la supervision des applications. Ces solutions n’ont qu’un seul
point commun : un prix élevé [10].
Il existe des solutions de supervision libres et professionnelles. Parmi les plus répandues,
reconnues du moment nous pouvons citer :
NAGIOS
Créé en 1999 par Ethan Galstad, Nagios est un logiciel qui permet de superviser un
système d'information. Il est considéré comme étant la référence des solutions de supervision
open source. Il dispose de nombreuses fonctions telles que l'héritage multiple, les
dépendances, l'escalade de notifications, les Template de services et d'hôtes, le support des
surveillances actives et passives, etc. L'interface web est la partie graphique, via un serveur
web tel que Apache, et qui va permettre à l'administrateur d'avoir une vue d'ensemble de son
réseau, de visualiser la supervision des équipements et de produire des rapports d'activités [2].
Page 6
Chapitre 1 présentation du cadre de stage 2016
CENTREON
ZABBIX
Zabbix est un logiciel libre qui permet de surveiller l'état de divers services réseau,
serveurs et autres matériels réseau et produisant des graphiques dynamiques de consommation
des ressources. Le « serveur ZABBIX » peut être décomposé en trois parties séparées : Le
serveur de données, l'interface de gestion et le serveur de traitement. Chacune d'elles peut être
disposée sur une machine différente pour répartir la charge et optimiser les performances. Il
repose sur du C/C++, PHP pour la partie front end et MySQL/PostgreSQL/Oracle pour la
partie BDD [2].
ZENOSS
Tout comme Nagios, Zenoss est un outil qui se base sur une application Web qui va
surveiller les nœuds de votre réseau et générer des rapports importants pour des décideurs
informatiques. Publié sous la licence GNU General Public License (GPL) version 2, Zenoss
fournit une interface Web qui permet aux administrateurs système de la surveillance de la
disponibilité, de l'inventaire, de la configuration, des performances et des événements [2].
.GANGLIA
Ganglia est beaucoup plus spécifique, c’est réellement un outil de supervision
complémentaire destiné à la supervision d’un système en cluster. Il est basé sur une
conception hiérarchique ciblée à des fédérations de grappes. Il exploite des technologies
largement utilisées telles que XML pour la représentation des données, XDR pour
compact, le transport de données portable et RRDtool pour le stockage des données et la
Page 7
Chapitre 1 présentation du cadre de stage 2016
visualisation. Il utilise des structures de données et d'algorithmes soigneusement conçues
pour atteindre de très faibles frais généraux par nœud et haute concurrence [2].
CACTI
Cacti est un logiciel libre de mesure de performances réseau et serveur basé RRDTool
dédié à la métrologie. Il ne fait pas de supervision en tant que tel. Il ne fait pas de corrélation
d'incidents ni d'alertes en cas d'incident (bien que des plugins existent, ce n'est pas son but
premier. Les possibilités de configuration très avancées font que celui-ci est souvent utilisé en
complément de solutions de supervision tel que Nagios, notamment, pour assurer la partie
métrologie lorsque les exigences sont fortes. Il permet de représenter sous forme de
graphiques n'importe quelle donnée quantifiable collectée soit par le biais de protocoles
réseaux tels que SNMP ou soit par des scripts personnalisés par l'utilisateur [2].
MUNIN
Munin est un outil de surveillance système et réseau open source qui s'appuie sur l'outil
RRDTool. Il présente ses résultats sous forme de graphiques disponibles via une interface
web. Il possède une structure de plugins particulièrement simple qui permet d'enrichir
rapidement l'outil. Des plugins sont actuellement disponibles pour les systèmes d'exploitations
suivants: GNU/Linux, FreeBSD, NetBSD, Solaris et AIX. L'architecture du système Munin
est constituée d'un serveur principal appelé Munin-master, récupérant les informations à
intervalle régulier et de plusieurs nœuds appelés Munin-node. Le nœud doit être installé sur
le(s) serveur(s) à surveiller [2].
L’avantage de ces logiciels libres est la gratuité, la disponibilité du code source et la liberté
d’étudier et de modifier le code selon nos besoins et de le diffuser. De plus, il existe une
communauté importante d’utilisateurs et de développeurs qui participent à l’amélioration des
logiciels et apportent une assistance par la mise en ligne des documentations et les
participations aux forums [10].
Page 8
Chapitre 1 présentation du cadre de stage 2016
4.3 Choix du logiciel
Page 9
Chapitre 1 présentation du cadre de stage 2016
Fonctionnalités -Offre une interface web de -Offre une interface web
consultation et basée sur les
d‟administration. CGL avec gestion des droits
-Peut générer des graphes. pour la consultation.
-Peut lever des alertes en -Génère des rapports de
envoyant des mails. surveillance.
-Supervise des équipements -Il a la possibilité de
SNMP. monitorer à distance à travers
-Gère les pannes et les un firewall.
performances -Il peut définir des serveurs
esclaves
qui prennent le relais si le
serveur maitre tombe en
panne.
-Surveillance des ressources
des serveurs (CPU,
mémoire…)
-Surveillance des services
réseaux.
-Arrêt temporaire de la
supervision locale ou
globale.
-Génère des graphes par
l‟interfaçage avec
RRDTools.
Architecture Architecture généralement Architecture généralement
basée sur : basée sur :
-Serveur Zabbix, le coeur et -Le moteur de l‟application
moteur de l‟application qui sert à ordonnancer les
programmé en C. tâches de supervision écrit en
-Agent Zabbix pour la C.
collection des informations -Une interface web réalisée à
locales. l‟aide des
Page
10
Chapitre 1 présentation du cadre de stage 2016
-Une interface web GCI, décrivant la vue
d‟administration et d‟ensemble su
consultation des données. système et les anomalies
-Une base de données SQL. possibles.
-Plusieurs plugins qui
peuvent être complétés en
fonction des besoins.
Avantages -Multiplateforme. -Des plugins qui étendent les
-Utilise peu de ressources possibilités de Nagios.
-Plus léger grâce à son -Une très grande
homogénéité (Pas de plug-in communauté qui participe
à ajouter). activement au
-Mise à jour facile. développement.
-Configuration et utilisation -Un moteur performant
aisée. -solution complète
-Interface vaste mais claire permettant le reporting, la
gestion des pannes et
d‟alarmes, gestion des
utilisateurs…
-Des plugins permettent aux
utilisateurs de développer
facilement ses propres
vérifications de services.
-Possibilité de repartir la
supervision entre plusieurs
administrateurs.
-Offre la possibilité de
développer ses propres
modules.
Inconvénients -L‟agent Zabbix -Configuration complexe
communique les données en mais peut s‟améliorer en
clairenécessité de ajoutant Centreon.
sécuriser les données. -Interface peu ergonomique
Page
11
Chapitre 1 présentation du cadre de stage 2016
-Peu d‟interfaçage avec et intuitive.
d‟autres solutions
commerciales.
-Communauté de
développeurs limitée.
Parmi ces solutions libres, les deux logiciels Zabbix et Nagios sont les plus répandus et les
plus utilisés. Par rapport à notre projet, se sont les deux solutions les plus adaptées permettant
de satisfaire pratiquement tous les besoins de la société, par les différentes fonctionnalités
qu’elles offrent. Et compte tenu de ce critère Zabbix et Nagios restent à égalité et il me sera
impossible de les départager.
Une des particularités captivantes de Nagios est sa modularité, on a ainsi estimé que
Nagios a été plus adapté aux besoins de notre projet que Zabbix. En effet, grâce à ses plugins,
Nagios possède une architecture facilement adaptable à l’environnement. Ces derniers
pouvant être ajoutés, modifiés ou même personnalisés et permettent de spécifier les tâches
pour aboutir au résultat voulu.
De plus Nagios est une solution stable, dispose d’une grande communauté de
développeurs et il est utilisé aussi bien dans les petites et moyennes infrastructures que dans
les grands parcs informatiques et utilisé surtout par plusieurs entreprises de renommé, tels que
Yahoo (100 000 serveurs), Yellow pipe Web Hosting (7000 serveurs) …
Bien que ce dernier soit réputé par sa configuration fastidieuse, il peut être couplé à
Centreon un logiciel qui lui servira de couche applicative afin de faciliter la configuration et
d’établir des interfaces IHM plus ergonomiques et compréhensibles.et pour cella notre choix
s’est porté sur NAGIOS.
Page
12
Chapitre 1 présentation du cadre de stage 2016
5. Conclusion
Page
13
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 1
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 2
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 3
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 4
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 5
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 6
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 7
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 8
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page 9
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page
10
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page
11
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page
12
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Page
13
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
1. Introduction
Les systèmes d’information sont tous différents de par leur taille, leur nature, leur criticité.
Ils ont cependant pour point commun d’être le théâtre d’incidents, à un moment ou à un autre.
Un des rôles des administrateurs est justement de gérer cela. Ils doivent concevoir
l’architecture du système d’information de telle manière qu’une panne ait un impact minimal
sur le reste du système.
Les administrateurs ont un objectif clair : le maintien en production du système
d’information. Cependant, tous les éléments ne sont pas logés à la même enseigne en ce qui
concerne la criticité. Certaines parties sont vitales pour l’entreprise, comme les serveurs. Sans
outils de supervision, il est quasi impossible pour un administrateur de garder en tête ces
différents niveaux de criticité. L’outil de supervision peut ainsi aider à mettre des priorités sur
les interventions des administrateurs et leur permettre de se concentrer sur l’essentiel. C’est
pourquoi les administrateurs réseaux et systèmes font appel à des logiciels de surveillance et
de supervision de réseaux. Ces logiciels vérifient l'état du réseau ainsi que des machines
connectées et permettent à l'administrateur d'avoir une vue d'ensemble en temps réel de
l'ensemble du parc informatique sous sa responsabilité. Il peut être aussi informé (par email,
par SMS) en cas de problème. Un tel système assure une gestion proactive du système et
améliore la disponibilité effective des applications et des services opérant sur les serveurs.
Mieux elle permet d’anticiper et de prévoir les éventuels besoins en termes d’équipements
pour une gestion optimale du système d’information.
2. La supervision informatique
Page
14
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Nous ajouterons les actions réflexes à cette surveillance du système. Ce sont les réactions
automatisées en fonctions d’alertes définies.
Mais si la supervision n'est pas active 24X7 le dysfonctionnement se produit en dehors des
heures de bureau, et en l'absence de système approprié, l'alerte n'est pas reçue par l'opérateur,
et les utilisateurs des applications ne sont pas prévenus du dysfonctionnement C'est pourquoi
il peut être utile de compléter le superviseur par un logiciel de gestion des alertes, qui envoie
automatiquement un courriel, un SMS, ou un appel téléphonique à un opérateur sous astreinte.
La supervision système porte principalement sur les trois types principaux de ressources
système :
le processeur.
la mémoire.
le stockage.
commutateurs : utilisation des ressources, métrologie.
serveurs : utilisation des ressources.
Page
15
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
À titre d'exemple, un serveur web peut avoir une supervision système et réseau avec des
signaux au vert, et la machine ne sera pourtant pas disponible au sens du service web si
apache n'est pas présent ou n'est pas en mesure de servir des pages web.
La supervision applicative passe donc par des mesures faites aussi sur le flux de service.
On parle alors de validation fonctionnelle. On utilise souvent un sous-ensemble des tests
ayant permis la recette d'une application pour n'en prendre que les tests qui sont représentatifs
de l'activité sans pour autant générer une charge trop importante ou modifier les données
applicatives.
Page
16
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
La gestion de la sécurité contrôle l’accès aux ressources en fonction des politiques de droits
d’utilisation établies. Elle veille à ce que les utilisateurs non autorisés ne puissent accéder à certaines
ressources protégées. La gestion de la sécurité met donc en application les politiques de sécurité.
La gestion des anomalies détecte les problèmes réseaux (logiciels ou matériels). Elle
essaie d’isoler le plus précisément le problème en effectuant divers tests. Quand cela est
possible, elle règle elle-même automatiquement l’anomalie. Sinon, elle alerte les personnes
concernées par le type du problème afin de solliciter leur intervention. La gestion des
anomalies garde dans une base de données l’ensemble des problèmes survenus ainsi que leur
solution, de manière à être encore plus efficace face à un incident récurrent. Cette fonction de
la norme ISO7498/4 demeure de loin la fonction la plus implémentée à ce jour.
La gestion des anomalies détecte donc et corrige les fonctionnements anormaux des éléments
du réseau.
La gestion des configurations effectue un suivi des différentes configurations des éléments présents
sur le réseau. Elle stocke dans une base de données les versions des systèmes d’exploitation et des
logiciels installés sur chaque machine du parc réseau. Par exemple pour un ordinateur du réseau, la
base contiendra la version de son système d’exploitation, du protocole TCP/IP, etc…
Page
17
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
La gestion des configurations permet donc une identification et un contrôle, des systèmes
ouverts. Elle collecte et fournit des informations sur les différents systèmes du réseau.
La gestion des performances analyse de manière continue les performances du réseau afin
de le maintenir dans un état de performance acceptable. Cette gestion s’opère en trois étapes.
Tout d’abord, des variables contenant des informations significatives quant aux performances
du réseau sont récupérées. Parmi celles-ci nous peuvons citer le temps de réponse d’une
station utilisateur ou encore le taux d’occupation d’un segment réseau. Une fois ces variables
obtenues, elles sont analysées. Si elles dépassent un seuil de performance fixé préalablement,
une alarme est tout de suite envoyée à l’administrateur du réseau, pour régler le problème au
plus vite.
Ces variables de gestion de performances sont réactualisées à court intervalle de temps dans le
but d’être le plus réactif possible au moindre embryon de baisse de performance.
La gestion des performances permet donc une évaluation du comportement des ressources et
un contrôle de l’efficacité des activités de communication.
Les deux règles d’or de la supervision sont d’être le moins intrusif possible et le plus
indépendant possible des éléments supervisés afin de garantir un regard extérieur non biaisé.
Les méthodes active et passive, détaillées dans des paragraphes suivants [12].
Page
18
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
1-Requête du serveur de
Supervision
2-Réponse de la ressource
Cette méthode est la plus utilisée. Elle a l’avantage d’être fiable : les vérifications se font
de manière régulière et en mode question-réponse.
- Le protocole SNMP est le standard en matière de supervision active .il est largement
adopté et utilisé.
- Le protocole WMI (Windows Management Instrumentation) est un standard de
supervision pour les Systems Microsoft Windows.
4.3.2 Supervision passive
La supervision passive l’est du point de vue du serveur de supervision : ce sont les
Page
19
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
La méthode passive possède plusieurs intérêts. D’abord elle est moins consommatrice de
ressources du point de vue serveur de supervision et réseau. Le principal point noir de la
supervision passive concerne la fraicheur des informations :rien ne permet de garantir que la
ressource supervisée est dans un état correct si aucune alerte n’est reçue .les ressources
n’envoient que très rarement des messages pour signaler un état correct.
JMX (Java Management Extensions) est une API pour Java permettant de gérer le
fonctionnement d’une application Java en cours d’exécution. JMX a été intégré dans J2SE à
Page
20
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
partir de la version 5.0. (Attention, JMX est, par défaut, désactivé en version 5.0. Utiliser :
java -Dcom.sun.management.jmxremote).Nous pouvons voir JMX comme une espèce de
SNMP pour Java.
Assez populaire en Europe à la fin des années 1980, ITIL s’est implanté sur le marché nord-
américain, via des entreprises proches de l’informatique, comme Andersen Consulting
(appelée désormais BearingPoint), Ernst & Young, Hewlett-Packard, ou
PricewaterhouseCoopers.
Les recommandations ITIL positionnent des blocs organisationnels et des flux d’informations.
De nombreux logiciels d’exploitation informatique sont conformes à ces recommandations.
Est une base de données unifiant les composants d’un système informatique. Elle permet
de comprendre l’organisation entre ceux-ci et de modifier leur configuration. La CMDB est
un composant fondamental d’une architecture ITIL.
Page
21
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
Une CMDB contient des informations sur les principaux composants du système
d’information (appelés configuration items ou CI) et des détails sur les relations importantes
entre eux. Un CI est une instance d’une entité disposant d’attributs modifiables : par exemple
un ordinateur, un processus ou un employé. Un facteur de succès clé lors de l’implémentation
d’une CMDB est la capacité à récupérer automatiquement des informations concernant les
CIs (auto-discovery) et à suivre les changements au fur et à mesure.
Les CMDBs contiennent des métadonnées et par conséquent leur utilisation peut entrer en
conflit avec le concept de dépôt de métadonnées tel que déployé dans les grandes
organisations informatiques. La gestion des configurations en tant que processus traite de la
manière dont les données sont mises à jour, ce qui est justement une faiblesse des dépôts de
métadonnées. Les CMDBs apportent alors la gestion des historiques. De plus, elles s’intègrent
dans le processus ITIL plus global et apportent une cohérence à la gestion du système
d’information.
Le système de gestion de réseau est basé sur deux éléments principaux : un superviseur et
des agents. Le superviseur est la console qui permet à l'administrateur réseau d'exécuter des
requêtes de management. Les agents sont des entités qui se trouvent au niveau de chaque
interface connectant l'équipement managé au réseau et permettant de récupérer des
informations sur différents objets.
Les Switchs, les hubs, les routeurs et les serveurs sont des exemples d'équipements
contenant des objets manageables. Ces objets manageables peuvent être des informations
Page
22
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
L'architecture de gestion du réseau proposée par le protocole SNMP est donc basée sur
trois principaux éléments : [6]
- Les équipements managés (managed devices) sont des éléments du réseau (ponts,
hubs, routeurs ou serveurs), contenant des "objets de gestion" (managed objects)
pouvant être des informations sur le matériel, des éléments de configuration ou des
informations statistiques ;
Définition
Internet Control Message Protocol est l’un des protocoles fondamentaux constituant la
suite des protocoles Internet. Il est utilisé pour véhiculer des messages de contrôle et d’erreur
pour cette suite de protocoles, par exemple lorsqu’un service ou un hôte est inaccessible.
ICMP se situe au même niveau que le protocole IP bien qu’il ne fournisse pas les primitives
de service habituellement associées à un protocole de couche réseau. Son utilisation est
habituellement transparente du point de vue des applications et des utilisateurs présents sur le
réseau [7].
Page
23
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
4.6.1 Ping
Voilà un outil très simple, qui remplit une tâche très importante. C'est en effet ce
programme qui va nous permettre, en utilisant le protocole ICMP, de savoir si une machine
destination est accessible (dans le cas contraire, connaître approximativement la raison via le
code d'erreur ICMP) et de mesurer la latence existante entre les deux extrémités.
L'implémentation est simple, Ping envoi une requête ICMP Echo et attend en retour une
requête ICMP Echo Reply. Ping est par exemple souvent utilisé pour réaliser une alerte qui
prévient l'administrateur d'une machine quand celle-ci n'est plus joignable. [8].
4.6.3 MRTG
MRTG est un outil réalisé en Perl et en C dans le but de surveiller la charge des liens
réseaux. Il génère des pages html contenant des images au format PNG qui représentent
graphiquement l'état en temps réel de la ressource surveillée. Le principe est simple : un script
Perl recherche les données via le protocole SNMP et envoi celles-ci à un programme C qui va
les stocker et générer les graphiques. A la base l'auteur avait dans le but de surveiller le trafic
passant par des routeurs, mais MRTG se basant sur SNMP, les possibilités se sont étendues à
toute variable. Encore mieux, on peut aussi créer un script qui surveillera n'importe quelle
type de donnée non disponible dans SNMP. On possède ainsi un système de surveillance déjà
Page
24
Chapitre 2 Etat de l'art sur les systèmes de supervision 2016
conséquent qui permet sur une même page de surveiller un réseau et de garder les traces des
anciennes données. .
4.6 .4 RRDTOOL
Du même auteur que MRTG, RRDTOOL est un peu considéré comme une évolution de
ce dernier. La gestion de stockage des données a surtout été entièrement revue pour améliorer
les performances, pour cela l'auteur a utilisé une technique nommée "Round Robin", d'où le
nom "RRDTOOL"(Round Robin Database TOOL). Les graphiques se sont également
améliorés offrant plus de possibilités, et l'interfaçage entre la récupération de donnée et la
génération des images est devenu plus modulaire permettant de réaliser des scripts dans
beaucoup de langages différents. RRDTOOL est maintenant un outil incontournable pour
générer des graphiques, il est donc utilisé dans quasiment tous les logiciels de supervision
open-source [8].
5. Conclusion
La supervision est devenue indispensable dans le système d’information. Elle est à la base
du bon fonctionnement d’une architecture réseau et permet de réagir rapidement en cas de
problèmes ou pannes. Elle se base à l’heure actuelle principalement sur le protocole SNMP
qui depuis de nombreuses années a quand même du mal à évoluer. Le chapitre suivant
attaquera une étude approfondie de la solution proposée.
Page
25
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page 1
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
1. Introduction
Les systèmes d’information sont tous différents de par leur taille, leur nature, leur criticité.
Ils ont cependant pour point commun d’être le théâtre d’incidents, à un moment ou à un autre.
Un des rôles des administrateurs est justement de gérer cela. Ils doivent concevoir
l’architecture du système d’information de telle manière qu’une panne ait un impact minimal
sur le reste du système.
Les administrateurs ont un objectif clair : le maintien en production du système d’information.
Cependant, tous les éléments ne sont pas logés à la même enseigne en ce qui concerne la
criticité. Certaines parties sont vitales pour l’entreprise, comme les serveurs. Sans outil de
supervision, il est quasi impossible pour un administrateur de garder en tête ces différents
niveaux de criticité. L’outil de supervision peut ainsi aider à mettre des priorités sur les
interventions des administrateurs et leur permettre de se concentrer sur l’essentiel.
C'est pourquoi les administrateurs réseaux et systèmes font appel à des logiciels de
surveillance et de supervision de réseaux. Ces logiciels vérifient l'état du réseau ainsi que des
machines connectées et permettent à l'administrateur d'avoir une vue d'ensemble en temps réel
de l'ensemble du parc informatique sous sa responsabilité. Il peut être aussi informé (par
email, par SMS) en cas de problème. Un tel système assure une gestion proactive du système
et améliore la disponibilité effective des applications et des services opérant sur les serveurs.
Mieux elle permet d’anticiper et de prévoir les éventuels besoins en termes d’équipements
pour une gestion optimale du système d’information.
2. La supervision informatique
1
http://blog.adminrezo.fr/wp-content/uploads/2013/05/supervision-des-reseaux-v1.pdf
Page 2
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
On ajoutera les actions réflexes à cette surveillance du système. Ce sont les réactions
automatisées en fonctions d’alertes définies.
Mais si la supervision n'est pas active 24/7 le dysfonctionnement se produit en dehors des
heures de bureau, et en l'absence de système approprié, l'alerte n'est pas reçue par l'opérateur,
et les utilisateurs des applications ne sont pas prévenus du dysfonctionnement C'est pourquoi
il peut être utile de compléter le superviseur par un logiciel de gestion des alertes, qui envoie
automatiquement un courriel, un SMS, ou un appel téléphonique à un opérateur sous astreinte.
La supervision système porte principalement sur les trois types principaux de ressources
système :
le processeur .
la mémoire.
le stockage.
commutateurs : utilisation des ressources, métrologie.
serveurs : utilisation des ressources.
2
https://fr.wikipedia.org/wiki/Supervision
Page 3
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
À titre d'exemple, un serveur web peut avoir une supervision système et réseau avec des
signaux au vert, et la machine ne sera pourtant pas disponible au sens du service web si
apache n'est pas présent ou n'est pas en mesure de servir des pages web.
La supervision applicative passe donc par des mesures faites aussi sur le flux de service.
On parle alors de validation fonctionnelle. On utilise souvent un sous-ensemble des tests
ayant permis la recette d'une application pour n'en prendre que les tests qui sont représentatifs
de l'activité sans pour autant générer une charge trop importante ou modifier les données
applicatives.
3
http://blog.adminrezo.fr/wp-content/uploads/2013/05/supervision-des-reseaux-v1.pdf
Page 4
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
La gestion des anomalies détecte les problèmes réseaux (logiciels ou matériels). Elle
essaie d’isoler le plus précisément le problème en effectuant divers tests. Quand cela est
possible, elle règle elle-même automatiquement l’anomalie. Sinon, elle alerte les personnes
concernées par le type du problème afin de solliciter leur intervention. La gestion des
anomalies garde dans une base de données l’ensemble des problèmes survenus ainsi que leur
solution, de manière à être encore plus efficace face à un incident récurrent. Cette fonction de
la norme ISO7498/4 demeure de loin la fonction la plus implémentée à ce jour.
La gestion des anomalies détecte donc et corrige les fonctionnements anormaux des éléments
du réseau.
La gestion des configurations effectue un suivi des différentes configurations des éléments
4
www.junet.ci/telechargement/memoire_Abbe.pdf
Page 5
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
présents sur le réseau. Elle stocke dans une base de données les versions des systèmes
d’exploitation et des logiciels installés sur chaque machine du parc réseau. Par exemple pour
un ordinateur du réseau, la base contiendra la version de son système d’exploitation, du
protocole TCP/IP, etc…
La gestion des configurations permet donc une identification et un contrôle, des systèmes
ouverts. Elle collecte et fournit des informations sur les différents systèmes du réseau.
La gestion des performances analyse de manière continue les performances du réseau afin
de le maintenir dans un état de performance acceptable. Cette gestion s’opère en trois étapes.
Tout d’abord, des variables contenant des informations significatives quant aux performances
du réseau sont récupérées. Parmi celles-ci on peut citer le temps de réponse d’une station
utilisateur ou encore le taux d’occupation d’un segment réseau. Une fois ces variables
obtenues, elles sont analysées. Si elles dépassent un seuil de performance fixé préalablement,
une alarme est tout de suite envoyée à l’administrateur du réseau, pour régler le problème au
plus vite.
Ces variables de gestion de performances sont réactualisées à court intervalle de temps dans le
but d’être le plus réactif possible au moindre embryon de baisse de performance.
La gestion des performances permet donc une évaluation du comportement des ressources et
un contrôle de l’efficacité des activités de communication.
4.3 Les moyens pour la supervision
Les deux règles d’or de la supervision sont d’être le moins intrusif possible et le plus
indépendant possible des éléments supervisés afin de garantir un regard extérieur non biaisé.
5
FONTAINE.L et LEGROS.B,EDITION ENI,CENTREON, octobre 2012,imprimé en France, pp.18
Page 6
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
trois étapes :
1-Requête du serveur de
Supervision
2-Réponse de la ressource
Cette méthode est la plus utilisée. Elle a l’avantage d’être fiable : les vérifications se font
de manière régulière et en mode question-réponse.
- Le protocole SNMP est le standard en matière de supervision active .il est largement
adopté et utilisé.
- Le protocole WMI (Windows Management Instrumentation) est un standard de
supervision pour les Systems Microsoft Windows.
-
6
FONTAINE.L et LEGROS.B,EDITION ENI,CENTREON, octobre 2012,imprimé en France, pp.19
Page 7
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
La méthode passive possède plusieurs intérêts. D’abord elle est moins consommatrice de
ressources du point de vue serveur de supervision et réseau. Le principal point noir de la
supervision passive concerne la fraicheur des informations :rien ne permet de garantir que la
ressource supervisée est dans un état correct si aucune alerte n’est reçue .les ressources
n’envoient que très rarement des messages pour signaler un état correct.
7
FONTAINE.L et LEGROS.B,EDITION ENI,CENTREON, octobre 2012,imprimé en France, pp.20
Page 8
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
JMX (Java Management Extensions) est une API pour Java permettant de gérer le
fonctionnement d’une application Java en cours d’exécution. JMX a été intégré dans J2SE à
partir de la version 5.0. (Attention, JMX est, par défaut, désactivé en version 5.0. Utiliser :
java -Dcom.sun.management.jmxremote). On peut voir JMX comme une espèce de SNMP
pour Java.
8
http://www.monitoring-fr.org/supervision/standards/
Page 9
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Assez populaire en Europe à la fin des années 1980, ITIL s’est implanté sur le marché nord-
américain, via des entreprises proches de l’informatique, comme Andersen Consulting
(appelée désormais BearingPoint), Ernst & Young, Hewlett-Packard, ou
PricewaterhouseCoopers.
Les recommandations ITIL positionnent des blocs organisationnels et des flux d’informations.
De nombreux logiciels d’exploitation informatique sont conformes à ces recommandations.
Est une base de données unifiant les composants d’un système informatique. Elle permet
de comprendre l’organisation entre ceux-ci et de modifier leur configuration. La CMDB est
un composant fondamental d’une architecture ITIL.
Une CMDB contient des informations sur les principaux composants du système
d’information (appelés configuration items ou CI) et des détails sur les relations importantes
entre eux. Un CI est une instance d’une entité disposant d’attributs modifiables : par exemple
un ordinateur, un processus ou un employé. Un facteur de succès clé lors de l’implémentation
d’une CMDB est la capacité à récupérer automatiquement des informations concernant les
CIs (auto-discovery) et à suivre les changements au fur et à mesure.
Les CMDBs contiennent des métadonnées et par conséquent leur utilisation peut entrer en
conflit avec le concept de dépôt de métadonnées tel que déployé dans les grandes
organisations informatiques. La gestion des configurations en tant que processus traite de la
manière dont les données sont mises à jour, ce qui est justement une faiblesse des dépôts de
métadonnées. Les CMDBs apportent alors la gestion des historiques. De plus, elles s’intègrent
dans le processus ITIL plus global et apportent une cohérence à la gestion du système
d’information.
Page
10
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Le système de gestion de réseau est basé sur deux éléments principaux : un superviseur et
des agents. Le superviseur est la console qui permet à l'administrateur réseau d'exécuter des
requêtes de management. Les agents sont des entités qui se trouvent au niveau de chaque
interface connectant l'équipement managé au réseau et permettant de récupérer des
informations sur différents objets.
Switchs, hubs, routeurs et serveurs sont des exemples d'équipements contenant des objets
manageables. Ces objets manageables peuvent être des informations matérielles, des
paramètres de configuration, des statistiques de performance et autres objets qui sont
directement liés au comportement en cours de l'équipement en question. Ces objets sont
classés dans une sorte de base de données appelée MIB ("Management Information Base").
SNMP permet le dialogue entre le superviseur et les agents afin de recueillir les objets
souhaités dans la MIB.
L'architecture de gestion du réseau proposée par le protocole SNMP est donc basée sur
trois principaux éléments :
- Les équipements managés (managed devices) sont des éléments du réseau (ponts,
hubs, routeurs ou serveurs), contenant des "objets de gestion" (managed objects)
9
http://www.commentcamarche.net/contents/537-le-protocole-snmp
Page
11
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
pouvant être des informations sur le matériel, des éléments de configuration ou des
informations statistiques ;
Définition
Internet Control Message Protocol est l’un des protocoles fondamentaux constituant la
suite des protocoles Internet. Il est utilisé pour véhiculer des messages de contrôle et d’erreur
pour cette suite de protocoles, par exemple lorsqu’un service ou un hôte est inaccessible.
ICMP se situe au même niveau que le protocole IP bien qu’il ne fournisse pas les primitives
de service habituellement associées à un protocole de couche réseau. Son utilisation est
habituellement transparente du point de vue des applications et des utilisateurs présents sur le
réseau.10
10
https://fr.wikipedia.org/wiki/Internet_Control_Message_Protocol
11
http://www.o00o.org/monitoring/outils.html
Page
12
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
4.6.1 Ping
Voilà un outil très simple, qui remplit une tâche très importante. C'est en effet ce
programme qui va nous permettre, en utilisant le protocole ICMP , de savoir si une machine
destination est accessible (dans le cas contraire, connaître approximativement la raison via le
code d'erreur ICMP) et de mesurer la latence existante entre les deux extrémités.
L'implémentation est simple, Ping envoi une requête ICMP Echo et attend en retour une
requête ICMP Echo Reply. Ping est par exemple souvent utilisé pour réaliser une alerte qui
prévient l'administrateur d'une machine quand celle-ci n'est plus joignable. .
4.6.3 MRTG
MRTG est un outil réalisé en Perl et en C dans le but de surveiller la charge des liens
réseaux. Il génère des pages html contenant des images au format PNG qui représentent
graphiquement l'état en temps réel de la ressource surveillée. Le principe est simple : un script
Perl recherche les données via le protocole SNMP et envoi celles-ci à un programme C qui va
les stocker et générer les graphiques.
A la base l'auteur avait dans le but de surveiller le trafic passant par des routeurs, mais MRTG
se basant sur SNMP, les possibilités se sont étendues à toute variable. Encore mieux, on peut
aussi créer un script qui surveillera n'importe quelle type de donnée non disponible dans
SNMP. On possède ainsi un système de surveillance déjà conséquent qui permet sur une
même page de surveiller un réseau et de garder les traces des anciennes données. .
4.6 .4 RRDTOOL
Du même auteur que MRTG, RRDTOOL est un peu considéré comme une évolution de
ce dernier. La gestion de stockage des données a surtout été entièrement revue pour améliorer
les performances, pour cela l'auteur a utilisé une technique nommée "Round Robin", d'où le
Page
13
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
5. Conclusion
La supervision est devenue indispensable dans le système d’information. Elle est à la base
du bon fonctionnement d’une architecture réseau et permet de réagir rapidement en cas de
problèmes ou pannes. Elle se base à l’heure actuelle principalement sur le protocole SNMP
qui depuis de nombreuses années a quand même du mal à évoluer. Dans le chapitre suivant,
nous présentons les besoins fonctionnels et non fonctionnels.
Page
14
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
1. Introduction
Ce chapitre se focalise sur la présentation de l’entreprise accueillante et l’étude détaillée
de l’existant où on cernera la problématique de mon sujet et on présentera la solution adoptée
pour ce dernier.
2. présentation de la société SONELAGAZ
Sonelgaz12, ou Société nationale de l'électricité et du gaz, est une compagnie
chargée de la production, du transport et de la distribution de l'électricité et du gaz
en Algérie.
Historique
En 2003, elle produisait 29 milliards de kilowattheures par an, vendait 4,6 milliards de mètres
cubes de gaz par an. En 2006, elle employait environ 28 000 personnes. En 2002, la loi n° 02-
12
Page
15
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
3. Etude de l existant
3.1 Description de l existant13
13
Page
16
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Ayant un très grand nombre de serveurs à gérer, l’administrateur est incapable de vérifier
leurs disponibilité (en ligne ou pas), de déterminer la qualité des services qu’ils offrent, ni
détecter la défaillance des équipements (charge CPU, Etat mémoire, surcharge du disque….),
ni les surcharges et pénurie temporaire des ressources. Le seul moyen de détecter ces
anomalies ne peut se faire que par la réception des différentes plaintes et réclamations des
clients.
Se souciant de sa réputation et concerné par la satisfaction et le confort de ses clients, la
société veut à tout prix éviter la confrontation à des clients mécontents d’où éviter le risque de
les perdre, et ce en travaillant à offrir une meilleure qualité de services à ses clients en
anticipant les pannes et en évitant les arrêts de longue durée gênant les services qui peuvent
causer de lourdes conséquences aussi bien financières qu’organisationnelles.
Le but de ce projet est donc de trouver une solution optimale pour la gestion des serveurs
et le monitoring de ses équipements en premier lieu, offrir la possibilité de devenir « pro actif
» face aux problèmes rencontrés en un second lieu, et finalement et le plus important, de
pouvoir détecter et interpréter en un simple coup d’œil les causes et origines des problèmes
rencontrés afin de les fixer le plus rapidement possible.
La gestion des serveurs distants et le monitoring de ses équipements étant le plus grand
souci de l’administrateur, j’ai jugé nécessaire de mettre en évidence un outil pour contrôler le
fonctionnement du réseau, d’étudier les données collectées et de définir des seuils d’alertes
qui peuvent servir pour le déclenchement des alertes lors de détection des problèmes.
Il s’agit donc et sans doute d’une mise en place d’un système de supervision qui pourra
grâce aux différentes fonctionnalités qu’il offre, anticiper les pannes en suivant
méticuleusement le fonctionnement du système et en surveillant le statut des serveurs, des
divers services réseaux et d’offrir des renseignements supplémentaires voir charge CPU,
espace disque, mémoire disponible, etc.
Un système de supervision offrira à l’administrateur la possibilité de réagir le plus
rapidement possible face aux pannes qui peuvent intervenir afin d’éviter un arrêt de
production de trop longue durée.
Page
17
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
4. Etude de choix
De nombreuses plateformes de supervision existent aujourd’hui. Certaines se contentent
de gérer à temps réels l’état du réseau et préserve une vue globale sur le fonctionnement de
son architecture, d’autres permettent également de connaître l’état des différents services, et
d’autres qui offrent la possibilité de ressortir de nombreuses statistiques du réseau permettant
une analyse assez fine.
S’assurant que la supervision est un marché porteur14, les sociétés se pressent de plus en
plus à investir dans des produits permettant la supervision et une meilleure gestion des
réseaux. Deux familles apparaissent, celle proposant des solutions généralistes pour la
supervision des Réseaux , des serveurs, des applications, des sites web,… comme les logiciels
Patrol (BMC), d’Unicenter (Computer Associate), de la gamme openview (HP)...
D‟autres offrent une supervision des domaines plus spécifiques citant comme logiciel
panorama (Altaworks) qui gère uniquement l’aspect sécurité ou PathWAI (Candle) qui se
penche principalement sur la supervision des applications. Ces solutions n’ont qu’un seul
point commun : un prix élevé.
Il existe des solutions de supervision libres et professionnelles. Parmi les plus répandues,
reconnues du moment nous pouvons citer 15:
NAGIOS
Créé en 1999 par Ethan Galstad, Nagios est un logiciel qui permet de superviser un
système d'information. Il est considéré comme étant la référence des solutions de supervision
open source. Il dispose de nombreuses fonctions telles que l'héritage multiple, les
dépendances, l'escalade de notifications, les Template de services et d'hôtes, le support des
surveillances actives et passives, etc. L'interface web est la partie graphique, via un serveur
14
http://pfmh.uvt.rnu.tn/573/1/Mise_en_place_d%E2%80%99un_syst%C3%A8me_de_superv
ision_Open_source..pdf
15
Page
18
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
web tel que Apache, et qui va permettre à l'administrateur d'avoir une vue d'ensemble de son
réseau, de visualiser la supervision des équipements et de produire des rapports d'activités3.
CENTREON
ZABBIX
Zabbix est un logiciel libre qui permet de surveiller l'état de divers services réseau,
serveurs et autres matériels réseau et produisant des graphiques dynamiques de consommation
des ressources. Le « serveur ZABBIX » peut être décomposé en trois parties séparées : Le
serveur de données, l'interface de gestion et le serveur de traitement. Chacune d'elles peut être
disposée sur une machine différente pour répartir la charge et optimiser les performances. Il
repose sur du C/C++, PHP pour la partie front end et MySQL/PostgreSQL/Oracle pour la
partie BDD.
ZENOSS
Tout comme Nagios, Zenoss est un outil qui se base sur une application Web qui va
surveiller les nœuds de votre réseau et générer des rapports importants pour des décideurs
informatiques. Publié sous la licence GNU General Public License (GPL) version 2, Zenoss
fournit une interface Web qui permet aux administrateurs système de la surveillance de la
disponibilité, de l'inventaire, de la configuration, des performances et des événements
.GANGLIA
Ganglia est beaucoup plus spécifique, c’est réellement un outil de supervision
complémentaire destiné à la supervision d’un système en cluster. Il est basé sur une
Page
19
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
CACTI
Cacti est un logiciel libre de mesure de performances réseau et serveur basé RRDTool
dédié à la métrologie. Il ne fait pas de supervision en tant que tel. Il ne fait pas de corrélation
d'incidents ni d'alertes en cas d'incident (bien que des plugins existent, ce n'est pas son but
premier. Les possibilités de configuration très avancées font que celui-ci est souvent utilisé en
complément de solutions de supervision tel que Nagios, notamment, pour assurer la partie
métrologie lorsque les exigences sont fortes. Il permet de représenter sous forme de
graphiques n'importe quelle donnée quantifiable collectée soit par le biais de protocoles
réseaux tels que SNMP ou soit par des scripts personnalisés par l'utilisateur.
MUNIN
Munin est un outil de surveillance système et réseau open source qui s'appuie sur l'outil
RRDTool. Il présente ses résultats sous forme de graphiques disponibles via une interface
web. Il possède une structure de plugins particulièrement simple qui permet d'enrichir
rapidement l'outil. Des plugins sont actuellement disponibles pour les systèmes d'exploitations
suivants: GNU/Linux, FreeBSD, NetBSD, Solaris et AIX. L'architecture du système Munin
est constituée d'un serveur principal appelé Munin-master, récupérant les informations à
intervalle régulier et de plusieurs nœuds appelés Munin-node. Le nœud doit être installé sur
le(s) serveur(s) à surveiller.
Page
20
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
L’avantage16 de ces logiciels libres est la gratuité, la disponibilité du code source et la liberté
d’étudier et de modifier le code selon nos besoins et de le diffuser. De plus, il existe une
communauté importante d’utilisateurs et de développeurs qui participent à l’amélioration des
logiciels et apportent une assistance par la mise en ligne des documentations et les
participations aux forums.
Zabbix Nagios
16
http://pfmh.uvt.rnu.tn/573/1/Mise_en_place_d%E2%80%99un_syst%C3%A8me_de_superv
ision_Open_source..pdf
17
Page
21
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
22
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Parmi ces solutions libres, les deux logiciels Zabbix et Nagios sont les plus répandus et les
plus utilisés. Par rapport à mon projet, se sont les deux solutions les plus adaptées permettant
Page
23
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
de satisfaire pratiquement tous les besoins de la société, par les différentes fonctionnalités
qu’elles offrent. Et compte tenu de ce critère Zabbix et Nagios restent à égalité et il me sera
impossible de les départager.
Une des particularités captivantes de Nagios est sa modularité, on a ainsi estimé que
Nagios a été plus adapté aux besoins de mon projet que Zabbix. En effet, grâce à ses plugins,
Nagios possède une architecture facilement adaptable à l’environnement. Ces derniers
pouvant être ajoutés, modifiés ou même personnalisés et permettent de spécifier les tâches
pour aboutir au résultat voulu.
De plus Nagios est une solution stable, dispose d’une grande communauté de
développeurs et est utilisé aussi bien dans les petites et moyennes infrastructures que dans les
grands parcs informatiques et utilisé surtout par plusieurs entreprises de renommé, tels que
Yahoo (100 000 serveurs), Yellow pipe Web Hosting (7000 serveurs) …
Bien que ce dernier soit réputé par sa configuration fastidieuse, il peut être couplé à
Centreon un logiciel qui lui servira de couche applicative afin de faciliter la configuration et
d’établir des interfaces IHM plus ergonomiques et compréhensibles.et pour cella notre choix
s’est porté sur NAGIOS.
5. Conclusion
Page
24
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
25
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
1. Introduction
Dans ce dernier chapitre, nous commençons par analyser de prés les fonctionnalités de la
solution adoptée, son architecture, et les différents services qu’elle offre et enfin énumérer les
différents fichiers de configurations sur quoi se base cette solution.
2. Nagios
2.1 Présentation de nagios
Nagios est un logiciel libre distribué sous licence GPL qui permet de superviser un
système d’information complet. Utilisé par de nombreuses sociétés, il fait l’objet de
contribution et recherche très actives.
Etant le successeur de NetSaint dont la première version date de 1999, ce logiciel est
considéré comme une évolution de ce dernier auquel a été ajoutée, entre autre, la gestion du
protocole SNMP. Il apparaît sous le nom de Nagios le 10 mai 2002 aux conditions de la GNU
General Public License.
Cet outil repose sur une plate-forme de supervision, fonctionnant sous Linux et sous la
plupart des systèmes Unix. Il centralise les informations récoltées périodiquement par le
fonctionnement modulaire dont il est caractérisé, ce qui le rend beaucoup plus attractif que ses
produits concurrents. En revanche sa configuration peut se révéler complexe.[4].
Surveillance des services réseaux (SMTP, POP3, HTTP, NNTP, PING, etc.).
Surveillance des ressources des hôtes (charge processeur, utilisation des disques,
etc.).
Système simple de plugins permettant aux utilisateurs de développer facilement
leurs propres vérifications de services.
Notifications des contacts quand un hôte ou un service a un problème et est résolu
(via email, pager, ou par méthode définie par l’utilisateur)
Possibilité de définir des gestionnaires d’évènements qui s’exécutent pour des
évènements sur des hôtes ou des services, pour une résolution des problèmes
Interface web, pour voir l’état actuel du réseau, notification et historique des
Page
26
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
La configuration est assez complexe et nous allons donc détailler les principaux points
à connaître pour la compréhension du bon fonctionnement de Nagios [13] .
Page
27
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Les fonctionnalités de Nagios sont très nombreuses, parmi les plus communes nous
pouvons citer les suivantes [10] :
La supervision des services réseaux (SMTP, http…), des hôtes et des ressources systèmes
(CPU, charge mémoire…)
La détermination à distance et de manière automatique l’état des objets et les ressources
nécessaires au bon fonctionnement du système grâce à ses plugins.
Représentation coloriée des états des services et hôtes définies.
Génération de rapports.
Cartographie du réseau.
Gestion des alertes.
Surveillance des processus (sous Windows, Unix…).
Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP,
etc.)
La supervision à distance peut utiliser SSH ou un tunnel SSL.
Les plugins sont écrits dans les langages de programmation les plus adaptés à leur tâche
(Bash, C++, Python, Perl, PHP, C#, etc.)
Toutes ces fonctionnalités sont assurées grâce la gestion et supervision du réseau et ses
différentes entités d’une manière centralisée. La figure 7 modélise cet aspect :
Page
28
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
29
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Une IHM : C’est une interface graphique accessible par le web conçue pour rendre plus
exploitable les résultats. Elle est basée sur les CGI (Common Gateway Interface) fournis par
défaut lors de l’installation de Nagios qui interprètent les réponses des plugins pour les
présenter dans l’interface.
Cette interface sert à afficher de manière claire et concise une vue d’ensemble du système
D’information et l’état des services surveillés, de générer des rapports et de visualiser
l’historique. D’une manière générale avoir la possibilité de détecter en un simple coup d’oeil,
les services ou hôtes ayant besoin d’une intervention de leur administrateur.
Il est possible de coupler Nagios à une base de données MySQL ou Postgres, lorsque le
nombre d’objets à superviser devient conséquent. La figure 8 représente l’architecture de
Nagios.
Page
30
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
2.6 Plugin
Les plugins sont des programmes exécutables ou des scripts (perl, Shell, etc..) qui peuvent
être lancés depuis une ligne de commande pour tester un hôte ou un service.
Le résultat de l'exécution d'un plugin est utilisé par Nagios pour déterminer le statut des hôtes
ou des services sur le réseau. Le développement des plugins pour Nagios est fait sur Source
Forge. La page du projet de développement de plugins pour Nagios (où vous trouverez
toujours la dernière version des plugins) se trouve à
http://sourceforge.net/projects/nagiosplug/ [10].
Les plugins développés pour Nagios doivent respecter un certain format d'affichage de retour
afin de garantir leur intégration. Tous les plugins qui respectent les consignes minimales de
développement pour ce projet contiennent une documentation interne. Cette documentation
peut être affichée en exécutant le plugin avec le paramètre "-h" ("--help" si les paramètres
longs sont activés).
Par exemple, si nous voulons savoir comment fonctionne le plugin check_http (vérification
de l’état du serveur web) ou quels paramètres il accepte, vous devez saisir dans la ligne de
commande:
#. /check_httpd --help
Page
31
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
A – Réseau à superviser
Le réseau que nous devons superviser est celui-ci :
Il sera composé :
- D'un serveur "Windows Server 2003" qui permettra la gestion des utilisateurs du réseau :
Stockage des données et identifications des utilisateurs
- D'un serveur "Nagios" qui s'occupera de la supervision du réseau, de la centralisation et de
l'analyse des informations du réseau
- D'un poste client "Windows XP"
- D'un poste client "Linux"
-D’une imptémente
B – Que superviser?
Avant tout, il faut définir les informations qui seront récupérées par Nagios, sur chaque
équipement du réseau.
Sur le serveur "2003 serveur", Nagios récupéra :
- La version du pluging qui envoie les informations au serveur Nagios : Si cette version n'est
pas la dernière, un e-mail sera envoyé à l'administrateur réseau.
- La charge CPU du serveur. Dans notre cas, si la charge dépasse les 90 %, un e-mail sera
envoyé à l'administrateur réseau.
- La durée depuis le dernier démarrage du serveur.
- La taille et l'occupation des disques durs. Dans notre cas, lorsque 90 % de l'un des disques
durs est occupé, un e-mail sera envoyé à l'administrateur réseau.
Sur les postes clients, Nagios récupéra :
- La version du pluging qui envoie les informations au serveur Nagios : Si cette version
n'est pas la dernière, un e-mail sera envoyé à l'administrateur réseau.
- La taille et l'occupation des disques durs. Dans notre cas, lorsque 90 % de l'un des disques
durs est occupé, un e-mail sera envoyé à l'administrateur réseau.
- Pour Windows XP: La taille du dossier "C:\Documents and Settings" qui stocke les données
des utilisateurs en local. Si ce dossier a une taille supérieure à 2Go, un e-mail sera envoyé
à l'administrateur réseau pour qu'il puisse vider ce répertoire.
Si Internet n'est plus disponible, un SMS sera envoyé à l'administrateur réseau.
Page
32
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Si le routeur ne répond plus (le réseau ne peut donc plus marcher), envoie d'un SMS à
l’administrateur réseau.
Nagios doit avoir un historique des paquets rejetés par le firewall (voir les règles
d'autorisations / refus dans le paragraphe précédent)
4. Pré-requis
Page
33
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
B. Installation de fan
L’installation de FAN est identique à celle d’un CentOS classique. Celle-ci est plutôt rapide,
intuitive et ne nécessite pas de commentaire. Une fois terminée elle pèse environ 1Go.
Page
34
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
35
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
36
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
37
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
38
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
39
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
40
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Page
41
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Puis nous allons sur hosts pour ajouter des hôtes à superviser.
Nous remplissons les champs(nom d’hôte, adresse ip, la période de supervision) puis nous
cliquons sur save nous aurons la figure ci après.
Page
42
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
Nous cliquant sur monitoring engines puis cocher les champs qui convient puis cliquer sur
Export pour exporter l’hôte ajouté sur interface de nagios.
Page
43
Chapitre 3 Présentation et mise en place de l’outil Nagios 2016
5. Conclusion
Ensuite une partie a été consacrée pour la définition des différents fichiers de
configuration générés par la solution de supervision Nagios, précédée par l’énumération des
différents plugins de base responsable de l’exécution des tests
Page
44
Conclusion générale
Page 45
Références bibliographiques et webografiques
Webographie
[1] http://blog.adminrezo.fr/wp-content/uploads/2013/05/supervision-des-reseaux-v1.pdf.
AVRIL 2016
Bibliographie
[12] Loic FONTAINE & Bruno LEGROS ,2012 Centreon –Maitrisez la supervision de votre
système d’information. Edition ENI .
[13] Olivier JAN ,2008.NAGIOS et la supervision Open Source –De l’installation à
l’optimisation. Edition EPSILON .
[14] Andrea DALLE Vacche & Stefano Kewan LEE ,2013.Mastering Zabbix.Packet
Publishing Ltd.
Résumé
Les réseaux sont de partout à l’heure actuelle. Ils sont devenus indispensables au bon
fonctionnement général de nombreuses entreprises et administrations. Tout problème ou
panne peut avoir de lourdes conséquences aussi bien financières qu’organisationnelles.
La supervision des réseaux est alors nécessaire et indispensable. Elle permet entre autre
d’avoir une vue globale du fonctionnement et problèmes pouvant survenir sur un
réseau mais aussi d’avoir des indicateurs sur la performance de son architecture. De
nombreux logiciels qu’ils soient libres ou propriétaires existent sur le marché. La plupart
s’appuie sur le protocole SNMP.
Dans une première partie nous allons faire une présentation de la supervision et tout ce
qui touche au monitoring de réseau. Dans une seconde partie, nous verrons le fonctionnement
du protocole le plus utilisé actuellement : le protocole SNMP. Ensuite nous ferons une
présentation des différents logiciels existants à l’heure actuelle. Enfin nous essaierons d’avoir
une vision sur l’avenir de la supervision.
Abstract
Networks are everywhere today. They have become essential to the overall functioning
of many companies and administrations. Any problem or failure can have serious
consequences both financial and organizational. The network supervision is necessary and
indispensable. It allows among others to have an overall view of the functioning and problems
that can occur on a network but also to have indicators on the performance of its architecture.
Many software whether free or owners are on the market. Most uses SNMP.
In the first part we will make a presentation of the supervision and everything related to
network monitoring. In the second part we will see the operation of the protocol as used
currently: SNMP. Then we will make a presentation of the different existing software at
present. Finally we will try to have a vision on the future of supervision.