Rapport PFE VTL
Rapport PFE VTL
Rapport PFE VTL
-1-
Au terme de mon projet de fin d’étude effectué à la Direction Générale
de la Sureté Nationale, je tiens à exprimer ma gratitude et à adresser
mes vifs remerciements à :
-2-
PRESENTATION DE LA D.G.S.N : ------------------------------------------------------------------------------------------- 5
Principales missions de la DGSN : ------------------------------------------------------------------------------------- 6
Introduction Générale ------------------------------------------------------------------------------------------------------- 8
I. PRESENTATION DE LA PLATEFORME EXISTANTE ---------------------------------------------- 11
1- Architecture :---------------------------------------------------------------------------------------------------------- 11
2- DATA CENTER : -------------------------------------------------------------------------------------------------- 12
3- PLATEFORME SAUVEGARDE : ----------------------------------------------------------------------------- 14
ARCHITECTURE GLOBAL DATACENTRE ANCIENNE SANS VTL-------------------------------- 14
ARCHITECTURE GLOBAL DATACENTRE ANCIENNE SANS VTL-------------------------------- 14
3-2- Description de la plateforme de sauvegarde existante : ------------------------------------------------ 15
4- La politique de sauvegarde : --------------------------------------------------------------------------------------- 16
5- Les types de sauvegarde : ------------------------------------------------------------------------------------------- 16
II. LIMITATIONS RENCONTREES : --------------------------------------------------------------------------- 17
1- Quelques points de comparaison de deux systèmes : sauvegarde sur disque et sauvegarde sur
bandes :-------------------------------------------------------------------------------------------------------------------- 17
2- Problèmes rencontrés au niveau de l’ancien système de sauvegarde : ----------------------------------- 20
III. ANALYSE DES BESOINS : ------------------------------------------------------------------------------------- 22
1- Besoins généraux : ---------------------------------------------------------------------------------------------------- 22
2- Besoins et Spécifications techniques recherchés : ------------------------------------------------------------ 22
IV. TECHNOLOGIE V.T.L, ET DIFFERENTES SOLUTIONS POSSIBLES : ---------------------- 24
1- La Technologie V.T.L : -------------------------------------------------------------------------------------------- 24
V. LA SOLUTION CHOISIE ET LES CRITERES DE CHOIX : --------------------------------------- 27
1- Description de la solution FalconStor® Virtual Tape Library (VTL) : ---------------------------------- 27
2- Pourqoui FalconStor® Virtual Tape Library (VTL) : -------------------------------------------------------- 28
Déploiement sans interruption : ------------------------------------------------------------------------------------ 28
Optimiser les performances de sauvegarde : ------------------------------------------------------------------ 29
Tape Caching :------------------------------------------------------------------------------------------------------------ 30
Multi-tape export : ----------------------------------------------------------------------------------------------------- 32
-3-
Virtual Tape Shredding: ----------------------------------------------------------------------------------------------- 33
Sauvegarde haut débit à travers le Fibre Channel :------------------------------------------------------------ 34
VI. CONCEPTION DE L’ARCHITECTURE DU NOUVEAU SYSTEME DE SAUVEGARDE :
34
1- Les composants matériels de la nouvelle plateforme de sauvegarde : ------------------------------------ 34
2- Le composant logiciel : --------------------------------------------------------------------------------------------- 35
3- Schéma de l’architecture : ------------------------------------------------------------------------------------------ 37
I. INSTALLATION DULOGICIEL DE SAUVEGARDE ET DE L’APPLIANCE VTL :-------- 39
1- Installation du Serveur NetWorker : ---------------------------------------------------------------------------- 39
2- Configuration de la ressource « JUKEBOX» : --------------------------------------------------------------- 44
3- Installation de la console d’administration : -------------------------------------------------------------------- 46
II. CONFIGURATION DU STOCKAGE (BAIE, L.U.N, …) : -------------------------------------------- 49
1- La baie de stockage : ------------------------------------------------------------------------------------------------ 49
2- La création du Logical Unit Number (L.U.N) : --------------------------------------------------------------- 50
III. CONFIGURATION DU ZONING SUR LE SWITCH SAN : ---------------------------------------- 53
1- Création de Zone : --------------------------------------------------------------------------------------------------- 53
2- Détection du LUN : ------------------------------------------------------------------------------------------------- 54
IV. CONFIGURATION DE LA ROBOTIQUE SUR LA VTL :------------------------------------------- 55
1. Configuration du Robot Virtuel : --------------------------------------------------------------------------------- 55
2. Configuration du Robot Physique : ------------------------------------------------------------------------------ 57
V. LES TESTS EFFECTUES : -------------------------------------------------------------------------------------- 58
1. Test de Sauvegarde : ------------------------------------------------------------------------------------------------ 58
2. Test de Restauration : ----------------------------------------------------------------------------------------------- 60
DEFINITIONS ET TERMINOLOGIE -------------------------------------------------------------------------- 62
BIBLIOGRAPHIE ET WEBOGRAPHIE ---------------------------------------------------------------------- 64
-4-
PRESENTATION DE LA D.G.S.N :
La DGSN est créée le 16 Mai 1956 par le Dahir n° 1-56-115 et fut réorganisée par la
circulaire n°: 3025 du 12-12-89 telle qu’elle a été modifiée. Le Directeur Général est aussi
nommé par un Dahir.
-5-
Principales missions de la D.G.S.N :
-6-
-7-
Introduction Générale
Quelque soit le service rendu par un système informatique, il est essentiel que les
utilisateurs aient confiance en son fonctionnement pour pouvoir l'utiliser dans de bonnes
conditions. Le terme « sûreté de fonctionnement » caractérise le niveau de confiance d'un
système informatique.
Une défaillance correspond à un dysfonctionnement du service, c'est-à-dire un état de
fonctionnement anormal ou plus exactement non conforme aux spécifications. Du point de
vue de l'utilisateur, un service possède deux états :
• service approprié, c'est-à-dire conforme aux attentes ;
• service inapproprié, c'est-à-dire non conforme aux attentes.
Une défaillance est imputable à une erreur, c'est-à-dire un dysfonctionnement local.
Toutes les erreurs ne conduisent pas nécessairement à une défaillance du service.
Il existe plusieurs moyens de limiter les défaillances d'un service :
• la prévention des fautes consistant à éviter les fautes en les anticipant.
• la tolérance aux fautes dont l'objectif est de fournir un service conforme aux
spécifications malgré les fautes en introduisant une redondance.
• l'élimination des fautes visant à réduire le nombre de fautes grâce à des actions
correctives.
• la prévision des fautes en anticipation de ces derniers et leur impact sur le service, par
des techniques tels que :
o La haute disponibilité :
On appelle « haute disponibilité » (en anglais « High availability ») toutes les
dispositions
visant à garantir la disponibilité d'un service, c'est-à-dire assurer le bon
fonctionnement d'un service 24H/24.
o L’évaluation des risques :
En effet, la panne d'un système informatique peut causer une perte de
productivité et d'argent, voire des pertes matérielles ou humaines dans
certains cas critiques. Il est ainsi essentiel d'évaluer les risques liés à un
dysfonctionnement (faute) d'une des composantes du système d'information
-8-
et de prévoir des moyens et mesures permettant d'éviter ou de rétablir dans
des temps acceptables tout incident.
Comme chacun le sait, les risques de pannes d'un système informatique en
réseau sont nombreux. L'origine des fautes peut être schématisée de la
manière suivant :
- Origines physiques : elles peuvent être d'origine naturelle ou
criminelle :
o Désastre naturel (inondation, séisme, incendie)
o Environnement (intempéries, taux d'humidité de l'air,
température) ;
o Panne matérielle ;
o Panne du réseau ;
o Coupure électrique.
- Origines humaines : elles peuvent être intentionnelles ou
fortuites :
o Erreur de conception (bogue logiciel, mauvais
dimensionnement du réseau) ;
- Origines opérationnelles : elles sont liées à un état du système à
un moment donné :
o Bogue logiciel ;
o Dysfonctionnement logiciel ;
L'ensemble de ces risques peuvent avoir différentes causes telles que les suivantes :
• Malveillance intentionnelle.
• Tolérance aux pannes : Puisqu'il est impossible d'empêcher totalement les pannes,
une solution consiste à mettre en place des mécanismes de redondance, en
dupliquant les ressources critiques. Idéalement, dans le cas d'une panne
matérielles, les éléments matériels fautifs devront pouvoir être « extractibles à
chaud » (en anglais « Hot-Swappable »), c'est-à-dire pouvoir être extraits puis
remplacés, sans interruption de service.
• La sauvegarde : Néanmoins, la mise en place d'une architecture redondante
ne permet que de s'assurer de la disponibilité des données d'un système mais
-9-
ne permet pas de protéger les données contre les erreurs de manipulation
des utilisateurs ou contre des catastrophes naturelles telles qu'un incendie,
une inondation ou encore un tremblement de terre. Il est donc nécessaire de
prévoir des mécanismes de sauvegardes, idéalement sur des sites distants,
afin de garantir la pérennité des données.
Par ailleurs, un mécanisme de sauvegarde permet d'assurer une fonction
d'archivage, c'est à-dire de conserver les données dans un état correspondant
à une date donnée.
C’est dans ce cadre, que s’inscrit mon projet qui a pour objectif :
- 10 -
I. PRESENTATION DE LA PLATEFORME EXISTANTE
1- Architecture :
L’architecture arrêtée par le maître d’œuvre, après une longue étude, est une
architecture multi tiers :
ARCHITECTURE MULTITIER
Dans l'architecture à 3 niveaux, chaque serveur (niveaux 2 et 3) effectue une tâche (un
service) spécialisée. Un serveur peut donc utiliser les services d'un ou plusieurs autres
serveurs afin de fournir son propre service. Par conséquent, l'architecture à trois niveaux est
potentiellement une architecture à N niveaux ...
- 11 -
Les avantages d’une telle architecture sont :
• Une plus grande flexibilité/souplesse ;
• Une sécurité accrue, car la sécurité peut être définie indépendamment pour chaque
service, et à chaque niveau ;
• De meilleures performances, étant donné le partage des tâches entre les différents
serveurs.
2- DATA CENTER :
La plateforme cible de la solution de sauvegarde existante est la plateforme DATACENTRE
CNIE.
Comme toute architecture 3 tiers, la plateforme DATACENRE CNIE est composée de :
- 12 -
PLATEFORME APPLICATION :
Ce que nous appelons Ferme de serveurs est la mise en place de plusieurs serveurs
effectuant le même type de tâche avec une répartition de charge entre les serveurs. Cette
Répartition de charge se fait avec deux Appliances de F5 (BIG-IP LTM 6800) en frontal des
serveurs qui tournent sous WEBLOGIC d’ORACLE sur Linux.
PLATEFORME WEB :
- 13 -
En plus de ces plateformes, il y a d’autres serveurs utilisés pour des besoins
spécifiques tels que l’Active Directory, les serveurs de messageries, et puis aussi des clients :
qui sont des clients Web sur Windows et Linux.
3- PLATEFORME SAUVEGARDE :
- 14 -
3-2- Description de la plateforme de sauvegarde existante :
Le serveur de sauvegarde ainsi que les Storage nodes sont connectés à un réseau SAN via
des composants HP (SAN switchs et MDR). Ils ont donc tous « une visibilité » sur la robotique
MSL6060 et sur ses 12 lecteurs LTO2.
Le client Linux Redhat est relié au serveur de sauvegarde via un réseau Gigabit.
Cette architecture peut être présentée comme suite :
- Serveur de sauvegarde : c’est le serveur qui héberge et gère la base de données des
sauvegardes des clients.
- Client Storage Node : c’est le serveur ou le poste client qui a un accès direct aux
unités de sauvegarde.
- Client : c’est le serveur ou le poste client qui communique avec le serveur via le
réseau LAN.
Utilisant les technologies offertes par la plateforme existante, la sauvegarde prenait plus
que 24h pour chaque Jeu de sauvegarde (saveset) à lancer.
- 15 -
4- La politique de sauvegarde :
Backup complet : sauve tous les dossiers et fichiers du disque dur. C'est la méthode la
plus sûre, mais la longue puisqu'elle permet de reprendre tous le contenu des dossiers en
une seule fois. De toute façon, en cas de crash disque complet, vous devrez d'abord
réinstaller Windows avant de récupérer les données.
Backup différentiel: copie tous les fichiers depuis le dernier backup complet ou
incrémental mais ne modifie pas le bit d’archive des fichiers comme dans les deux autres
techniques. Le défaut est lié aux temps de sauvegarde puisqu'il reprend des fichiers et
- 16 -
dossiers déjà sauvés les jours précédents (même non modifiés depuis). Une sauvegarde
complète ou incrémentale est nécessaire avant.
II.
II. LIMITATIONS RENCONTREES :
1- Quelques points de comparaison de deux systèmes : sauvegarde sur disque
et sauvegarde sur bandes :
Sauvegarder des centaines de giga octets ou Téra octets : sur disque ou sur bandes ?
Toutes ces données doivent être sauvegardées afin de pallier à des défaillances
informatiques, vols ou erreurs de manipulation humaine (environ 40 % des données
perdues sont dus à des erreurs humaines). La question est de savoir sur quel type de
support. Voici quelques points de comparaison de 2 systèmes distincts :
- la sauvegarde sur disque, qu'on appelle aussi sauvegarde sur serveurs, qui gagne de plus
en plus de terrain ;
- la sauvegarde sur bandes, que ce soit DAT, LTO, DLT, SDLT, toujours bien ancrée dans
les habitudes.
Matériel et fiabilité :
Sauvegarde sur disque : Les disques en RAID garantissent une continuité du service : il s'agit
d'une technologie qui permet de faire tourner au minimum 2 disques durs en parallèle. Si un
disque tombe en panne, le 2è fait office de disque de secours. On contrecarre ainsi la
réputation des disques d'être fragiles. Mais il existe aussi des disques en RAID édition,
réputés plus fiables que des disques classiques (1,2 millions d'heures de durée moyenne
entre les pannes garanties par le constructeur).
Sauvegarde sur bandes : Elle nécessite une intervention humaine quotidienne. Sauf si un
robot de sauvegarde se charge de changer la cartouche du jour. Mais beaucoup
d'entreprises confient cette responsabilité à un administrateur qui doit y penser chaque
jour. S'il oublie, pas de sauvegarde. Les bandes sont mises à rude épreuve à force de tourner
si souvent ; elles se fragilisent au bout de 6 mois et demandent à être remplacées très vite. Il
faut gérer un grand nombre de bandes pour maîtriser les volumes de données grandissants.
- 17 -
La sauvegarde :
Sauvegarde sur disque : Sa mise en place est rapide, simple. Une fois paramétrée, elle se fait
toute seule, quotidiennement ou même plusieurs fois par jour si nécessaire. La sauvegarde
est automatique, rapide ; les fenêtres de sauvegarde sont réduites au minimum, limitant
ainsi les incidences sur la disponibilité du système.
L'utilisateur peut accéder lui-même à ses sauvegardes et les paramétrer. Il n'y a pas de
librairie de bandes à gérer. Et il est facile d'augmenter la capacité de stockage.
Sauvegarde sur bandes : C'est l'administrateur uniquement qui gère les sauvegardes.
On a tendance à associer les bandes à de l'archivage. Elles peuvent avoir en fait un double
usage : la sauvegarde et l'archivage. Attention toutefois à ne pas confondre la sauvegarde et
l'archivage qui ont des objectifs distincts.
Sauvegarde sur bandes : Les données stockées sur des postes nomades sont difficiles à
sauvegarder avec un système à bandes. Un robot est nécessaire et requiert de la rigueur de
la part des propriétaires des laptops. De la même façon, la sauvegarde de données
provenant de sites distants est complexe.
La restauration :
Sauvegarde sur disque : La restauration est facile, intuitive, rapide, et garantie à tout
moment. Les données sont accessibles 24h/24, 7j/7. L'utilisateur peut lui-même restaurer
ses fichiers.
Sauvegarde sur bandes : Plus fastidieux ; avant de restaurer un fichier ou répertoire d'une
bande, il va falloir retrouver sur quelle cartouche est sauvegardé le ou les fichiers. Le tout
peut prendre facilement plusieurs heures. Seul l'administrateur a accès à la restauration.
- 18 -
Technologie de sauvegarde :
Les sauvegardes sur bandes permettent des backups incrémentaux (une 1ère sauvegarde de
tous les fichiers, puis uniquement les fichiers modifiés à partir de la 2ème sauvegarde) et des
backups différentiels (copie de tous les fichiers depuis le dernier backup sans modifier le bit
d'archivage).
Une sauvegarde sur disque est compatible avec la technologie incrémentale octet ou mode
bloc (dès la 2ème sauvegarde, uniquement les octets modifiés des fichiers - et non les
fichiers eux-mêmes sont sauvegardés). Cette technologie réduit considérablement l'espace
de stockage et permet des temps de sauvegarde beaucoup plus courts. Ces octets - ou
incréments - représentent en effet moins de 1 % du volume initial des fichiers.
Historique de sauvegarde :
Une sauvegarde sur disque peut offrir un historique de X jours de vos fichiers (X étant une
durée paramétrable au choix, par l'administrateur, et qui peut être de plusieurs mois). Ce qui
permet de restaurer un fichier en l'état qu'il était, à une date passée, précise.
Une sauvegarde sur bande autorise difficilement un long historique. A moins de disposer de
nombreuses cassettes. Mais ces cassettes vont plutôt correspondre à de l'archivage.
Sauvegarde sur bandes : Le lecteur n'est généralement pas externalisé. Mais les bandes
peuvent facilement sortir de l'entreprise.
- 19 -
Coûts :
Sauvegarde sur disque : Les prix des disques sont en baisse.
Sauvegarde sur bandes : Si on veut une automatisation de la sauvegarde sur bandes, il faut
investir dans un robot de sauvegarde. Si on veut être rigoureux, il faut une bande par jour,
une bande par semaine, une par mois, une par an, au minimum. Pour de gros volumes de
sauvegardes, la sauvegarde sur disque peut devenir plus économique.
Concept de déduplication :
La déduplication consiste à ne stocker qu'une seule fois tous ces fichiers et à simplement
maintenir un lien vers le fichier original. L'espace utilisé est ainsi grandement réduit pour le
stockage (économies d'espace de 2 à 5 fois). Cette déduplication des fichiers n'est possible
que lors d'une sauvegarde sur disque, à condition que l'éditeur de la sauvegarde ait intégré
cette fonctionnalité.
- 20 -
chevauchements des opérations de sauvegardes se présentent quotidiennement ce qui
causent des inconsistances des données sauvegardées. Le chevauchement est du
essentiellement à la limitation au niveau de la robotique qui est basée sur la technologie
SCSI et qui est relativement ancienne.
Pour parler d’une manière générale des problèmes des environnements de sauvegarde
des anciens systèmes on abordera :
- 21 -
III.
III. ANALYSE DES BESOINS :
1- Besoins généraux
généraux :
• Dans une optique d’améliorer la qualité de ses services, et de répondre aux besoins de
plus en plus croissants en terme de haute disponibilité, fiabilité, performance et sécurité
de sa plateforme de sauvegarde et de stockage, la DGSN à décidé d’acquérir une
solution sous forme de passerelles de virtualisation des sauvegardes destinées à assurer
la protection des données de production ainsi que le partage de fichiers de données via
le LAN afin de réduire la plage horaire des sauvegardes tout en les rendant plus fiables
et plus souples en termes d’évolution et d’administration, et de répondre aussi aux
exigences et recommandations en matière de sécurité et continuité de services.
- 22 -
• Supporter l’intégration avec les logiciels de sauvegarde du marché Networker, IBM
TSM, Symantec Netbackup
• Supporter la réplication inter site cryptée à travers les protocoles IP et/ou FC
• Supporter la consolidation des données de plusieurs bandes virtuelles sur le
minimum de bandes physiques
• Supporter l’export de plusieurs jeux de sauvegardes sécurisés (avec cryptage)
simultanés sur des médias physiques pour externalisation (Disaster Recovery).
• Restaurer directement à partir de la robotique
• Supporter les mécanismes d’optimisation du stockage
• Offrir les mécanismes pour une supervision à distance pour anticiper les pannes
• Prévoir les licences Networker requises pour le support de la plateforme VTL
proposée
La librairie physique demandée doit être de type non-modulaire (empilable avec des
pass-through)
• 8 lecteurs LTO4 FC à interface 4Gb/s extensible à plus de 50
• 200 slots pour cartouches LTO extensible à plus de 3000
• Débit 3,4To/heure extensible à 20To/heure
• Alimentation hot-plug et redondante 2N
• Possibilité de redonder la mécanique et l’électronique de la librairie pour minimiser
les arrêts dus à la panne de toute composante critique.
• Calibrage automatique par caméra continu
• Possibilité d’extension de la capacité par simple clés d’activation logicielle
• Possibilité de partitionnement physique de la librairie (par lecteurs et slots) pour
pouvoir la partager entre plusieurs environnements de sauvegarde.
• Ports d’accès (Mail slot) de 20 cartouches minimum
• Compatible avec différents hôtes : Solaris, AIX, HP-UX, Windows, and Linux
• Panneau opérateur tactile en façade pour l’administration en local
• Interface Web pour l’administration via réseau
- 23 -
• Contrôle de la librairie via un port FC 2Gb/s
• Fourniture de 60 medias LTO4 Data et 5 medias de nettoyage avec code à bar
compatible avec la librairie proposée.
IV.
IV. TECHNOLOGIE V.T.L, ET DIFFERENTES
DIFFERENTES
SOLUTIONS POSSIBLES :
1- La Technologie V.T.L :
- 24 -
Une VTL fonctionne sous réseau de stockage Fiber Channel ou IP et se place à coté du
serveur d'applications - avec lequel il communique - mais avant les librairies de stockage par
bandes magnétiques. Le VTL vise à compenser les inconvénients du stockage sur bande par
l'intermédiaire d'une couche intermédiaire en système disque.
Cette couche intermédiaire présente trois avantages. Tout d'abord, elle diminue la fenêtre
d'ouverture c'est-à-dire le temps entre la création de nouvelles données en mémoire et
l'archivage de ces données dans une zone sécurisée et non réinscriptible.
Ensuite, le VTL émule une bande magnétique virtuelle avant le transfert final de ses données
sur lesdites bandes, ce qui optimise l'espace disque utilisée sur chacune de ses bandes.
Enfin, le temps de restauration des données et le temps d'écriture des données sont réduits,
grâce à l'utilisation des disques et de leur mémoire tampon en écriture et grâce à l'émulation
de bandes virtuelles lors de la restitution des données.
Pourquoi conserver les bandes magnétiques si les disques sont plus rapides ?
Cependant, depuis le début des années 2000 et l'arrivée du format SATA, les disques durs
ont constamment baissé de prix pour des capacités et des temps d'accès en hausse. Cette
technologie concurrence de plus en plus les bandes magnétiques dans son domaine jusqu'ici
réservé.
D'où l'idée de combiner ces deux technologies pour en tirer le meilleur parti. Les VTL
constituent un moyen d'optimiser les performances des bandes en matière de temps
d'écriture et de restauration. Les bandes magnétiques s'occupent toujours de l'archivage
définitif des données mais les VTL se révèlent indispensables pour traiter une plus grande
quantité d'information par jour. On parle alors de sauvegarde D2D2T (Disk to Disk to Tape ou
"de disque à disque à bandes").
- 25 -
Quels autres bénéfices offre cette technologie ?
La VTL fédère les différents formats de bandes magnétiques comme LTO, SLR, DLT et SDLT
au sein d'un accès unique et transparent pour l'administrateur qui gagne ainsi du temps et
économise un logiciel dédié à cet aspect du stockage.
D'autre part, en émulant plusieurs lecteurs virtuels de bandes magnétiques, il fait gagner un
temps considérable aux librairies de stockage traditionnelles. Enfin, parce qu'elle optimise le
remplissage des disques et des bandes magnétiques.
- 26 -
V. LA SOLUTION CHOISIE ET LES CRITERES DE
CHOIX :
FalconStor Virtual Tape Library (VTL) avec déduplication est une solution de sauvegarde
sur disque qui optimise la sauvegarde et la restauration, améliorant les performances et
permettant une reprise rapide après sinistre sur site distant (PRA). Cette solution conserve
les principes de sauvegarde des anciennes solutions de backup et les améliore grâce à une
architecture basée sur disque qui réduit les besoins et les coûts de stockage physique.
FalconStor VTL offre une réplication optimisée pour architectures WAN permettant une PRA
à bon rapport qualité/prix, et contribuant également à préparer le terrain pour des
initiatives d’architectures en mode « cloud ». Les avantages comprennent des temps
allongés de rétention des données et une amélioration des délais de restauration, ainsi
qu’une fiabilité accrue des données grâce à l’élimination des expéditions par bande.
FalconStor VTL est une solution de sauvegarde sur disque complète, tout-en-un, avec une
approche globale de la sauvegarde et de la restauration, qui aide à surmonter les obstacles
de la sauvegarde des systèmes anciens. FalconStor VTL s’intègre sans perturbation avec les
infrastructures de stockage sur bande, fournissant des durées de rétention de données plus
longues et améliorant les temps de restauration, tout en augmentant la fiabilité des
données. Son architecture de déduplication globale multi-nœuds, à haute disponibilité (HA)
évolue pour répondre aux besoins de protection des données de bureaux distants et de
grands centres de données. FalconStor VTL offre un support hétérogène aux principaux
systèmes d’exploitation comme Microsoft Windows, Unix et Mac, y compris une longue liste
de logiciels de sauvegarde certifiés. En outre, FalconStor VTL offre un support natif aux
iSeries d’IBM (AS/400) et aux applications de sauvegarde mainframe pour entreprise.
- 27 -
2- Pourqoui FalconStor® Virtual Tape Library (VTL) :
- Tape Caching : Copie automatique de bandes virtuelles vers des bandes physiques sans
recourir au logiciel de sauvegarde en préservant le format de sauvegarde natif ainsi que
le code à barre.
- Tape consolidation : Ecriture de plusieurs bandes virtuelles sur une seule bande
physique de plus grande capacité.
- Multi tape export : Création de plusieurs jeu de sauvegarde pour externalisation
(jusqu’à 5).
- Secure tape export : Cryptage des données AES 128 bits pour les bandes à externaliser.
- Tape shredding : Effacement des bandes virtuelles en 3 passes.
- 28 -
peuvent être installées, sans coûts de support media ou de calendrier de recyclage de
bandes magnétiques. FalconStor VTL crée de multiples librairies virtuelles ou machines
magnétiques. L’avantage est que de multiples sauvegardes peuvent s’exécuter depuis
différents serveurs dans le même espace de stockage. Ce stockage peut réaliser une
sauvegarde vers une bande magnétique ou un autre VTL. Ce second niveau de VTL peut être
un disque de stockage plus lent et fonctionne telle une sauvegarde continue du premier
niveau de sauvegarde.
FalconStor VTL prend en charge les connexions Fibre Channel et iSCSI. Ce sont les deux
méthodes d'interface plus rapides que d'utiliser une interface basée sur le fichier car il évite
le système de fichiers « overhead » associé NFS.
- 29 -
FalconStor VTL évolue jusqu'à 8 nœuds dans un cluster unique, ce qui signifie que tous les
8 systèmes fonctionnent comme une seule entité logique et partagent la gestion, rapports,
etc...
Avec Falconstor VTL, les accès au disque est beaucoup plus directe que l'accès à la bande
et beaucoup plus rapide. Il est beaucoup plus facile de localiser plusieurs emplacements de
données que pour une solution de bandes physiques charger.
Avec VTL
créez autant de
lecteurs
virtuels que
votre activité
le demande.
Une des raisons que Falconstor VTL peut améliorer est les performances. Il est plus
facile d’augmenter le nombre de bandes virtuelles en fonction du besoin. Avec une
bibliothèque physique, vous avez un nombre fixe de disques (six dans l'illustration). Une
fois que tous ces lecteurs sont en cours d'utilisation, impossible d’ajouter plus de flux pour
la sauvegarde/jobs sans ajouter d’autre lecteurs ou d’autre librairie. Ou bien, vous devrez
recourir à partage de disques, de bandes, qui peuvent être complexe à mettre en œuvre et
avoir l'impact négatif sur les performances.
Tape Caching :
• Tape Caching déplace les sauvegardes sur bandes physiques à partir de
la politique :
o Age, temps, espace, etc.
- 30 -
• Les bandes virtuelles peuvent être conservées
conservées après la copie sur des médias
physiques.
o Codes barres maintenus
o Transparent pour le logiciel de sauvegarde
o Une seule sauvegarde par bande virtuelle et physique
FalconStor VTL permet la mise en cache de bandes automatisées. Cela signifie que les
données
es sont transférées sur bande magnétique de la librairie en se basant sur la politique
adoptée.
- 31 -
La deuxième figure montre ce qui se passe réellement. Le serveur de backup déplace les
données vers la librairie de bandes virtuelles, qu'il considère comme une librairie de
bandes physiques. La librairie de bandes virtuelles va ensuite, se basant sur la politique,
déplacer les données sur bande. Une "politique" peut reposer sur l'âge, temps, espace,
…etc. Par exemple, vous pouvez déplacer une bande virtuelle vers la bande physique
immédiatement après que la bande virtuelle est terminée. Ceci dit, vous pouvez conserver
la sauvegarde sur bande virtuelle pendant un laps de temps avant de le supprimer. Une
autre méthode consiste à copier sur bande après un laps de temps écoulé, une semaine
par exemple. Ou vous pouvez déplacer vers la bande basée sur la capacité du disque
restant dans votre librairie de bandes virtuelles.
Dans tous les cas, le processus est transparent pour le serveur de backup. Il ne sait pas si
les données sont sur bande physique ou virtuel. Les codes à barres sont conservés entre les
deux. Si les données ont été déplacées vers la bande physique, lorsqu'une restauration est
demandée que la VTL envoie à la librairie de bandes et à partir de la librairie les données
sont restaurées directement.
Multi-tape export :
Création multiples de copies (jusqu'à 5) d'une bande virtuelle pour stockage externe.
Stays in data
center
Vault
Shipped to offsite
vault(s)
- 32 -
Non seulement la plupart des entreprises ont encore besoin des bandes mais souvent
ont besoin de plusieurs copies à la fois. C'est parce qu'ils les stockent à plusieurs
emplacements (off site), ou souhaitez simplement la redondance de plusieurs copies.
Cependant, le processus de copie aura un impact sur l'environnement de sauvegarde car il
est normalement piloté depuis le serveur TSM. FalconStor VTL peut exporter directement
les bandes virtuelles vers la bande physique, jusqu'à cinq copies à la fois. Le processus est
rapide car il utilise une lecture directe de disque et une écriture parallèle sur bande. Si la
copie est conservée dans la bibliothèque, une exportation incrémentielle peut être
effectuée qui ajoute uniquement les nouvelles données sur la bande. Le processus est
entièrement déchargé de la médiathèque. Cela peut également permettre une réduction
des frais de licence de stockage.
Moins critiques que le cryptage de bandes mais toujours une source potentielle de
données compromis, ce sont les données sur disque. Normalement, si vous supprimez
uniquement des données d'un disque dur, ces données peuvent être partiellement ou
entièrement recréées à l'aide de disque analyse post-mortem. Dans le cas d'une VTL, si les
disques sont perdus ou supprimés, ils peuvent être soumis à l'examen et à leur extraction.
Aussi, si les disques sont réaffectés, les données qu'ils contiennent peuvent par
inadvertance être rendues accessibles aux personnes qui ne devraient pas les voir.
- 33 -
Sauvegarde haut débit à travers le Fibre Channel :
• FalconStor VTL est le seul produit disponible OpenStorage sur FC, supporte toutes
les modèles de baies de disques.
• Support du 2 Gb, 4Gb et 8 Gb FC.
Servers on FC SAN
2 or 4 Gb FC Fabric
NBU Media
Server
VI.
VI. CONCEPTION DE L’ARCHITECTURE DU NOUVEAU
SYSTEME DE SAUVEGARDE :
1- Les composants matériels de la nouvelle plateforme de sauvegarde :
- 34 -
• Ports d’accès (Mail slot) de 26 cartouches
• 60 medias LTO4 Data et 5 medias de nettoyage avec code
• Contrôle de la librairie via un port FC 2Gb/s
Deux appliances VTL Falconstor CA800 couvrant une capacité de 30 To, chacun avec la
configuration suivante :
Deux Switchs SAN Brocade 300 FC 8 Gbps chacun avec la configuration suivante :
2- Le composant logiciel :
- 35 -
particulière que l'ensemble complet des données d'un client. Vous pouvez également
restaurer des versions plus anciennes des éléments de données existants.
Le logiciel NetWorker offre les capacités et les performances requises pour gérer la
charge des données. Il offre une variété de fonctions vous offrant une souplesse et vous
permettant de trier vos données sauvegardées par groupes de clients spécifiques, ou sur des
volumes de stockage particuliers. Il propose également régulièrement des informations
d'état de sauvegarde relatives à vos données, aux médias et aux unités de sauvegarde. Les
fichiers d'index NetWorker assurant le suivi des données sauvegardées et des médias
pouvant devenir très gros, les données anciennes et périmées sont supprimés, en fonction
des critères que vous avez définis, pour que leur taille reste facilement gérable.
- 36 -
3- Schéma de l’architecture :
BD Servers : Deux serveurs HP ALPHA GS1280, qui font tourner le SGBD ORACLE 9i sur
OPENVMS en Cluster
Appli Servers : Quatre Serveurs Linux en cluster, avec Veritas Cluster Server, faisant tourner
le serveur d’application WebLogic.
Baie de stockage Hitachi AMS2100: qui hébergera les robots virtuels au niveau de ses
disques.
Falconstor VTL : Deux appliances VTL en cluster, qui gèrent l’émulation VTL.
- 37 -
- 38 -
I. INSTALLATION DULOGICIEL DE SAUVEGARDE ET
DE L’APPLIANCE VTL :
1- Installation du Serveur NetWorker :
Pour installer NetWorker sur la machine que vous avez designer comme Serveur
NetWorker :
Garder une copie de la configuration actuelle. L’installation de NetWorker modifie les
fichiers suivants :
• /etc/rpc
• /etc/syslog.conf
Par exemple :
# cp /etc/rpc /etc/rpc.old
# cp /etc/syslog.conf /etc/syslog.conf.old
Durant l’installation il vous sera demandé si vous voulez gardez les fichiers.
Vérifiez si les subsets requis pour que NetWorker fonctionne sont bien installés sur le
système. Voir tableau suivant :
- 39 -
Par exemple :
# setld -i | grep “subset_identifier”
Si les “subsets” ne sont pas installés, il est nécessaire de les charger avant d’installer
NetWorker.
Monter le CD-ROM “NetWorker Clients and Storage Nodes” ( sous /mnt par exemple ) et
entrer la commande suivante:
# setld -l /mnt/TRU64
Si le répertoire /nsr existe, il sera utilisé dans le cas contraire il vous sera demandé de fournir
un répertoire d’installation pour /nsr. Par défaut c’est sur /var/nsr.
Faire le choix 6 afin d’installer tous les subsets. Legato recommande d’installer tous les
subsets en même temps. Il est possible de les installer un par un, mais dans ce cas ils doivent
l’être dans l’ordre suivant ;
LGTOCLNT722 (client software)
LGTONODE722 (storage node software)
LGTOSERV722 (server software)
LGTOMAN722 (optional man or reference pages)
- 40 -
# setld -l .
The subsets listed below are optional:
There may be more optional subsets than can be presented on a
single screen. If this is the case, you can choose subsets
screen by screen or all at once on the last screen. All of the
choices you make will be collected for your confirmation before
any subsets are installed.
1) EMC Legato NetWorker Client
2) EMC Legato NetWorker Driver & Storage Node
3) EMC Legato NetWorker License Manager
4) EMC Legato NetWorker Manpages
5) EMC Legato NetWorker Server
--- MORE TO FOLLOW ---
Enter your choices or press RETURN to display the next screen.
Estimated free diskspace(MB) in root:2874.5 usr:3035.3
var:8208.8
Choices (for example, 1 2 4-6):
Or you may choose one of the following options:
6) ALL of the above
7) CANCEL selections and redisplay menus
8) EXIT without installing any subsets
Estimated free diskspace(MB) in root:2874.5 usr:2826.8
var:8208.8
Add to your choices, choose an overriding action or press
RETURN to confirm previous selections.
Choices (for example, 1 2 4-6): 6
You are installing the following optional subsets:
EMC Legato NetWorker Client
EMC Legato NetWorker Driver & Storage Node
EMC Legato NetWorker License Manager
- 41 -
……
5 of 5 subsets installed successfully.
Configuring "EMC Legato NetWorker Client" (LGTOCLNT722) on
member0
EMC Legato NetWorker Client
Copyright (c) 1990-2005, EMC Legato Software
************ File Configuration on NetWorker Client ***********
/nsr not found!
Enter the location for this Client's NetWorker home directory
(it must sit on a local disk!) [ /var/nsr ]: /nsr
The installation procedure adds entries to the /etc/rpc and
/etc/syslog.conf files on the NetWorker server; the original
files are renamed and saved. The installation also creates the
/sbin/init.d/NSRstartstop file.
Do you wish to continue? (y/n) [ y ]: y
Modifying /etc/rpc
Modifying /etc/syslog.conf
* * * Restarting syslog daemon * * *
Do you wish to remove the saved files? (y/n) [ n ]: y
Creating /sbin/init.d/NSRstartstop
Starting nsrexecd...
The nsr/res/servers file will need to be updated with the list
of servers that will back up this system as a client.
/nsr/res/servers file does not exist..
Do you wish to create the file? (y/n):n
*********************************************
- 42 -
Vérifier que les démons NetWorker sont démarrés
# ps -ef | grep nsr
Les démons listés dans le tableau suivant doivent donc être présent en fonction des
packages installés. Le démon nsrmmd n’est présent que si des lecteurs ont été configures.
Si les demons nsrd et nsrexecd ne sont pas actifs, lancer la commande suivante afin de les
lancer.
# /sbin/init.d/NSRstartstop start
• Vérifier l’installation:
NetWorker fournie à la fois une interface graphique, mais aussi des interfaces en ligne de
commande.
- 43 -
2- Configuration de la ressource « JUKEBOX» :
• La commande « inquire » :
- La commande « inquire », disponible uniquement sur le serveur ou sur les Storages Nodes
permet de faire un scanne des ports SCSI est de remonter les informations sur le hardware
attaché au serveur.
- Sur le Serveur de sauvegarde elle permet d’identifier l’adresse SCSI par laquelle le robot
sera piloté, ainsi que les chemins physiques des lecteurs.
- Sur les Storage Nodes, elle remonte le même type d’information, mais dans notre cas
uniquement les informations propres aux lecteurs qui nous intéressent dans la mesure où le
robot ne sera piloté que par le serveur de sauvegarde.
- Voici un exemple du résultat de cette commande sur notre serveur de sauvegarde :
- 44 -
# inquire
-l flag found: searching all LUNs, which may take over 10 minutes per adapter
for some fibre channel adapters. Please be patient.
[email protected]:HL-DT-STRW/DVD GCC-4481B2.05|CD-ROM, /dev/rdisk/cdrom0c
[email protected]:COMPAQ BF03688284 HPB3|Disk, /dev/rdisk/dsk1c
S/N:3KQ0QARQ00007552KSMR
ATNN:SEAGATE ST336754LC 3KQ0QARQ
WWNN:50011C6003D106C0
[email protected]:HP Ultrium 2-SCSI F59W|Tape, /dev/ntape/tape0_d1
S/N:HUL5G03889
ATNN:HP Ultrium 2-SCSI HUL5G03889
WWNN:50060B0000339F46
[email protected]:HP Ultrium 2-SCSI F59W|Tape, /dev/ntape/tape1_d1
S/N:HUL5G03832
ATNN:HP Ultrium 2-SCSI HUL5G03832
WWNN:50060B0000339F0D
[email protected]:HP Ultrium 2-SCSI F59W|Tape, /dev/ntape/tape2_d1
S/N:HUL5H01375
ATNN:HP Ultrium 2-SCSI HUL5H01375
WWNN:50060B000033A8DE
[email protected]:HP Ultrium 2-SCSI F59W|Tape, /dev/ntape/tape3_d1
S/N:HUL5H01357
ATNN:HP Ultrium 2-SCSI HUL5H01357
WWNN:50060B000033A8D2
…………
…………
- 45 -
3- Installation de la console d’administration :
- 46 -
Apres avoir installer la console, on doit faire entrer les informations d’authentification de
l’administrateur des appliances et l’adresse IP de ces derniers, pour assurer la connexion
distante et l’administration par interfaces graphiques :
- 47 -
Aucune fonctionalité n’est autorisé jusqu’après l’activation de la solution par une licence :
- 48 -
II.
II. CONFIGURATION DU STOCKAGE (BAIE, L.U.N, …) :
1- La baie de stockage :
La connexion a la console d’administration HSNM de notre baie de stockage HITACHI via une
interface web :
- 49 -
2- La création du Logical Unit Number (L.U.N
(L.U.N)
L.U.N) :
Dans un réseau SAN, un LUN est le numéro d'identification d'un espace de stockage
présenté à un ou plusieurs serveurs (dans un réseau SAN, chaque carte HBA d'un serveur
connecté possède un WWN unique et l'administrateur du SAN peut ainsi définir pour chaque
espace de stockage existant le numéro sous lequel il doit être présenté à chacun des
serveurs connectés.)
- 50 -
La création d’un Host Groupe :
- 51 -
On procédera ensuite, par présenter le LUN créé au HostGroup :
Dans la rubrique Host Group on est amené à créer choisir le nom du Host Group cible
ainsi le port par lequel il doit passer, par la suite et dans la rubrique Logical Units dans la
fenêtre H-LUNs bien précisément, choisir le LUN créer en avance et puis l’ajouter dans la
fenentre Assigned Logical Units(Les LUN assignés comme Target dans la baie de stockage,
pour assuré la sauvegarde).
- 52 -
III.
III. CONFIGURATION DU ZONING SUR LE SWITCH
SAN :
1- Création de Zone :
La création du zoning se fait sur le Switch SAN, et qui fera en sorte de présenter le
nouveau LUN à notre Serveur de Sauvegarde :
- 53 -
2- Détection du LUN :
Cette capture d’écran nous présente la détection du LUN créé précédemment par notre
serveur de sauvegarde, après la configuration du zoning.
- 54 -
IV.
IV. CONFIGURATION DE LA ROBOTIQUE SUR LA VTL :
Dans ce niveau, on suivra les étapes de création d’un Robot ou d’une Virtuel Library qui
va émuler des bandes virtuels pour faire des sauvegardes sur disques, en se servant de
notre console d’administration de la VTL Falconstor :
- 55 -
Définition du nombre des slots sur le Robot :
Activation de la technique THIN PROVISIONING, son rôle est de fournir un stockage avec
capacités d'allocation à la demande afin d’optimiser l’utilisation de l’espace de stockage :
- 56 -
Récapitulatif de la configuration du Robot Virtuel :
L’ajout et la configuration d’un Robot Physique sur l’appliance VTL, repose obligatoirement
sur une Licence d’activation de cette action :
- 57 -
V. LES TESTS EFFECTUE
EFFECTUES :
1. Test de Sauvegarde :
La capture d’écran ci-dessous nous présente un test de sauvegarde des données selon la
stratégie et la politique définie en avance, les tests ont été effectués avec le logiciel de
sauvegarde NetWorker :
- 58 -
Après le lancement des tests de sauvegarde, et pour vérifier la réussite des tests
effectués, on se rend à l’interface de recherche des status des sauvegardes :
- 59 -
2. Test de Restauration :
Cette capture d’écran nous présente un test de restauration effectué par l’outil de
restauration « NetWorker Recover » :
- 60 -
- 61 -
LISTE DES ABREVIARTIONS,D
ABREVIARTIONS,DEFINITIONS ET
TERMINOLOGIE
redondantes
sauvegarde des fichiers que vous pouvez restaurer si les fichiers d'origine sont perdus
ou endommagés.
- SAVESET :
- CLUSTER : est une grappe de serveurs constitués de deux serveurs au minimum, pour
- TAPE CACHING : Copie automatique de bandes virtuelles (disque) vers des bandes
physiques
- 62 -
- RTO : Recovery Time Objective, est la durée maximale d’interruption admissible
- 63 -
BIBLIOGRAPHIE ET WEBOGRAPHIE
http://www.journaldunet.com/solutions/expert/37269/la-
sauvegarde-sur-disque-versus-la- sauvegarde-sur-bande.shtml
http://www.falconstor.com/
http://www.ybet.be/hardware2_ch9/stockage_sauve.htm#Stockage_
HD
http://www.zdnet.fr/actualites/librairies-virtuelles-l-alternative-ou-le-
complement-des-cartouches-a-bandes-39702559.htm
http://www.silicon.fr/stockage-data-vtl-ou-librairies-de-bandes-
virtuelles-sur-disques-utiles-ou-futiles-18544.html
- 64 -