Chapitre 2 - Architecture RAID
Chapitre 2 - Architecture RAID
Chapitre 2 - Architecture RAID
des systèmes
R.A.I.D
1
Cours animé par A.MOHAMMEDI
1- Définition
• Le terme de RAID (Redundant Array of Independent/Inexpensive
Disks, c'est-à-dire un groupe de disques redondants et
indépendants/bon marché) désigne une architecture matérielle (et
parfois logicielle) permettant d'accélérer, de sécuriser et/ou de
fiabiliser les accès aux données stockées sur disques durs.
• Cette architecture est basée sur la multiplication des disques durs,
par opposition à la méthode SLED (Single Large Expensive Disk) où
toutes les données sont rassemblées sur un seul disque de prix élevé.
• L’ensemble de ces disques constitue une grappe.
2
2- Historique
3
3- Niveaux de RAID
4
3.1- RAID 0
5
• Exemple:
Avec un RAID 0 composé de quatre disques, si l'on veut écrire l'octet
00111001, le stockage des différents bits composant cet octet se fera
de la façon suivante :
➢ disque 1 : 00
➢ disque 2 : 11
➢ disque 3 : 10
➢ disque 4 : 01
6
• Ainsi, sur un RAID 0 de n disques, chaque disque ne doit lire et écrire
que 1/n des données, ce qui a pour effet de décupler les taux de
transfert des données entre le CPU et les disques, et donc d'accélérer
les traitements.
7
• Ce type de RAID est parfait pour des applications requérant un
traitement rapide d'une grande quantité de données.
• Mais cette architecture n'assure en rien la sécurité des données; en
effet, si l'un des disques tombe en panne, la totalité des données du
RAID est perdue, ce qui fait du RAID 0 une solution moins fiable que
l'utilisation d'un seul disque de stockage, puisque la probabilité de
défaillance d'un des disques du RAID est largement supérieure à la
probabilité de défaillance d'un disque unique.
8
3.2- RAID 1
9
3.3- RAID 2
• Ce système incorpore un contrôle d’erreur par code de Hamming
(ECC).
• Quant un mot est écrit sur le disque dur, un code ECC est écrit sur un
disque de correction d’erreurs.
• Quant un mot est lu sur le disque de stockage, une vérification de
l’ECC est effectuée sur le disque de correction d’erreurs pour s’assurer
que l’octet lu n’est pas erroné.
• Une grappe RAID 2 constituée de 4 disque dur pour le stockage des
données utiles utilisera 3 disques de plus pour la correction d’erreur.
10
• Exemple:
4 Disques dur de données 3 disques dur pour la parité ECC
16 disques dur de données 12 disques dur pour la parité ECC
11
3.4- RAID 3
12
• Exemple:
3 Disques de 500 Go 1000 Go utilisable et 500 Go pour l’ECC
13
• Si un des disques de données tombe en panne, le RAID 3 peut être
reconstitué sans perte de données à partir du disque de parité.
• Si les 2 disques de données tombent simultanément en panne, les
données seront perdues sans possibilité de récupération.
• Si le disque de parité tombe en panne, le RAID 3 devient alors un
RAID 0.
14
3.5- RAID 4
• Appelé Disk Array with Parity Sector Interleaved Data, il est quasi-
équivalent au RAID 3 sauf qu’au lieu d’écrire les données octet par
octet, elles sont écrites bloc par bloc (un secteur de 512 Octet).
• Nécessite au minimum 3 disques dur dont 2 pour les données et le
troisième pour la parité.
15
• Les mêmes avantages et inconvénients que le RAID 3.
• En plus, si une données de taille inférieure à 512 Octet doit être
écrite, la parité du secteur entier doit être recalculé, ce qui fait
baisser les performances.
16
3.6- RAID 5
• Le RAID 5 associe le striping et un système à parité répartie, il permet
une bonne disponibilité (même en cas de défaillance d'un des disques
de stockage.
• Les données sont écrites bloc par bloc et chaque disque de la grappe
contient des données et de la parité. Ce qui améliore l’accès en
lecture et écriture (utilisation de plusieurs disques simultanément).
• Nécessite au minimum 3 disques dur mais il est recommandé
d’utiliser 5 disques.
17
• Si un disque dur tombe en panne, en remplaçant le disque, le RAID 5
se régénèrera automatiquement grâce aux autres disques.
• Au niveau capacité de stockage, on perd l’équivalent d’un disque.
Disque 1 Disque 2 Disque 3 Disque 4 Disque 5
Bloc 1 Bloc 2 Bloc 3 Bloc 4 Parité 1+2+3+4
Bloc 5 Bloc 6 Bloc 7 Parité 5+6+7+8 Bloc 8
Bloc 9 Bloc 10 Parité Bloc 11 Bloc 12
9+10+11+12
Bloc 13 Parité Bloc 14 Bloc 15 Bloc 16
13+14+15+16
Parité Bloc 17 Bloc 18 Bloc 19 Bloc 20
17+18+19+20
18
3.7- RAID 6
• Les données sont entrelacées sur plusieurs disques physiques et une
double parité est utilisée pour stocker et restaurer les données. Cette
configuration tolère la défaillance de deux disques dans une pile,
assurant ainsi une meilleure tolérance aux pannes que RAID 5. Elle
permet aussi d’utiliser des disques ATA et SATA plus économiques
pour le stockage des données vitales.
• Ce niveau RAID est similaire à RAID 5, mais il comprend un deuxième
schéma de parité qui est distribué sur des disques différents, et offre
donc une tolérance extrême aux pannes et aux défaillances de
disques. RAID 6 peut tolérer une double défaillance de disques.
19
3.8- RAID Hybride
• Avec les 6 niveaux de RAID précédents, on peut jouer avec les
configurations pour construire des architectures de disques rapides et
sûres. Les plus communéments utilisées sont:
➔ RAID 0+1 : Deux groupes de n disques en RAID 0, ces deux groupes sont en RAID 1.
➔ RAID 10 (1+0) : n groupes de deux disques en RAID 1, tous ceux-ci en RAID 0. Il faut
que deux disques d'un même groupe rendent l'âme pour que le tout soit perdu, ce qui
réduit la probabilité de panne.
➔ RAID 50 (5+0) : n groupes de trois disques en RAID 5, tous ceux-ci en RAID 0. Il faut
que deux disques d'un même groupe rendent l'âme pour que le tout soit perdu, ce qui
réduit encore la probabilité de défaillance. Un des meilleurs compromis lorsque l'on
cherche la rapidité.
20
4- Types de RAID
21
4.1- RAID Logiciel
22
4.2- RAID Matériel Interne
• Les RAID matériels internes sont implémentés par des contrôleurs,
typiquement des cartes filles connectées en PCI. Ainsi les contrôleurs
travaillent indépendamment de la charge CPU et de façon constante.
• Les données relatives à la configuration RAID se trouvent sur tous les
disques durs du système RAID et sont ainsi protégées même si l'un
des disques ou le contrôleur venait à tomber en panne. Lors de
l'échange du contrôleur ou d'un disque, les données de configuration
RAID sont reconstruites grâce aux informations stockées sur les
disques.
23
4.3- RAID Matériel Externe
• Les RAID matériels externes
(souvent appelés Network
Attached Storage [NAS])
représentent la solution RAID
dite de haut de gamme. Ici, les
contrôleurs et les disques durs
sont logés dans un boîtier
externe autonome par rapport
à l'ordinateur. La connexion
est assurée par un câble SCSI
ou Fibre Channel.
RAID Externe – 4*300Go et Controleur raid 0,1,5 24
• L'utilisation d'un contrôleur RAID redondant augmente le niveau de
sécurité. Lorsque le contrôleur primaire tombe en panne, l'ensemble
RAID commute automatiquement sur le second contrôleur, sans perte
de temps et de données. Le contrôleur défectueux peut alors être
remplacé en cours de fonctionnement.
• Les RAID matériels externes travaillent, comme le contrôleur RAID
PCI, indépendamment de la charge CPU. Les données de l'adaptateur
SCSI sont directement transmises au contrôleur RAID via le bus SCSI.
25
5- Connectique utilisée
26
5.1- IDE
27
5.2- SCSI
• La plus implémentée des
connectiques RAID est sans
contexte SCSI (Small
computer System Interface).
Ce standard définit un bus
permettant de relier un
ordinateur à des
périphériques ou bien
même à un autre
ordinateur.
28
5.3- SATA
29
• Les premiers modèles de S-ATA, apparus en 2003 permettent un débit
théorique de 150 Mo/s mais il a été conçu pour aller bien plus vite.
• Le S-ATA 2 double sa vitesse à 300 Mo/s, puis les 600 Mo/s rattrapant
ainsi les 640mo/s du Ultra-640 SCSI, Physiquement les câbles utilisés
sont le plus grand changement du S-ATA.
• Les données sont transmises par un fil flexible de sept conducteurs
avec des connecteurs de 8 mm à chaque extrémité. Le Sata utilise
l'encodage 8b/10b pour effectuer des transferts (technique
d'encodage permettant une haute vitesse de transmission),
30
6- Contrôleurs
31
6.1- Adaptec SCSI RAID 2200S
• Adaptec est un des leader
mondiaux des contrôleurs RAID.
• Ce modèle utilise une interface
SCSI-3 Ultra-320 et gére les
niveaux de RAID 0,1,5,10,50 et
JBOD (addition de disques
disparates sans tolérance de
pannes). La Strip-size (taille des
blocs de données) est configurable
de 16Ko à 32Ko. Il dispose de 2
connecteur internes et 2 externes
et d'une mémoire cache de 64Mo.
32
• Fonctionnalités avancées:
➢ Batterie de secours pour maintenir le cache en cas de coupure de courant.
➢ Strip-Size variable: possibilité de modifier la Strip-Size aprés la création du
RAID et sans destruction de la grappe.
• Performances:
➢ RAID0: lecture=110,1 Mo/s et écriture=62,6 Mo/s
➢ RAID5: lecture=83,6 Mo/s et écriture=56,8 Mo/s
• Administration:
➢ Interface web sécurisée par SSL
➢ Interface ligne de commande
33
6.2- LSI Logic MegaRAID S-ATA 300-8X
34
• Fonctionnalités avancées:
➢ Batterie de secours pour maintenir le cache en cas de coupure de courant.
➢ Annonce acoustique des erreurs critiques.
➢ Migration RAID 0 vers RAID 10 et RAID 5 vers RAID 50
• Performances:
➢ RAID0: lecture=121,1 Mo/s et écriture=58,9 Mo/s
➢ RAID5: lecture=77,5 Mo/s et écriture=49,4 Mo/s
• Administration:
➢ Ligne de commande uniquement
35