Dell EMC PowerEdge R740 Guide De Dépannage page 109

Table des Matières

Publicité

Dans un espace vide ne contenant aucune donnée. Cette bande sera inaccessible, mais comme aucune donnée ne s'y trouve, cela
n'aura aucun impact significatif. Toute tentative d'écriture par un système d'exploitation sur une bande faisant l'objet d'une ponction
RAID se produira à un autre emplacement.
Dans une bande contenant des données non stratégiques comme un fichier README.TXT. Si rien ni personne n'accède aux données
concernées, aucune erreur n'est générée pendant les opérations d'E/S normales. Les tentatives de sauvegarde du système de fichiers
se solderont par l'échec de la sauvegarde des fichiers concernés par une ponction RAID. L'exécution d'une vérification de cohérence ou
d'opérations de lecture cohérente généreront le code d'analyse : 3/11/00 pour la LBA et/ou les bandes concernées.
Dans un espace de données auxquelles des personnes et des processus accèdent. Dans un tel cas, les données perdues peuvent
provoquer diverses erreurs. Il peut s'agir d'erreurs mineures n'ayant aucune incidence sur l'environnement de production. Mais il peut
également s'agir d'erreurs plus graves pouvant empêcher le système de démarrer sur un système d'exploitation ou pouvant entraîner la
défaillance des applications.
Une matrice RAID ponctionnée finira par devoir être supprimée et recréée afin d'éliminer cette ponction RAID. Cette procédure entraîne la
suppression de l'intégralité des données. Il faut alors recréer ou restaurer toutes les données à partir d'une sauvegarde après l'élimination de
la ponction RAID. La résolution d'une ponction RAID peut être programmée à un moment plus opportun en fonction des besoins de
l'entreprise.
Si les données d'une bande faisant l'objet d'une ponction RAID sont lues, des erreurs continueront de se produire au niveau des LBA
affectées, sans correction possible. La table de gestion des blocs endommagés (BBM) finit par se remplir (en quelques minutes, jours,
semaines, mois, etc.), associant un ou plusieurs disques à des alertes de défaillance prédictives. Comme la figure le montre, le disque 0 est
généralement celui qui est concerné par l'alerte de défaillance prédictive, car les erreurs des disques 1 et 2 y sont propagées. Le disque 0
pourrait tout à fait fonctionner normalement, et son remplacement par un disque de rechange entraînerait tout de même au bout du
compte une alerte de défaillance prédictive.
Une vérification de cohérence effectuée après une ponction RAID ne résout pas le problème. C'est pourquoi il est crucial d'exécuter
régulièrement des vérifications de cohérence. Cette vérification devient particulièrement importante avant le remplacement des disques, si
possible. La matrice doit se trouver dans un état optimal pour l'exécution de la vérification de la cohérence.
Une matrice RAID présentant une seule erreur de données en conjonction avec un autre événement d'erreur tel qu'un disque dur défaillant
provoque une ponction RAID lors de la reconstruction du disque défaillant ou du disque de rechange dans la matrice. À titre d'exemple, une
matrice RAID 5 optimale contient trois membres : disque 0, disque 1 et disque 2. Si le disque 0 tombe en panne et s'il est remplacé, les
données et la parité restantes sur les disques 1 et 2 sont utilisées pour reconstruire les informations manquantes sur le disque de
rechange 0. Toutefois, s'il existe une erreur de données sur le disque 1, lorsque l'opération de reconstruction atteint cette erreur, il n'y a pas
suffisamment d'informations dans la bande pour reconstruire les données manquantes sur cette dernière. Le disque 0 ne contient aucune
donnée, le disque 1 contient des données corrompues et le disque 2 contient des données valides suite à sa reconstruction. Il existe
plusieurs erreurs dans cette bande. Les disques 0 et 1 ne contiennent pas de données valides, donc toutes les données de cette bande ne
peuvent pas être restaurées et sont perdues. Comme le montre la figure 3, cela entraîne des ponctions RAID (dans les bandes 1 et 2)
pendant la reconstruction. Les erreurs sont propagées sur le disque 0.
Figure 24. Ponctions RAID
La ponction de la matrice rétablit la redondance et restaure son état optimal. Cela permet à la matrice d'être protégée contre la perte de
données supplémentaires en cas de nouvelle erreur ou de défaillance de disque.
Dépannage des problèmes matériels
109

Publicité

Table des Matières
loading

Table des Matières