Les contrôleurs matériels RAID utilisent une mémoire cache (référentiel d'informations temporaire) pour leur fonctionnement normal. Le
fonctionnement normal d'une mémoire cache comprend une mémoire DRAM, qui à l'instar de la mémoire système, conserve
uniquement les données lorsque le serveur est sous tension.
Les contrôleurs plus récents utilisent une mémoire NVCache, qui est utilisée lorsque le serveur est hors tension. La mémoire NVCache
contient à la fois une mémoire DRAM (pour un fonctionnement normal) et une mémoire Flash (non volatile). La batterie des contrôleurs
(si elle est opérationnelle) alimente la mémoire DRAM lors d'une coupure d'alimentation afin que le contenu puisse être copié dans la
mémoire Flash pour un stockage indéfini.
Le contenu de la mémoire cache peut être réparti pour l'essentiel en trois parties :
•
Configuration et métadonnées RAID : informations sur les matrices RAID, notamment les informations de configuration, les membres
des disques, le rôle des disques, etc.
•
Logs de contrôleurs : les contrôleurs RAID gèrent plus fichiers logs. Les techniciens Dell s'appuient sur le log TTY en tant que log
principal pour résoudre divers problèmes RAID et de disques durs.
•
Données RAID : il s'agit des données réelles destinées à être écrites sur les disques durs individuels. Les données sont écrites dans la
mémoire cache du contrôleur dans les modes Mémoire cache à écriture différée et Mémoire cache à double écriture.
Découpage
La configuration de plusieurs matrices RAID dans un seul et même ensemble de disques est appelée découpage.
Défaillance RAID
Une défaillance RAID est une fonction du contrôleur RAID PowerEdge (PERC) Dell conçue pour permettre au contrôleur de restaurer la
redondance de la matrice malgré la perte de données causée par une condition de double panne. La défaillance RAID est également appelée
reconstruction avec erreurs. Si le contrôleur RAID détecte une double panne et que la redondance est insuffisante pour restaurer les
données dans la bande concernée, le contrôleur crée une défaillance dans cette bande et permet à la reconstruction de se poursuivre.
•
La double panne est une condition qui entraîne l'inaccessibilité des données dans une même bande sur plusieurs lecteurs.
•
Les doubles pannes entraînent la perte de toutes les données au sein de la bande impactée.
•
Toutes les défaillances RAID sont des doubles pannes, mais les doubles pannes ne sont PAS des défaillances RAID.
Matrice RAID ponctionnée : causes
Sans la fonction de ponction RAID, la reconstruction de la matrice ne fonctionnerait pas et la laisserait dans un état dégradé. Dans certains
cas, les pannes peuvent entraîner la défaillance d'autres disques, et faire passer la matrice dans un état hors ligne non opérationnel. La
ponction d'une matrice n'a aucun impact sur son démarrage ou sur l'accès aux données qu'elle contient.
Les ponctions RAID peuvent se produire dans l'une de ces deux situations :
•
Une double panne est déjà en cours (données déjà perdues).
Une erreur de données sur un disque en ligne s'est propagée (copiée) sur un disque en reconstruction.
•
La double panne n'est pas survenue (les données sont perdues au moment de la deuxième erreur).
À l'état dégradé, si un disque en ligne présente un bloc défectueux, cette adresse de bloc logique est ponctionnée de la matrice RAID.
L'avantage de ponctionner une matrice est de maintenir la disponibilité du système en production jusqu'au rétablissement de la redondance
de la matrice. Les données de la bande affectée sont perdues, que la matrice RAID soit ponctionnée ou non. L'inconvénient principal de
cette méthode, c'est que pendant que la matrice RAID est ponctionnée, des erreurs irrémédiables continueront de se produire à chaque
accès aux données concernées (le cas échéant).
Une ponction RAID peut se produire aux trois emplacements suivants :
108
Dépannage des problèmes matériels