8.5
Reprise après une panne d'unité fatale
Avec un système de baie RAID redondant, votre système est protégé par l'unité de
parité RAID et un disque de rechange global ou plusieurs disques de rechange.
Une FATAL FAIL survient lorsque plus de pannes de disque que votre redondance
RAID ne peut en gérer surviennent. La redondance de votre baie RAID dépend de
votre configuration. Dans une configuration RAID 3 ou RAID 5, deux unités de
disque ou plus de plus que le nombre de disques de rechange disponibles doivent
tomber en panne pour obtenir le statut FATAL FAIL. Dans une configuration RAID
1, vous pouvez perdre plusieurs unités sans panne fatale si l'on ne compte parmi
toutes les unités en panne pas plus d'une unité d'une paire mise en miroir.
Il peut être possible de reprendre une baie RAID d'une FATAL FAIL. Il peut
cependant être impossible de réaliser une récupération totale des données, cela
dépendra des circonstances de la panne. Il est important de contrôler les données
récupérées en utilisant l'application de données ou les outils basés sur l'hôte à la
suite d'une reprise sur FATAL FAIL.
Il est rare que deux unités de disque ou plus tombent en panne en même temps.
Pour minimiser les risques que cela ne se produise, il convient d'effectuer des
contrôles d'intégrité RAID réguliers. Pour RAID 3 et RAID 5, cela se fait en utilisant
l'option « regenerate Parity » de la console de la baie de disques ou en utilisant
l'utilitaire check parity de la CLI Sun StorEdge. Pour plus d'informations sur
l'option « regenerate Parity », reportez-vous au Guide de l'utilisateur du microprogramme
RAID pour la famille Sun StorEdge 3000. Pour en savoir plus sur l'utilisation de
l'utilitaire de ligne de commande check parity, reportez-vous au Guide de
l'utilisateur pour la CLI de la famille Sun StorEdge 3000.
Si une double panne de disque est survenue, une reprise peut être possible en
procédant comme suit :
1. Mettez immédiatement fin à toutes les activités E/S.
2. Pour couper l'alarme sonore, choisissez « system Functions → Mute beeper »
dans le menu principal du microprogramme du contrôleur.
Pour plus d'informations sur la coupure des alarmes sonores, reportez-vous à la
Section 8.2, « Coupure des alarmes sonores », page
3. Contrôlez physiquement que toutes les unités sont bien installées dans la baie et
qu'aucune d'entre elles n'a été retirée partiellement ou complètement.
4. Dans le menu principal du microprogramme, choisissez « view and edit Logical
drives » et recherchez :
Status: FAILED DRV (une unité en panne)
Status: FATAL FAIL (deux unités en panne ou plus)
8-6.
Chapitre 8 Dépannage de la baie
8-9