Configuration et déconfiguration des processeurs ou de la
mémoire
Toutes les défaillances qui entraînent une panne du système avec un incident machine ou
un arrêt de contrôle, même intermittentes, sont signalées comme un appel sortant
demandant une intervention. Afin d'empêcher la récurrence de problèmes intermittents et
d'améliorer la disponibilité du système jusqu'à ce qu'une fenêtre de maintenance soit
prévue, les processeurs et les modules DIMM dotés d'un historique de pannes portent la
mention "bad" pour qu'ils ne soient pas configurés lors des amorçages suivants.
Un processeur ou un module DIMM portera la mention « bad » dans les circonstances
suivantes :
• Son autotest intégré (BIST) ou son autotest à la mise sous tension (POST) échoue au
cours de l'amorçage (tel que déterminé par le processeur de support).
• Un processeur ou un module DIMM produit un incident machine ou un arrêt de contrôle
en cours d'exécution, et la défaillance peut être localisée spécifiquement au niveau de
ce processeur ou module DIMM (tel que spécifié par les diagnostics d'exécution du
processeur dans le processeur de support).
• Un processeur ou un module DIMM atteint un seuil de reprises après défaillance
entraînant un appel sortant informatif (tel que déterminé par les diagnostics d'exécution
du processeur dans le processeur de support).
Au cours de l'amorçage, le processeur de support ne configure pas les processeurs, ni les
modules DIMM portant la mention "bad".
Si un processeur ou un module DIMM est déconfiguré, le processeur ou le module restera
hors ligne lors des amorçages suivants jusqu'à ce qu'il soit remplacé ou que la fonction
Repeat Gard soit désactivée. La fonction Repeat–Gard permet également aux utilisateurs
d'annuler manuellement la configuration d'un processeur ou d'un module DIMM, ou de
réactiver manuellement le processeur ou le module dont la configuration a été annulée.
Pour plus d'informations sur la configuration ou l'annulation de la configuration d'un
processeur, reportez–vous au menu Processor Configuration/Deconfiguration, page
(PCDM), à la page 3-15. Pour plus d'informations sur la configuration ou l'annulation de la
configuration d'un module DIMM, reportez–vous au menu Memory
Configuration/Deconfiguration, page(MCDM), à la page 3-17. Ces deux menus sont des
sous–menus du menu System Information (informations du système).
Vous pouvez activer ou désactiver la fonction CPU Repeat Gard ou Memory Repeat Gard à
l'aide du menu Processor Configuration/Deconfiguration, qui est un sous–menu du menu
System Information.
Annulation de la configuration de Run–Time CPU (CPU Gard)
Les erreurs réparables de la mémoire cache d'instructions L1, les erreurs corrigeables de la
mémoire cache de données L1 et les erreurs corrigeables de la mémoire cache L2 sont
surveillées par le code des diagnostics d'exécution du processeur (PRD) qui s'exécute dans
le Service Processor. Lorsqu'un seuil d'erreur prédéfini est atteint, un journal d'erreurs avec
gravité de l'avertissement et état du seuil dépassé est retourné à AIX. Dans le même
temps, PRD mentionne l'annulation de configuration de l'UC au prochain amorçage. AIX
tentera de transférer toutes les ressources associées à ce processeur vers un autre
processeur, puis d'arrêter le processeur défectueux.
Utilisation du processeur de maintenance
3-37