Configuration et annulation de configuration
des processeurs ou de la mémoire
Toutes les défaillances qui entraînent la panne du système avec un contrôle machine ou un
arrêt de contrôle, même intermittentes, sont signalées comme un appel sortant demandant
une intervention. Afin d'empêcher la récurrence de problèmes intermittents et d'améliorer la
disponibilité du système jusqu'à ce qu'une fenêtre de maintenance soit prévue, les
processeurs et les modules de mémoire dotés d'un historique de pannes portent la mention
"bad" afin d'empêcher qu'ils soient configurés lors des amorçages suivants.
Un processeur ou une mémoire DIMM portent la mention "bad" dans les circonstances
suivantes :
• Un processeur ou une mémoire DIMM échouent à l'autotest intégré (BIST) ou à l'autotest
à la mise sous tension (POST) au cours de l'amorçage (tel que déterminé par le Service
Processor).
• Un processeur ou une mémoire DIMM génèrent un contrôle machine ou un arrêt de
contrôle pendant le fonctionnement et la défaillance peut être isolée spécifiquement au
niveau de ce processeur ou de ce module mémoire (tel que déterminé par les
diagnostics de fonctionnement du processeur dans le Service Processor).
• Un processeur ou une mémoire DIMM atteignent un seuil de reprises après défaillance
entraînant un appel sortant informatif (tel que déterminé par les diagnostics de
fonctionnement du processeur dans le Service Processor).
Pendant le temps d'amorçage, le Service Processor ne configure pas les processeurs et les
mémoires DIMM portant la mention "bad".
Lorsque la configuration d'un processeur ou d'une mémoire DIMM est annulée, le
processeur ou la mémoire DIMM restent déconnectés lors des réinitialisations ultérieures,
jusqu'à ce qu'ils soient remplacés ou que Repeat Gard soit désactivé. La fonction Repeat
Gard permet également aux utilisateurs de retirer manuellement de la configuration un
processeur ou une mémoire DIMM. Pour plus d'informations sur la configuration ou
l'annulation de configuration d'un processeur, reportez–vous au menu Processor
Configuration/Deconfiguration page 3-13. Pour plus d'informations sur la configuration ou
l'annulation de configuration d'une mémoire DIMM, reportez–vous au menu Memory
Configuration/Deconfiguration page 3-14. Il s'agit de sous–menus du menu System
Information.
Vous pouvez activer ou désactiver la fonction CPU Repeat Gard ou Memory Repeat Gard à
l'aide du menu Processor Configuration/Deconfiguration, qui est un sous–menu du menu
System Information.
Annulation de la configuration de Run–Time CPU (CPU Gard)
Les erreurs réparables de la mémoire cache d'instructions L1, les erreurs corrigeables de la
mémoire cache de données L1 et les erreurs corrigeables de la mémoire cache L2 sont
surveillées par le code des diagnostics d'exécution du processeur (PRD) qui s'exécute dans
le Service Processor. Lorsqu'un seuil d'erreur prédéfini est atteint, un journal d'erreurs avec
gravité de l'avertissement et état du seuil dépassé est retourné à AIX. Dans le même
temps, PRD mentionne l'annulation de configuration de l'UC au prochain amorçage. AIX
tentera de transférer toutes les ressources associées à ce processeur vers un autre
processeur, puis d'arrêter le processeur défectueux.
3-28
ESCALA EPC810 et PL 800R Guide de l'utilisateur système