Présentation de la gestion des erreurs liées à la
mémoire
La configuration du sous-système de mémoire et la gestion des erreurs liées à la
mémoire dépendent de plusieurs fonctions. Une bonne compréhension de ces fonctions
sous-jacentes vous aidera à identifier et corriger les problèmes liés à la mémoire.
Remarque : Pour plus d'informations sur la configuration de la mémoire,
reportez-vous à la
« Configuration FB-DIMM prises en charge », page
Le serveur utilise la technologie ECC avancée qui corrige jusqu'à 4-bits dans les erreurs
de limites dans les groupes de quatre bits, sous réserve qu'ils se trouvent tous dans la
même mémoire DRAM. Avec les modules de mémoire FB-DIMM de 4 Go, en cas de
panne de mémoire DRAM, le module de mémoire DIMM continue de fonctionner.
Les fonctions suivantes du serveur gèrent en toute indépendance les erreurs de
mémoire :
POST : basé sur les variable de configuration ILOM, le POST est exécuté à la mise
■
sous tension du serveur.
En cas d'erreur récupérable, le POST la transfère au démon d'autorétablissement
prédictif Solaris chargé de la gestion de l'erreur. Si une erreur de mémoire
irrécupérable est détectée, le POST l'affiche en utilisant le nom de périphérique
du module FB-DIMM défectueux, puis il consigne l'erreur. Le POST désactive
ensuite les modules de mémoire FB-DIMM défectueux. Suivant la configuration
de la mémoire et l'emplacement du module de mémoire FB-DIMM défectueux, le
POST désactive la moitié de la mémoire physique du système ou la moitié de la
mémoire physique et la moitié des unités d'exécution du processeur. Lorsque ce
processus de désactivation survient dans des conditions d'utilisation normale,
vous devez remplacer les modules de mémoire FB-DIMM défectueux en fonction
du message d'erreur, puis activer les modules de mémoire FB-DIMM désactivés à
l'aide de la commande set device component_state=enabled où device
désigne le module de mémoire FB-DIMM activé (par exemple, set
/SYS/MB/CMP0/BR0/CH0/D0 component_state=enabled).
Technologie d'autorétablissement prédictif Solaris : fonction du SE Solaris qui
■
utilise le démon de gestion des erreurs (fmd) pour contrôler certains types
d'erreur. Lorsqu'une erreur survient, un ID de panne unique (UUID) lui est
assigné avant qu'elle ne soit consignée. L'autorétablissement prédictif Solaris
signale l'erreur et identifie l'emplacement des modules FB-DIMM défectueux.
Si vous suspectez un problème de mémoire au niveau du serveur, reportez-vous à
l'organigramme de diagnostic (voir
faulty d'ILOM. La commande show faulty affiche la liste des erreurs de
mémoire et répertorie les modules de mémoire FB-DIMM associés.
). Exécutez la commande show
FIGURE 2-1
Chapitre 2
98.
Gestion des erreurs
21