Une fois le domaine de contrôle rétabli, un diagnostic est exécuté. Les messages
adressés à la console indiquent la cause de l'erreur irrécupérable. Exemple :
SUNW-MSG-ID: SUN4V-8000-UQ, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: Fri Aug 17 18:00:57 EDT 2007
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: wgs48-100
SOURCE: cpumem-diagnosis, REV: 1.6
EVENT-ID: a8b0eb18-6449-c0a7-cc0f-e230a1d27243
DESC: The number of level 2 cache uncorrectable data errors has exceeded
acceptable levels. Refer to http://sun.com/msg/SUN4V-8000-UQ for more
information.
AUTO-RESPONSE: No automated response.
IMPACT: System performance is likely to be affected.
REC-ACTION: Schedule a repair procedure to replace the affected resource,
the identity of which can be determined using fmdump -v -u <EVENT_ID>.
À ce stade, vous pouvez avoir rencontré ce problème. Celui-ci bloque la transmission
de futurs événements PSH (de nouvelles erreurs matérielles, corrigibles ou
incorrigibles, par exemple) dans le domaine et leur diagnostic.
Solution : une fois le domaine rétabli et le message de diagnostic imprimé sur la
console Solaris, réinitialisez le processeur de service de la manière suivante :
sc> resetsc -y [ALOM CMT compatibility CLI]
OR
-> reset /SP [ILOM CLI]
Une fois que le SP est redémarré et que vous pouvez vous connecter en tant
qu'utilisateur admin (autrement dit, tous les démons sont prêts), exécutez la
commande suivante dans le domaine de contrôle Solaris :
# fmadm unload etm
# fmadm load /usr/platform/sun4v/lib/fm/fmd/plugins/etm.so
# prtdiag -v
Chapitre 2
Problèmes de dernière minute
69