Reprise automatique après blocage du
système
Le contrôleur système vérifie automatiquement si les systèmes sont bloqués lorsque
l'un des incidents suivants se produit :
Les pulsations du système d'exploitation s'arrêtent au cours d'un délai
■
d'expiration donné.
La durée de ce timeout est par défaut de trois minutes mais vous pouvez modifier
cette valeur en configurant le paramètre watchdog_timeout_seconds dans le
fichier /etc/systems du domaine. Si vous choisissez une valeur inférieure à
trois minutes, le contrôleur système utilise néanmoins le délai d'expiration par
défaut de trois minutes. Pour de plus amples informations sur ce paramètre
système, reportez-vous à la page man system(4) de votre version de le système
d'exploitation Solaris.
Le système ne répond pas aux interruptions.
■
Lorsque le paramètre host watchdog (décrit dans la commande setupsc) est
activé, le contrôleur système exécute automatiquement une réinitialisation
déclenchée en externe (XIR, Externally Initiated Reset) et redémarre le système
d'exploitation bloqué. Si la variable OpenBootPROM nvram error-reset-
recovery est définie sur sync, un fichier core pouvant servir au dépannage du
système d'exploitation bloqué est également généré après une réinitialisation XIR.
L'
EXEMPLE DE CODE 7-2
pulsations du système d'exploitation cessent.
EXEMPLE DE CODE 7-2
Tue Dec 09 12:24:47 commando lom: Domain watchdog timer expired.
Tue Dec 09 12:24:48 commando lom: Using default hang-policy (RESET).
Tue Dec 09 12:24:48 commando lom: Resetting (XIR) domain.
L'
EXEMPLE DE CODE 7-3
système d'exploitation cesse de répondre aux interruptions.
EXEMPLE DE CODE 7-3
Tue Dec 09 12:37:38 commando lom: Domain is not responding to interrupts.
Tue Dec 09 12:37:38 commando lom: Using default hang-policy (RESET).
Tue Dec 09 12:37:38 commando lom: Resetting (XIR) domain
66
Guide d'administration des systèmes d'entrée de milieu de gamme Sun Fire • août 2005
représente un message de la console qui s'affiche lorsque les
Exemple de message affiché pour la reprise automatique d'un domaine après
l'arrêt des pulsations du système d'exploitation
représente un message de la console qui s'affiche lorsque le
Exemple de sortie de la console affiché pour la reprise automatique lorsqu'un
système d'exploitation cesse de répondre aux interruptions