Les composants matériels et logiciels du sous-système de surveillance garantissent que
la température ambiante du serveur ne s'écarte pas d'une plage de températures
prédéfinie. Si la température observée par un capteur dépasse un seuil d'avertissement
de température insuffisante ou excessive, le logiciel du sous-système de surveillance
allume les indicateurs Maintenance requise du système sur les panneaux avant et
arrière. Si la condition de température persiste et atteint un seuil critique, le système
initie un arrêt progressif du système. En cas de panne du Contrôleur système ALOM,
les capteurs de sauvegarde permettent de protéger le système de dégâts importants en
effectuant un arrêt matériel forcé.
Tous les messages d'erreur et avertissements sont envoyés à la console système et
consignés dans le fichier /var/adm/messages. Les indicateurs Maintenance
requise restent allumés après un arrêt automatique du système pour faciliter le
diagnostic des problèmes.
Le sous-système de surveillance est également conçu pour détecter les pannes de
ventilateur. Le système inclut des plateaux de ventilateur des alimentations complets
et six plateaux de ventilateur, chacun contenant un ventilateur. Quatre ventilateurs
sont réservés au refroidissement des modules CPU/mémoire et deux autres au
refroidissement de l'unité de disque. Tous les ventilateurs sont remplaçables à chaud.
En cas de dysfonctionnement d'un ventilateur, le sous-système de surveillance détecte
la panne et génère un message d'erreur dans la console système, consigne le message
dans le fichier /var/adm/messages et allume les indicateurs Maintenance requise.
Le sous-système d'alimentation est contrôlé de la même manière. En interrogeant
régulièrement l'état des alimentations, le sous-système de surveillance indique l'état
des sorties CC, CA et la présence de chaque alimentation.
Remarque – Les ventilateurs des alimentations ne sont pas nécessaires pour le
refroidissement du système. Cependant, en cas de panne d'une alimentation, son
ventilateur est alimenté par les autres alimentations et via la carte mère pour assurer
le refroidissement.
Si un problème d'alimentation est détecté, la console affiche un message d'erreur,
puis le consigne dans le fichier /var/adm/messages. De plus, les indicateurs situés
sur chaque alimentation s'allument en cas de panne. L'indicateur Maintenance
requise s'allume pour indiquer une panne du système. Les alertes de la console du
Contrôleur système ALOM enregistrent les pannes des alimentations.
chapitre 5 Gestion des fonctions RAS et du microprogramme du système
105