v Utilitaires de diagnostic pour le système d'exploitation AIX
Le CD de diagnostic pour le système d'exploitation AIX, également appelé CD Diagnostics autonome,
est disponible auprès d'IBM. Vous pouvez lancer le CD à partir de l'unité correspondant ou à partir du
programme NIM. Pour télécharger l'image CD, accédez au site Web à l'adresse http://
www14.software.ibm.com/webapp/set2/sas/f/diags/home.html.
Pour savoir comment exécuter les utilitaires de diagnostic, voir Guide de maintenance et d'identification
des incidents.
v Utilitaires de diagnostic d'autres systèmes d'exploitation
D'autres systèmes d'exploitation pris en charge peuvent disposer d'outils de diagnostic qui leur sont
propres. Pour plus d'informations, consultez la documentation fournie avec votre système
d'exploitation.
v Lightpath Diagnostics
Utilisez les voyants Lightpath Diagnostics sur la carte mère pour identifier les erreurs système. Si le
voyant d'erreur système du panneau de voyants système situé à l'avant ou à l'arrière du châssis IBM
Flex System Enterprise est allumé, il se peut qu'un ou plusieurs voyants d'erreur soient également
allumés sur les composants du châssis IBM Flex System Enterprise. Ces voyants vous aident à
identifier l'origine du problème.
Remarques :
v Affichez le journal des événements système dans le module de gestion du châssis IBM Flex System
Enterprise.
v Avant d'effectuer la maintenance du noeud de traitement, vérifiez que vous disposez d'une connexion
SOL avec le noeud de traitement. Pour cela, vous devez configurer la fonction SOL sur le noeud de
traitement et démarrer une session SOL suivant la procédure décrite dans le manuel IBM Chassis
Management Module Command-Line Interface Reference Guide.
v Vous pouvez également configurer l'adresse IP du processeur de maintenance en utilisant le module de
gestion et configurer une connexion SOL au processeur de maintenance.
Programmes de diagnostic
Aidez-vous des outils de diagnostic disponibles pour résoudre les problèmes susceptibles de se produire
dans le noeud de traitement.
Dans une stratégie de maintenabilité efficace, l'aspect le plus critique concerne la capacité à détecter
précisément et efficacement les erreurs au moment où elles se produisent. Même si toutes les erreurs ne
menacent pas la disponibilité du système, celles qui ne sont pas détectées sont relativement dangereuses
car le système n'a pas la possibilité d'évaluer ni de traiter l'erreur si la situation l'exige. Les systèmes
équipés de processeurs POWER7 abritent des mécanismes de détection d'erreurs, qui couvrent plusieurs
niveaux (coeurs processeur, mémoire, blocs d'alimentation et unités de disque dur).
Les systèmes équipés de processeurs POWER7 comportent des circuits de détection de matériel élaborés,
qui permettent de détecter les opérations matérielles erronées. Ils vérifient la présence d'erreurs à
plusieurs niveaux : détection des erreurs de parité (avec reprise de bus et d'instruction processeur) et
vérification et correction d'erreurs (ECC) sur les caches et les bus système.
Les vérificateurs d'erreurs matérielles IBM réalisent les opérations suivantes :
v Surveillance continue des opérations système pour détecter les erreurs de calcul potentielles
v Isolement des pannes physiques en fonction des pannes détectées pendant la phase d'exécution
v Lancement de nombreux mécanismes de reprise visant à corriger un problème
Les systèmes équipés de processeurs POWER7 comportent des programmes de reprise du matériel et du
microprogramme extensifs.
Chapitre 8. Traitement des incidents
107