Sommaire des Matières pour Sun Microsystems Fire X4140
Page 1
Guide de diagnostic des serveurs Sun Fire™ X4140, X4240 et X4440 Sun Microsystems, Inc. www.sun.com Réf. 820-5229-10 Juin 2008, Révision A Merci d'envoyer vos commentaires concernant ce document à l'adresse : http://www.sun.com/hwdocs/feedback...
Page 2
Cette distribution peut inclure des éléments développés par des tiers. Sun, Sun Microsystems, le logo Sun, Java, Solaris, Sun Fire 4140, Sun Fire 4240 et Sun Fire 4440 sont des marques commerciales ou des marques déposées de Sun Microsystems, Inc. aux États-Unis et dans d'autres pays.
Sommaire Préface ix Inspection initiale du serveur 1 Diagramme de dépannage 1 Collecte des informations de maintenance Inspection du système 3 Dépannage des problèmes d'alimentation 3 Inspection externe du serveur Inspection interne du serveur 4 Utilisation du logiciel de diagnostic SunVTS 7 Exécution de tests de diagnostic à...
Page 4
Diodes d'état 37 Diode d'état externes 37 Diodes du panneau avant 38 Diodes du panneau arrière 38 Diodes du disque dur 39 Diodes d'état internes 39 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 5
Utilisation de l'interface utilisateur graphique du processeur de service ILOM pour afficher les informations système 43 Établissement d'une connexion série au processeur de service 44 Affichage des journaux des événements du processeur de service ILOM Interprétation des horodatages du journal des événements Affichage des informations sur les composants remplaçables Affichage des capteurs Liste de capteurs 55...
Page 6
65 Capteurs de tension de la carte mère 66 mb.v_bat 66 mb.v_+3v3stby 66 mb.v_+3v3 66 mb.v_+5v 66 mb.v_+12v 66 mb.v_+1v5 66 mb.v_+1v2ht 67 mb.v_+1.4 67 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 7
Capteurs de tension de la carte Mezzanine (Sun Fire X4440 uniquement) 69 mezz.v_+3v3stby 69 mezz.v_+3v3 69 mezz.v_+12v 69 mezz.v_+1v2ht 69 Capteurs de tension de la CPU 72 pX.v_vddcore 72 pX.v_+1v8 72 pX.v_+0v9 72 pX.v_vddnb 72 Capteurs de présence de ventilateurs 75 fbX.fmY.prsnt 75 Capteurs de vitesse des ventilateurs 75 fbX.fmY.fZ.speed 75...
Page 8
Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Préface Le Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 contient des informations et des procédures sur l'utilisation des outils disponibles pour diagnostiquer les problèmes liés aux serveurs. Avant de lire ce manuel Il est important de consulter les instructions de sécurité du document Sun Fire X4140, X4240, and X4440 Safety and Compliance Guide (Guide de conformité...
Des versions traduites d'une partie de ces documents sont disponibles sur le site Web http://docs.sun.com. Choisissez une langue dans la liste déroulante de documents relatifs aux serveurs Sun Fire X4140, X4240 et X4440 à l'aide du lien de Product category (Catégorie de produit). Des versions traduites de la documentation relative aux serveurs Sun Fire X4140, X4240, et X4440 sont disponibles en chinois simplifié, chinois traditionnel, français, japonais et coréen.
Conventions typographiques Police de caractères Signification Exemples Noms de commandes, de fichiers Modifiez le fichier .login. AaBbCc123 et de répertoires ; informations Utilisez ls -a pour afficher la liste de affichées à l’écran. tous les fichiers. % Vous avez du courrier. Ce que vous tapez est mis en AaBbCc123 évidence par rapport aux...
Veuillez mentionner le titre et le numéro de référence du document dans vos commentaires : Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440, numéro de référence 820-5229-10 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
C H A P I T R E Inspection initiale du serveur Ce chapitre aborde les sujets suivants : « Diagramme de dépannage », page 1 ■ « Collecte des informations de maintenance », page 2 ■ « Inspection du système », page 3 ■...
4. Vérifiez la présence de conflits potentiels entre les périphériques avant d'ajouter un nouveau périphérique. 5. Vérifiez les dépendances de versions, en particulier avec les logiciels tiers. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Inspection du système Une mauvaise configuration des contrôles ou des câbles desserrés ou mal connectés sont souvent à l'origine des problèmes liés aux composants matériels. Dépannage des problèmes d'alimentation Si le serveur se met sous tension, passez directement à la section «...
électriques sont toujours alimentés. Dans ce cas, la diode d'alimentation/OK clignote. Pour mettre complètement hors tension le serveur, vous devez déconnecter les cordons d'alimentation électrique à l'arrière du serveur. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 17
Panneau avant du serveur X4140 FIGURE 1-1 Bouton/diode de repérage Bouton d'alimentation Panneau avant du serveur X4440 FIGURE 1-2 Bouton/diode de repérage Bouton d'alimentation 2. Retirez le capot du serveur. Pour plus d'instructions sur le retrait du capot du serveur, reportez-vous au manuel d'entretien de votre serveur.
Page 18
à la mise sous tension et les journaux des événements du BIOS au démarrage du système pour obtenir plus d'informations. Poursuivez en vous reportant à la section « Affichage des journaux des événements », page Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
C H A P I T R E Utilisation du logiciel de diagnostic SunVTS Ce chapitre contient des informations sur le logiciel de diagnostic SunVTS™. Exécution de tests de diagnostic à l'aide de SunVTS Les serveurs sont livrés avec un CD de diagnostic initialisable qui contient le logiciel Sun Validation Test Suite (SunVTS).
Pour utiliser le CD de diagnostic initialisable, vous devez disposer d'un clavier, ■ d'une souris et d'un écran raccordés au serveur sur lequel vous exécutez les diagnostics ou disponibles via une connexion KVM distante. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Utilisation du CD de diagnostic initialisable Pour utiliser le CD de diagnostic pour réaliser des diagnostics 1. Une fois le serveur sous tension, insérez le CD dans l'unité de DVD-ROM. 2. Réinitialisez le serveur et appuyez sur F2 pour effectuer l'initialisation de façon à...
Page 22
Pour conserver les fichiers journaux, vous devez les enregistrer sur un périphérique de stockage amovible ou les transférer via FTP sur un autre système. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
C H A P I T R E Dépannage des problèmes DIMM Ce chapitre décrit comment détecter et corriger les problèmes liés aux modules DIMM (Dual Inline Memory Modules) du serveur. Il comprend les sections suivantes : « Règles de population DIMM », page 11 ■...
à la mise sous tension (POST) après le test memtest : A Hypertransport Sync Flood occurred on last boot Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 25
3. Le BIOS consigne cet événement dans le fichier journal des événements système (SEL) du processeur de service, comme indiqué dans l'exemple de sortie de l'outil IPMItool ci-dessous : ipmitool -H 10.6.77.249 -U root -P changeme -I lanplus sel list 8 | 09/25/2007 | 03:22:03 | System Boot Initiated #0x02 | Initiated by warm reset | Asserted 9 | 09/25/2007 | 03:22:03 | Processor #0x04 | Presence detected | Asserted...
Une info-bulle de message d'erreur machine s'affiche dans la barre des tâches. b. L'utilisateur doit ouvrir manuellement l'Observateur d'événements pour voir les erreurs. Pour accéder à l'Observateur d'événements, suivez le chemin d'accès suivant : Démarrer-->Outils d'administration-->Observateur d'événements Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
c. L'utilisateur peut alors consulter les détails des erreurs individuelles (par heure). Solaris : ■ Solaris FMA consigne et (parfois) met hors service des modules de mémoire indiquant des erreurs ECC (Erreur Correction Code, code correcteurs d'erreurs) corrigibles. Pour plus d'informations, reportez-vous à la documentation du système d'exploitation Solaris.
Remarque – La diode d'erreur de la carte mère fonctionne indépendamment du bouton Press to See Fault et n'utilise pas l'électricité stockée. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 29
Reportez-vous à la pour connaître l'emplacement des modules DIMM et FIGURE 3-1 des diodes sur la carte mère. Reportez-vous à la pour connaître FIGURE 3-2 l'emplacement des modules DIMM et des diodes sur la carte mezzanine. Modules DIMM et diodes de la carte mère FIGURE 3-1 Chapitre 3 Dépannage des problèmes DIMM...
2. Inspectez les DIMM installés pour vous assurer qu'ils sont conformes aux règles décrites dans « Règles de population DIMM », page Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 31
3. Appuyez sur le bouton PRESS TO SEE FAULT et inspectez les diodes d'erreur de DIMM. Voir la et la FIGURE 3-1 FIGURE 3-2 Une diode qui clignote indique un composant défectueux. Pour les erreurs corrigibles, les diodes identifient le module DIMM sur lequel ■...
Page 32
11. Mettez le serveur sous tension et exécutez de nouveau le test de diagnostic. 12. Consultez le fichier journal. Si les tests indiquent la même erreur, le problème est lié à la CPU et non aux modules DIMM. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
A N N EXE Journaux des événements et codes d'autotest à la mise sous tension (POST) Cette annexe contient des informations sur le journal des événements du BIOS, le journal des événements système du BMC, l'autotest à la mise sous tension (POST) et la redirection de la console.
Page 34
* Enter Go to Sub Screen * * F1 General Help * F10 Save and Exit * ESC Exit ****************************************************************************** v02.61 (C)Copyright 1985-2006, American Megatrends, Inc. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 35
b. Dans l'écran Advanced Settings (Paramètres avancés), sélectionnez Event Log Configuration (Configuration du journal des événements). L'écran Event Logging Details (Détails de la consignation d'événements) du menu Advanced s'affiche. Advanced ****************************************************************************** * Event Logging details * View all unread events * * *************************************************** * on the Event Log.
Page 36
ILOM pour afficher les informations système », page 43 « Affichage des journaux des événements du processeur de service ILOM », page Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Test à la mise sous tension (POST, Power-On Self-Test) Le BIOS du système fournit un test à la mise sous tension rudimentaire. Les éléments de base nécessaires au fonctionnement du système sont vérifiés, la mémoire est testée, le contrôleur de disques et les disques connectés sont vérifiés et énumérés et les deux contrôleurs Intel Dual Gigabit Ethernet sont initialisés.
Sélectionnez Refresh (Actualiser) et appuyez sur Entrée pour voir les nouveaux paramètres dans le champ Current IP address in BMC (Adresse IP actuelle dans le contrôleur BMC). Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 39
6. Démarrez un navigateur Web et tapez l'adresse IP du processeur de service dans la zone d'adresse du navigateur. 7. Lorsque vous y êtes invité, tapez un nom d'utilisateur et un mot de passe comme suit : User Name: root ■...
* Enter Go to Sub Screen * * F1 General Help * F10 Save and Exit * ESC Exit ****************************************************************************** v02.61 (C)Copyright 1985-2006, American Megatrends, Inc. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 41
3. Sélectionnez Boot Settings Configuration (Configuration des paramètres d'initialisation). L'écran Boot Settings Configuration s'affiche. Boot ****************************************************************************** * Boot Settings Configuration * Allows BIOS to skip * *************************************************** * certain tests while * Quick Boot [Disabled] * booting. This will * Quiet Boot [Disabled] * decrease the time * AddOn ROM Display Mode...
Page 42
■ crochets représentent les périphériques de démarrage. Pour voir les lettres définies, positionnez votre curseur sur le champ et lisez la définition à droite de l'écran. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Codes POST contient des descriptions de chaque code POST, dans l'ordre dans TABLEAU A-1 lequel ils sont générés. Ces codes POST sont constitués de quatre chiffres : deux chiffres correspondant à la sortie du port d'E/S principal 80, et deux chiffres correspondant à...
Page 44
Préparation de la CPU pour initialisation du système d'exploitation par copie de tout le contexte du BSP vers tous les processeurs d'applications présents. REMARQUE : les AP restent dans l'état CLI HLT. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Points de contrôle des codes POST Les points de contrôle des codes POST correspondent au groupe de points de contrôle le plus important au cours de la pré-initialisation du BIOS. Le TABLEAU A-2 décrit les types de points de contrôle qui peuvent être générés lors de la phase POST du BIOS.
Page 46
Affichage d'un message de connexion, des informations CPU, du message de touche de configuration et des informations OEM. Initialisation de différentes unités via DIM. Initialisation de DMAC-1 et de DMAC-2. Initialisation de la date/heure RTC. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 47
Points de contrôle des codes POST (suite) TABLEAU A-2 Code POST Description Test de la mémoire totale installée dans le système. Vérification des touches SUPPR ou ÉCHAP pour limiter le test de la mémoire. Affichage de la mémoire totale du système. Test de lecture/écriture RAM désormais terminé, programmation des trous de mémoire ou gestion des ajustements nécessaires pour la taille RAM en fonction de NB.
Page 48
Erreur OEM POST : Cette plage est réservée aux fabricants de chipsets et de systèmes. L'erreur associée à cette valeur peut varier en fonction de la plate-forme. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
A N N EXE Diodes d'état Cette annexe contient des informations sur l'emplacement et le comportement des diodes du serveur. Elle décrit les diodes situées sur la partie externe du serveur, ainsi que les diodes internes qui sont uniquement visibles lorsque vous retirez le capot principal du serveur.
Côté droit : La couleur verte indique une activité de liaison. La couleur orange indique que la liaison s'effectue à une vitesse inférieure à la vitesse maximale. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Diodes du disque dur Diodes du disque dur FIGURE B-3 Légende de la figure Diode Ready to remove (retrait autorisé) : bleue, action de maintenance nécessaire Diode d'erreur : orange, action de maintenance nécessaire Diode d'état : verte, clignote lorsque des données sont transférées Diodes d'état internes Le serveur comprend des diodes d'état internes sur la carte mère et sur la carte mezzanine.
Page 52
La diode d'erreur de la carte mère indique que l'une ou plusieurs des diodes de la carte mère est active. Modules DIMM et diodes situés sur la carte mère FIGURE B-4 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 53
Modules DIMM et diodes situés sur la carte mezzanine FIGURE B-5 Annexe B Diodes d'état...
Page 54
Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
A N N EXE Utilisation de l'interface utilisateur graphique du processeur de service ILOM pour afficher les informations système Cette annexe contient des informations sur l'utilisation de l'interface graphique du processeur de service (SP) ILOM (Integrated Lights Out Manager) pour afficher des informations de surveillance et de maintenance relatives à...
« Affichage des journaux des événements du processeur de service ILOM », ■ page 45 « Affichage des informations sur les composants remplaçables », page 49 ■ « Affichage des capteurs », page 51 ■ Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Affichage des journaux des événements du processeur de service ILOM Les événements sont des notifications qui se produisent en réponse à des actions. Le journal des événements système (SEL) IPMI fournit des informations sur l'état du matériel et des logiciels du serveur Sun au logiciel ILOM qui affiche les événements dans l'interface graphique Web.
Page 58
BIOS. Les événements du logiciel de gestion du système. Ces événements sont liés à ■ des événements se produisant dans le logiciel ILOM. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 59
Après que vous avez sélectionné une catégorie d'événements, le tableau Event Log (Journal des événements) est actualisé avec les événements spécifiés. Les champs du journal des événements sont décrits dans le TABLEAU C-1 Champs du journal des événements TABLEAU C-1 Champ Description Event ID (ID...
(universelle). Par conséquent, si NTP est activé sur le processeur de service, l'horloge du processeur de service est au format UTC. Via l'interface de ligne de commande, l'interface graphique Web ILOM et ■ l'interface IPMI Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Affichage des informations sur les composants remplaçables Selon le composant que vous sélectionnez, des informations portant sur le fabricant, le nom du composant, son numéro de série et de référence peuvent s'afficher. Pour afficher des informations sur les composants remplaçables 1.
Page 62
4. Si le problème de serveur n'est pas évident après avoir consulté les informations sur les composants remplaçables, reportez-vous à la section « Exécution de tests de diagnostic à l'aide de SunVTS », page Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Affichage des capteurs Cette section explique comment afficher les valeurs des capteurs de température, de tension et des ventilateurs du serveur. Pour obtenir une liste complète des capteurs, reportez-vous à l'Annexe Pour afficher les valeurs des capteurs : 1. Connectez-vous au processeur de service en tant qu'administrateur ou opérateur pour accéder à...
Page 64
2. Dans l'onglet System Monitoring (Surveillance du système), choisissez Sensor Readings (Valeurs des capteurs). La page Sensor Readings (Valeurs des capteurs) s'affiche. Reportez-vous à la FIGURE C-3 Page Sensor Readings (Valeurs de capteurs) FIGURE C-3 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 65
3. Cliquez sur le bouton Refresh (Rafraîchir) pour actualiser les valeurs des capteurs. 4. Cliquez sur un capteur pour afficher ses seuils. Les propriétés et les valeurs du capteur s'affichent. Reportez-vous à l'exemple de FIGURE C-4 Page de détails d'un capteur FIGURE C-4 5.
A N N EXE Liste de capteurs Cette annexe décrit les capteurs des serveurs Sun Fire X4140, X4240 et X4440. Les instructions relatives à l'affichage des capteurs sont fournies à l'Annexe Capteurs du système sys.intsw Ce capteur indique l'état du commutateur d'intrusion dans le châssis. Dès que le capot du châssis correspondant à...
Bouton d'alimentation Bouton d'alimentation enfoncé. enfoncé sys.reset.btn Ce capteur surveille le bouton de réinitialisation arrière. État Événement Description Bouton de Bouton de réinitialisation réinitialisation enfoncé enfoncé. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
sys.locate.btn Ce capteur surveille le bouton de repérage du système. État Événement Description Confirmé Bouton de repérage enfoncé. Capteurs discrets de la CPU 0 p0.prsnt Ce capteur indique la présence de la CPU 0. État Événement Description Échec prévu infirmé Cet état indique que la CPU 0 est absente.
Événement Description Échec prévu infirmé Cet état indique que la CPU 2 est absente. Échec prévu confirmé Cet état indique que la CPU 2 est présente. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
p2.prochot Lorsqu'il est confirmé, ce capteur indique que la CPU 2 a atteint une température de fonctionnement maximale et que l'étranglement thermique est activé dans le processeur. État Événement Description Confirmé Cet état indique que le signal prochot (Processor Hot) de la CPU 2 est confirmé.
L'alimentation électrique 0 est reliée à une source de courant alternatif. Dans l'état infirmé, la diode de défaillance de l'alimentation et la diode d'alerte du système sont allumées. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 73
ps0.pwrok Ce capteur indique si l'alimentation électrique 0 est activée et alimente le système. Ce capteur est uniquement surveillé lorsque PS0 est présent et que l'alimentation système fonctionne. État Événement Description État infirmé L'alimentation 0 est hors tension. État confirmé L'alimentation 0 est sous tension.
Page 74
L'alimentation 1 est hors tension. État confirmé L'alimentation 1 est sous tension. Dans l'état infirmé, la diode de défaillance de l'alimentation et la diode d'alerte du système sont allumées. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Capteurs de température de contrôle des ventilateurs Les capteurs de température de cette catégorie sont utilisés en entrée pour l'algorithme de contrôle de ventilateur. Ils servent également à mettre le système hors tension s'ils sont irrécupérables. Leur état affecte aussi celui des diodes du panneau avant.
Page 76
CPU X et la diode d'alerte du système sont allumées. Valeur Infirmation La température ambiante est passée d'une supérieure valeur critique à une valeur non critique. critique Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Pour tous les capteurs pX.t_core Seuil Indication Événement Description Action : la diode de surchauffe, la diode de défaillance de la CPU X et la diode d'alerte du système sont éteintes. Valeur Confirmation La température ambiante est supérieure au supérieure seuil irrécupérable.
Ce capteur surveille l'entrée principale 12 V qui est active lorsque l'alimentation est sous tension. mb.v_+1v5 Ce capteur surveille l'entrée 1,5 V qui est active lorsque l'alimentation est sous tension. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 79
mb.v_+1v2ht Ce capteur surveille l'entrée 1,2 Vht qui est active lorsque l'alimentation est sous tension. mb.v_+1.4 Ce capteur surveille l'entrée 1,4 V qui est active lorsque l'alimentation est sous tension. Seuil Indication Événement Description Valeur Confirmation La tension est inférieure au seuil non critique. inférieure non critique Action : la diode de défaillance de...
Page 80
La tension est passée d'une valeur supérieure supérieure irrécupérable à une valeur supérieure critique. irrécupérable Action : la diode de défaillance de l'alimentation et la diode d'alerte du système sont allumées. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Capteurs de tension de la carte Mezzanine (Sun Fire X4440 uniquement) Tous les capteurs de tension de la carte mezzanine sont configurés pour générer les mêmes événements, et les erreurs sont traitées de la même manière. mezz.v_+3v3stby Ce capteur surveille l'entrée de secours 3,3 V de la carte mezzanine. mezz.v_+3v3 Ce capteur surveille l'entrée principale 3,3 V de la carte mezzanine qui est active lorsque l'alimentation est sous tension.
Page 82
à une valeur non critique normale. Action : la diode de défaillance de l'alimentation et la diode d'alerte du système sont éteintes. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 83
Seuils de tous les capteurs de tension de la carte mezzanine Seuil Indication Événement Description Valeur Confirmation La tension est supérieure au seuil supérieur supérieure critique. critique Action : la diode de défaillance de l'alimentation et la diode d'alerte du système sont allumées.
Tous les capteurs de tension de la CPU sont configurés pour générer les mêmes événements et les erreurs sont traitées de la même manière. X est 0-3 sur le serveur Sun Fire X4440 et 0-1 sur les serveurs Sun Fire X4140 et X4240.
Page 85
Seuils de tous les capteurs de tension de la CPU Seuil Indication Événement Description Action : la diode de défaillance de l'alimentation, la diode de défaillance de la CPU X et la diode d'alerte du système sont éteintes. Valeur Confirmation La tension de la CPU X est inférieure au seuil inférieure critique inférieur.
Page 86
Action : la diode de défaillance de l'alimentation, la diode de défaillance de la CPU X et la diode d'alerte du système sont allumées. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Capteurs de présence de ventilateurs Le châssis comprend des capteurs qui indiquent la présence physique d'un module de ventilateur individuel. fbX.fmY.prsnt Ce capteur indique la présence du module de ventilateur Y, sur la carte de ventilateurs X. État Événement Description Périphérique absent Cet état indique que le module Y de la carte de ventilateurs X est absent.
Ce capteur est confirmé en réponse à un signal de défaillance du contrôleur AMI SAS. La diode orange de l'unité X et la diode d'alerte du système sont allumées lorsque l'état est confirmé. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Ce capteur discret configurable affiche l'état « OK to remove » (Retrait autorisé). X est 0-7 pour les serveurs Sun Fire X4140 et X4440. ■ X est 0-15 pour le serveur Sun Fire X4240. ■ Valeur Événement Description 0x80 (état confirmé : [Hot Spare...
A N N EXE Traitement des erreurs Cette annexe décrit la façon dont les serveurs traitent et consignent les erreurs. Reportez-vous aux sections suivantes : « Traitement des erreurs non corrigibles », page 79 ■ « Traitement des erreurs corrigibles », page 82 ■...
Page 92
Le BIOS ignore le module DIMM défectueux lors du test de mémoire de ■ l'autotest à la mise sous tension suivant. Le BIOS indique la mémoire disponible, en excluant la paire de DIMM ■ défaillante. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 93
montre un exemple d'écran de journal DMI de la page de FIGURE E-1 configuration du BIOS. Écran de journal DMI, erreur non corrigible FIGURE E-1 Annexe E Traitement des erreurs...
30 secondes jusqu'à ce qu'une autre erreur soit détectée et qu'un indicateur 8131 soit réinitialisé. Solaris prend en charge le diagnostic automatisé et à autocorrection pour la CPU ■ et les sous-systèmes de mémoire. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 95
montre un exemple d'écran de journal DMI de la page de ■ FIGURE E-2 configuration du BIOS : Écran de journal DMI, erreur corrigible FIGURE E-2 Annexe E Traitement des erreurs...
Page 96
Le BIOS consigne un enregistrement SEL. ■ Le BIOS consigne un événement dans le journal DMI. ■ Écran de journal DMI, erreur corrigible, diminution de mémoire EXEMPLE E-1 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Traitement des erreurs de parité (PERR) Cette section contient quelques faits et considérations sur la façon dont le serveur traite les erreurs de parité. Le traitement des erreurs de parité est effectué à l'aide d'interruptions NMI. ■ Durant l'autotest à la mise sous tension, l'interruption NMI est consignée dans le ■...
Page 98
Aug 5 05:15:00 d-mpk12-53-159 kernel: Do you have a strange power saving mode enabled? Remarque – Le système Linux est réinitialisé, mais n'informe pas le BIOS de cet incident. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Traitement des erreurs système (SERR) Cette section contient quelques faits et considérations sur la façon dont le serveur traite les erreurs système. Le traitement des erreurs système utilise le mécanisme HyperTransport Sync ■ Flood sur 8111 et 8131. Les événements suivants se produisent durant l'autotest à la mise sous tension ■...
Page 100
DMI de la page de ■ FIGURE E-5 configuration du BIOS, avec une erreur système. Écran de journal DMI indiquant une erreur FIGURE E-5 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Traitement des processeurs non concordants Cette section contient quelques faits et considérations sur la façon dont le serveur traite les non-concordances de processeurs. Le BIOS effectue un autotest à la mise sous tension complet. ■ Le BIOS consigne les CPU non concordantes, comme indiqué dans l'exemple ■...
; le système service réinitialisé mais ne quitte pas la phase de l'autotest à la réinitialisation. mise sous tension échoue. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 103
Synthèse du traitement des erreurs de matériel (suite) TABLEAU E-1 Consignée (journal DMI ou journal SEL du processeur Erreur Description Traitement de service) Fatale ? Échec de L'autotest à la Des erreurs fatales et des erreurs non l'autotest à la mise sous tension fatales se produisent durant l'autotest à...
Page 104
Journal SEL du prise en charge en charge sont système. processeur de utilisés ou des service modules DIMM pris en charge ne sont pas chargés correctement. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 105
Synthèse du traitement des erreurs de matériel (suite) TABLEAU E-1 Consignée (journal DMI ou journal SEL du processeur Erreur Description Traitement de service) Fatale ? Échec de liaison Erreur CRC ou de Un Sync Flood se produit sur les Journal DMI Fatale HyperTransport liaison liée à...
Page 106
été détectée lors d'opération de maintenance et du service de la lecture des module de ventilateur individuel signaux s'allument. tachymétriques. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Page 107
Synthèse du traitement des erreurs de matériel (suite) TABLEAU E-1 Consignée (journal DMI ou journal SEL du processeur Erreur Description Traitement de service) Fatale ? Défaillances de Une défaillance Les diodes de défaillance du Journal SEL du Fatale ventilateurs de ventilateur a ventilateur avant, de demande processeur de été...
Page 108
BIOS retente de démarrer périphériques de depuis le premier périphérique de la démarrage. liste. Le processeur de contrôle peut contrôler/modifier l'ordre de démarrage. Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...
Index Arrêt d'urgence, 4 Dépannage, instructions générales, 2 Arrêt progressif, 4 DIMM Diodes d'erreur, 16 Arrêt, procédure, 4 Gestion des erreurs, 12 Autotest à la mise sous tension, voir POST Isolation des erreurs, 18 Règles de population, 11 Diodes BIOS Externes, 37 Codes POST, 31 Diodes, ports et emplacements, illustration, 38, 39...
Page 110
Erreurs système, 87 SunVTS, 7 Processeurs non concordants, 89 Matériel, traitement des erreurs, 90 Visite de maintenance, rassemblement des informations, 2 Mise hors tension, procédure, 4 Index-2 Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008...