Télécharger Imprimer la page
Sun Microsystems Sun Fire Serie Guide D'administration
Sun Microsystems Sun Fire Serie Guide D'administration

Sun Microsystems Sun Fire Serie Guide D'administration

Systèmes d'entrée de milieu
Masquer les pouces Voir aussi pour Sun Fire Serie:

Publicité

Liens rapides

Guide d'administration
des systèmes d'entrée de
milieu de gamme Sun Fire
TM
Sun Microsystems, Inc.
www.sun.com
Référence : 817-6165-10
Avril 2004, révision A
Faites-nous part de vos commentaires relatifs à cette documentation à l'adresse : http://www.sun.com/hwdocs/feedback

Publicité

loading

Sommaire des Matières pour Sun Microsystems Sun Fire Serie

  • Page 1 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire Sun Microsystems, Inc. www.sun.com Référence : 817-6165-10 Avril 2004, révision A Faites-nous part de vos commentaires relatifs à cette documentation à l'adresse : http://www.sun.com/hwdocs/feedback...
  • Page 2 Copyright 2004 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, Californie 95054, États-Unis. Tous droits réservés. Sun Microsystems, Inc. possède des droits de propriété intellectuelle sur la technologie incorporée au produit décrit dans ce document. En particulier, et sans limitation, ces droits de propriété intellectuelle peuvent porter sur un ou plusieurs brevets américains répertoriés à l'adresse http://www.sun.com/patents et un ou plusieurs autres brevets, en attente d'homologation ou non, aux États-Unis et dans d'autres pays.
  • Page 3 Table des matières Préface xvii Présentation 1 Contrôleur système 1 Ports d'E/S 2 Invite LOM 3 Console Solaris 4 Surveillance de l'environnement 4 Carte des indicateurs du système 4 Fiabilité, disponibilité et facilité de maintenance (RAS) 6 Fiabilité 6 Désactivation de composants ou de cartes et autotest à la mise sous tension (POST) 7 Désactivation manuelle des composants 7 Surveillance de l'environnement 7...
  • Page 4 Facilité de maintenance 9 Voyants 9 Nomenclature 9 Consignation des erreurs du contrôleur système 9 Prise en charge XIR (eXternally Initiated Reset) du contrôleur système 9 Démarrage et configuration des systèmes d'entrée de milieu de gamme Sun Fire 11 Installation et câblage du matériel 12 Utilisation de l'interrupteur d'alimentation (Marche/Veille) 13 Mise sous et hors tension 14 Mise sous tension 14...
  • Page 5 Réinitialisation du système 26 Réinitialisation forcée du système 26 Réinitialisation du contrôleur système 27 Procédures de navigation dans la console 29 Établissement d'une connexion LOM/Console 30 Accès à l'interface LOM/Console à l'aide du port série 30 Établissement d'une connexion à un terminal ASCII 31 Établissement d'une connexion à...
  • Page 6 Affichage de la configuration LOM (lom -c) 47 Vérification de l'état du voyant d'erreur et des alarmes (lom -l) 47 Affichage du journal des événements (lom -e) 48 Vérification des ventilateurs (lom -f) 49 Vérification des détecteurs de tension internes (lom -v) 49 Vérification de la température interne (lom -t) 52 Affichage des données relatives à...
  • Page 7 Dépannage 77 Mappage des périphériques 77 Mappage CPU/Mémoire 77 Mappage de l'ensemble IB_SSC 79 Incidents système 82 Unités interchangeables sur site (par le client) 84 Sun Fire E2900 84 Sun Fire V1280 84 Netra 1280 84 Ajout manuel à la liste des composants désactivés (en attente de réparation) 85 Conditions spéciales relatives aux cartes CPU/Mémoire 86 Reprise après blocage du système 87 Réamorçage manuel d'un système bloqué...
  • Page 8 Pour rétrograder le microprogramme d'un système Sun Fire V1280 ou Netra 1280 de la version 5.17.0 à la version 5.13.x à l'aide de la commande lom –G 103 Remplacement des cartes de CPU/mémoire et reconfiguration dynamique (DR) 105 Reconfiguration dynamique 105 Présentation 105 Interface de ligne de commande 106 Concepts de la reconfiguration dynamique 106...
  • Page 9 Interface de ligne de commande 113 Commande cfgadm 114 Affichage de l'état de base des cartes 114 Affichage de l'état détaillé des cartes 115 Options de commande 116 Test des cartes et des blocs 117 Test d'une carte de CPU/mémoire 117 Installation ou remplacement des cartes processeur/mémoire 118 Installation d'une nouvelle carte 118 Remplacement à...
  • Page 10 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 11 Figures Ports d'E/S 2 FIGURE 1-1 Carte des indicateurs du système 5 FIGURE 1-2 Interrupteur d'alimentation (Marche/Veille) 13 FIGURE 2-1 Procédures de navigation 38 FIGURE 3-1 Enregistrement des messages du contrôleur système 44 FIGURE 4-1 Procédures automatiques de diagnostic et de reprise FIGURE 7-1 Désignation des logements physiques PCI IB_SSC pour IB6 sur les systèmes d'entrée FIGURE 8-1...
  • Page 12 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 13 Tableaux Sélection de tâches de gestion 3 TABLEAU 1-1 Fonctions des voyants du système 5 TABLEAU 1-2 Paramètres de configuration de l'autotest à la mise sous tension 58 TABLEAU 6-1 Paramètres de diagnostic et de reprise du système d'exploitation 70 TABLEAU 7-1 Attribution des AID de CPU et de mémoire 78 TABLEAU 8-1...
  • Page 14 Options de la commande cfgadm -c 116 TABLEAU 10-9 Options de la commande cfgadm -x 117 TABLEAU 10-10 Niveaux de diagnostic 118 TABLEAU 10-11 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 15 Exemples de codes Sortie issue de la réinitialisation matérielle du contrôleur système 18 EXEMPLE DE CODE 2-1 Sortie issue de la commande setupnetwork 21 EXEMPLE DE CODE 2-2 Installation des pilotes LOM 23 EXEMPLE DE CODE 2-3 Installation de l'utilitaire LOM 25 EXEMPLE DE CODE 2-4 Installation des pages de manuel LOM 26 EXEMPLE DE CODE 2-5...
  • Page 16 Message d'événement relatif au diagnostic d'un domaine – Erreur non critique liée au EXEMPLE DE CODE 7-4 matériel 69 Exemple de message de diagnostic automatique 72 EXEMPLE DE CODE 7-5 Exemple de sortie de la commande showboards – Composants dans l'état Disabled EXEMPLE DE CODE 7-6 (désactivé) et Degraded (dégradé) 73 Exemple de sortie de la commande showcomponent –...
  • Page 17 Préface Ce manuel décrit le système et présente en détail les procédures d'administration courantes. Il explique comment configurer et gérer le microprogramme du contrôleur système sur les serveurs d'entrée de milieu de gamme de la famille Sun Fire™, c'est-à- dire les systèmes E2900/V1280/Netra 1280. Il explique également comment retirer et remplacer des composants, et comment effectuer la mise à...
  • Page 18 Le chapitre 8 fournit des informations sur la résolution des problèmes, notamment sur les voyants lumineux et les incidents système. Il explique comment afficher les données de diagnostic et de configuration du système, désactiver des composants et faire correspondre les chemins d'accès des périphériques aux périphériques physiques du système.
  • Page 19 Conventions typographiques Police Signification Exemples Noms de commande, fichier Modifiez votre fichier .login. AaBbCc123 et répertoire. Messages Utilisez ls -a pour afficher la liste de apparaissant à l’écran. tous les fichiers. % Vous avez reçu du courrier. Ce que l’utilisateur tape par AaBbCc123 opposition aux messages Mot de passe :...
  • Page 20 Documentation connexe Type de manuel Titre Référence Contrôleur Manuel de référence des commandes du contrôleur des 817-6163-10 système systèmes Sun Fire V1280/Netra 1280 Documentation Sun en ligne Vous pouvez afficher et imprimer un grand choix de documentation Sun™, y compris des versions localisées, à l'adresse : http://www.sun.com/documentation Vos commentaires sont les bienvenus chez Sun...
  • Page 21 C H A P I T R E Présentation Ce chapitre présente les fonctions des serveurs d'entrée de milieu de gamme de la famille Sun Fire, c'est-à-dire les systèmes E2900/V1280/Netra 1280. Son objectif est de vous fournir un aperçu de leurs fonctions. La présentation en détails des procédures de configuration du système est traitée dans le chapitre 2.
  • Page 22 Ports d'E/S À l'arrière du système, vous trouverez les ports suivants : Port série de la console (RS-232) (RJ45) Port série réservé (RS-232) (RJ45) 2 ports Gigabit Ethernet (RJ-45) Port d'alarmes (DB15) Port Ethernet 10/100 du contrôleur système (RJ45) Port UltraSCSI Six ports PCI maximum (cinq ports à...
  • Page 23 Le port série de la console et le port Ethernet 10/100 peuvent servir à accéder au contrôleur système. Le port série vous permet de vous connecter directement à un terminal ASCII ou à un serveur de terminal de réseau (NTS - Network Terminal Server). La connexion de la carte du contrôleur système avec un câble en série vous permet ainsi d'accéder à...
  • Page 24 Sélection de tâches de gestion (Suite) TABLEAU 1-1 Tâches de gestion du contrôleur système Commandes du contrôleur système à utiliser Affichage de l'état actuel du système showalarm, showboards, showcomponent, showenvironment, showfault, showhostname, showlocator, showlogs, showmodel, showresetstate Réglage de la date, de l'heure et du fuseau horaire setdate Affichage de la date et de l'heure showdate...
  • Page 25 Interrupteur Marche/Veille SYSTEM ALARM POWER SOURCE SERVICE REQUIRED Système actif Localis- UNIX Running Source A et Source B ateur Accès nécessaire à la partie Alarme 1 et Alarme 2 supérieure du système Erreur système Carte des indicateurs du système FIGURE 1-2 explique le rôle de chaque voyant.
  • Page 26 Fiabilité, disponibilité et facilité de maintenance (RAS) Les fonctions de fiabilité, de disponibilité et de facilité de maintenance font partie de ce système. Elles sont présentées plus en détail ci-dessous. La fiabilité est la probabilité qu'un système reste opérationnel pendant un temps donné, dans des conditions normales de fonctionnement.
  • Page 27 Désactivation de composants ou de cartes et autotest à la mise sous tension (POST) L'autotest à la mise sous tension s'exécute au démarrage du système. Si le test sur une carte ou un composant échoue, l'autotest à la mise sous tension les désactive. Pour afficher l'état de la carte (échec ou dommage), utilisez la commande showboards.
  • Page 28 Disponibilité La fonction de disponibilité du logiciel inclut les caractéristiques suivantes : Reconfiguration dynamique Moteur de diagnostic automatique des défaillances Coupure d'alimentation Redémarrage du contrôleur système Surveillance de l'hôte Reconfiguration dynamique Il est possible de reconfigurer les éléments suivants de façon dynamique : Lecteurs du disque dur Cartes processeur/mémoire Unités d'alimentation...
  • Page 29 Facilité de maintenance Les fonctions de facilité de maintenance permettent d'améliorer l'efficacité et la rapidité des services de dépannage (réguliers et d'urgence) fournis au système. Voyants Nomenclature Consignation des erreurs du contrôleur système Prise en charge XIR (eXternally Initiated Reset) du contrôleur système Voyants Toutes les unités interchangeables sur site (FRU) accessibles depuis l'extérieur du système sont équipées de voyants qui indiquent leur état.
  • Page 30 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 31 C H A P I T R E Démarrage et configuration des systèmes d'entrée de milieu de gamme Sun Fire Ce chapitre explique comment mettre le système sous tension à l'aide de l'interface de ligne de commande du contrôleur système (invite LOM), configurer le contrôleur système à...
  • Page 32 8. Démarrez l'environnement d'exploitation Solaris. 9. Installez les packages LOM (Lights Out Management) à partir du CD Solaris supplémentaire. Installation et câblage du matériel 1. Reliez un terminal au port série de la carte du contrôleur système. Reportez-vous à la FIGURE 1-1 2.
  • Page 33 Utilisation de l'interrupteur d'alimentation (Marche/Veille) Attention – L'interrupteur d'alimentation n'est pas de type Marche/Arrêt, mais Marche/Veille. Il n'isole pas le matériel de l'alimentation électrique. L'interrupteur d'alimentation (Marche/Veille) des systèmes d'entrée de milieu de gamme Sun Fire est un interrupteur à bascule, à fonctionnement momentané. Il contrôle uniquement les signaux basse tension et filtre les signaux haute tension.
  • Page 34 Mise sous et hors tension Mise sous tension Mise sous tension initiale 1. Vérifiez que tous les câbles d'alimentation sont branchés et que les disjoncteurs externes sont activés. 2. Le système passe alors en mode veille. Les seuls voyants allumés sur la carte des indicateurs système sont les voyants Source A et Source B.
  • Page 35 Utilisation de la commande LOM poweron À l'invite lom>, tapez : lom>poweron Le contrôleur système met sous tension les blocs d'alimentation, puis le plateau de ventilation. Il termine par les cartes système. Si la valeur de la variable OpenBoot PROM auto-boot? est true, le système démarre également l'environnement d'exploitation Solaris.
  • Page 36 Utilisation de la commande Solaris shutdown À l'invite du système, tapez : # shutdown -i5 Le système s'arrête et passe en veille. Les seuls voyants allumés sur la carte des indicateurs système sont les voyants Source A et Source B. Le voyant d'activité du bloc IB_SSC est également allumé, mais n'est pas visible à...
  • Page 37 Envoi de la commande LOM poweroff Utilisez la commande poweroff pour mettre tous les modules et châssis du système en mode veille. À l'invite lom>, tapez : lom>poweroff This will abruptly terminate Solaris. Do you want to continue? [no] Ne répondez yes que si vous souhaitez arrêter le système sans vous préoccuper de l'état dans lequel Solaris se trouve.
  • Page 38 Netmask: 255.255.255.0 Attached TCP/IP interface to eri unit 0 Attaching interface lo0...done Gateway: xxx.xxx.xxx.xxx interrupt: 100 Mbps half duplex link up Copyright 2001-2002 Sun Microsystems, Inc. All rights reserved. Utilisation limitée selon licence. Lights Out Management Firmware RTOS version: 23 ScApp version: 5.13.0007 LW8_build0.7...
  • Page 39 Sortie issue de la réinitialisation matérielle du contrôleur système (Suite) EXEMPLE DE CODE 2-1 Hardware Reset... Fri Jul 19 15:49:05 nom_quelconque lom: Cold boot detected: recovering active domains Fri Jul 19 15:49:06 nom_quelconque lom: NOTICE: /N0/FT0 is powered off Connected. lom>...
  • Page 40 Définition du mot de passe 1. À l'invite LOM, tapez la commande password du contrôleur système. 2. À l'invite Enter new password:, tapez votre mot de passe. 3. À l'invite Enter new password again:, tapez de nouveau votre mot de passe. lom>password Enter new password: Enter new password again:...
  • Page 41 Pour plus d'informations sur la commande setupnetwork, reportez-vous au Manuel de référence des commandes du contrôleur des systèmes d'entrée de milieu de gamme Sun Fire. L' illustre une sortie issue de la commande EXEMPLE DE CODE 2-2 setupnetwork. Sortie issue de la commande setupnetwork EXEMPLE DE CODE 2-2 lom>setupnetwork Network Configuration...
  • Page 42 Installation et démarrage de l'environnement d'exploitation Solaris Pour utiliser les commandes LOM, vous devez installer les packages Lights Out Management 2.0 (SUNWlomu, SUNWlomr et SUNWlomm) à partir du CD Solaris supplémentaire. Procédure d'installation et de démarrage de l'environnement d'exploitation Solaris 1.
  • Page 43 # pkgadd -d . SUNWlomr Processing package instance <SUNWlomr> from </var/tmp> LOMlite driver (root) (sparc) 2.0,REV=2000.08.22.14.14 Copyright 2000 Sun Microsystems, Inc. All rights reserved. ## Executing checkinstall script. Using </> as the package base directory. ## Processing package information. ## Processing system information.
  • Page 44 Installation des pilotes LOM (Suite) EXEMPLE DE CODE 2-3 ## Installing part 1 of 1. 20 blocks i.drivers (INFO): Starting i.drivers (INFO): Installing /var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/lom i.drivers (INFO): Installing /var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/lomp i.drivers (INFO): Installing /var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lom i.drivers (INFO): Installing /var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lomp i.drivers (INFO): Installing /var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lomv i.drivers (INFO): Identified drivers ’lom lomp lomv’...
  • Page 45 Processing package instance <SUNWlomu> from </cdrrom/suppcd_s28u7_multi_s28u7_supp.08al1/Lights_Out_Management_2.0/Product> LOMlite Utilities (usr) (sparc) 2.0,REV=2000.08.22.14.14 Copyright 2000 Sun Microsystems, Inc. All rights reserved. Using </> as the package base directory. ## Processing package information. ## Processing system information. 4 package pathnames are already properly installed.
  • Page 46 Processing package instance <SUNWlomm> from </cdrom/suppcd_s28u7_multi_s28u7_supp.08al1/Lights_Out_Management_2.0/Product> LOMlite manual pages (sparc) 2.0,REV=2000.08.22.14.14 Copyright 2000 Sun Microsystems, Inc. All rights reserved. Using </> as the package base directory. ## Processing package information. ## Processing system information. 5 package pathnames are already properly installed.
  • Page 47 lom>reset This will abruptly terminate Solaris. Do you want to continue? [no] y NOTICE: XIR on CPU 3 Par défaut, la commande reset utilise le mode de réinitialisation externe XIR (Externally Initiated Reset) pour réinitialiser les processeurs de CPU du système. La réinitialisation externe permet d'effectuer un contrôle forcé...
  • Page 48 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 49 C H A P I T R E Procédures de navigation dans la console Ce chapitre présente les procédures détaillées, accompagnées d'illustrations, à suivre pour se connecter au système et se déplacer entre le shell LOM et la console. Il explique également comment mettre fin à...
  • Page 50 Établissement d'une connexion LOM/Console Il existe deux manières d'accéder à l'interface LOM/console : via la connexion de port série (directe) du contrôleur système ; via une connexion (réseau) telnet à l'aide du port Ethernet 10/100. Attention : À partir de la version 5.17.0 du microprogramme, les connexions réseau sont désactivées par défaut.
  • Page 51 Établissement d'une connexion à un terminal ASCII 1. S'il existe un mot de passe LOM (et que la connexion précédente est fermée), vous êtes invité à l'indiquer. Enter Password: Entrez le mot de passe défini précédemment à l'aide de la commande password. 2.
  • Page 52 Connected. Établissement d'une connexion à un serveur de terminal de réseau 1. Un menu comportant les divers serveurs auxquels vous pouvez vous connecter s'affiche. Sélectionnez le serveur qui vous intéresse. 2. S'il existe un mot de passe LOM (et que la connexion précédente est fermée), vous êtes invité...
  • Page 53 4. S'il existe déjà une connexion LOM/Console sur le port réseau, vous êtes invité à vous connecter en mettant fin à la connexion existante : Enter Password: The console is already in use. Host: somehost.acme.com Connected: May 24 10:27 Idle time: 00:23:17 Force logout of other user? (y/n) y Connected.
  • Page 54 3. Si le mot de passe est accepté, le contrôleur système indique qu'une connexion existe. Si le système est en veille, l'invite lom s'affiche automatiquement. Connected. lom> Dans le cas contraire, entrez un retour chariot pour afficher l'invite de la console Solaris.
  • Page 55 % telnet <nom_hôte_du_contrôleur_système> Trying 123.123.123.95... Connected to interpol-sc. Escape character is ‘^]’. 2. S'il existe un mot de passe LOM, vous êtes invité à l'indiquer. # telnet <nom_hôte_du_contrôleur_système> Trying 123.123.123.95... Connected to interpol-sc. Escape character is ‘^]’. Enter password: 3. Entrez le mot de passe défini précédemment à l'aide de la commande password. 4.
  • Page 56 5. S'il existe déjà une connexion à l'interface LOM/Console sur le port série, vous êtes invité à indiquer si vous souhaitez vous connecter en mettant fin à la connexion existante : # telnet <nom_hôte_du_contrôleur_système> Trying 123.123.123.95... Connected to interpol-sc. Escape character is ‘^]’. The console is already in use.
  • Page 57 Navigation entre différentes consoles La connexion à la console du contrôleur système permet d'accéder à l'interface de ligne de commande LOM du contrôleur système ou à la console Solaris/OpenBoot PROM. Cette section explique comment se déplacer entre : l'invite LOM ; la console du système Solaris ;...
  • Page 58 Environnement d'exploitation Solaris Tapez la séquence d'échappement OpenBoot PROM Tapez la séquence d'échappement Shell LOM Tapez : lom>console Tapez : lom>break lom> Procédures de navigation FIGURE 3-1 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 59 Accès à l'invite LOM Pour accéder à l'invite LOM depuis la console Solaris, tapez la séquence d'échappement. Par défaut, il s'agit de « #. » (signe dièse suivi d'un point). Par exemple, si la séquence d'échappement par défaut est #., l'invite suivante s'affiche : lom>...
  • Page 60 Si la mémoire OpenBoot PROM est active, le système affiche l'invite OpenBoot PROM : lom>console {2} ok Si le système se trouve en veille, le message suivant s'affiche : lom>console Solaris is not active Accès à l'invite LOM à partir de la mémoire OpenBoot PROM Pour passer de la mémoire OpenBoot PROM à...
  • Page 61 Accès à l'invite OpenBoot lorsque Solaris est en cours d'exécution Lorsque l'environnement d'exploitation Solaris est en cours d'exécution, l'envoi d'un signal d'interruption à la console a pour effet de passer à la mémoire OpenBoot PROM ou au débogueur de noyau. Pour ce faire, tapez la commande break à...
  • Page 62 Fermeture d'une session lorsque la connexion au contrôleur système se fait par l'intermédiaire de telnet Si vous vous trouvez à l'invite Solaris ou dans la mémoire OpenBoot PROM, accédez à l'invite LOM en tapant la séquence d'échappement, puis mettez fin à la session de l'invite LOM en tapant la commande logout. La session telnet se ferme automatiquement : lom>logout Connection closed by foreign host.
  • Page 63 C H A P I T R E Consignation des messages du contrôleur système Le contrôleur système génère des messages horodatés pour les événements système et les processus, tels que la mise sous tension, l'initialisation, la mise hors tension, la modification des unités capables de se connecter à chaud, les avertissements de l'environnement, etc.
  • Page 64 Remarque – Les systèmes équipés du contrôleur système à mémoire améliorée (également appelé SC V2) disposent de 112 Ko de mémoire supplémentaire servant à stocker les messages du microprogramme. Il s'agit d'une mémoire rémanente. Les messages qu'elle stocke ne s'effacent pas lors de la mise hors tension du contrôleur système (la mémoire tampon de l'historique LOM d'origine est dynamique, ce qui signifie que les informations qu'elle stocke s'effacent à...
  • Page 65 C H A P I T R E Utilisation des commandes LOM (Lights Out Management) et du contrôleur système de Solaris Ce chapitre explique l'utilisation des commandes LOM disponibles dans Solaris pour le contrôle et la gestion des systèmes d'entrée de milieu de gamme Sun Fire. Pour utiliser ces commandes, vous devez tout d'abord installer les packages Lights Out Management 2.0 (SUNWlomr, SUNWlomu et SUNWlomm) à...
  • Page 66 où : -c affiche la configuration LOM. -l affiche l'état des voyants d'erreur et d'alarmes. -e affiche le journal des événements. -f affiche l'état du ventilateur. Ces informations s'affichent également dans la sortie issue de la commande Solaris prtdiag -v. -v affiche l'état des détecteurs de tension.
  • Page 67 Consultation de la documentation LOM en ligne Pour afficher les pages de manuel de l'utilitaire LOM, tapez : # man lom Affichage de la configuration LOM (lom -c) Pour afficher la configuration LOM actuelle, tapez : Exemple de sortie issue de la commande lom -c EXEMPLE DE CODE 5-1 # lom -c LOM configuration settings:...
  • Page 68 Affichage du journal des événements (lom -e) Pour afficher le journal des événements, tapez : # lom -e n,[x] où n représente le nombre de rapports (128 maximum) à afficher et x le niveau des rapports qui vous intéressent. Il existe quatre niveaux d'événements : 1.
  • Page 69 Vérification des ventilateurs (lom -f) Pour vérifier l'état des ventilateurs, tapez : Exemple de sortie issue de la commande lom -f EXEMPLE DE CODE 5-4 # lom -f Fans: 1 OK speed self-regulating 2 OK speed self-regulating 3 OK speed self-regulating 4 OK speed self-regulating 5 OK speed self-regulating 6 OK speed self-regulating...
  • Page 70 Exemple de sortie issue de la commande lom -v (Suite) EXEMPLE DE CODE 5-5 6 RP2 v_1.5vdc0 status=ok 7 RP2 v_3.3vdc0 status=ok 8 SB0 v_1.5vdc0 status=ok 9 SB0 v_3.3vdc0 status=ok 10 SB0/P0 v_cheetah0 status=ok 11 SB0/P1 v_cheetah1 status=ok 12 SB0/P2 v_cheetah2 status=ok 13 SB0/P3...
  • Page 71 Exemple de sortie issue de la commande lom -v (Suite) EXEMPLE DE CODE 5-5 25 SB0/P2 status=online 26 SB0/P2/B0/D0 status=okay 27 SB0/P2/B0/D1 status=okay 28 SB0/P2/B0/D2 status=okay 29 SB0/P2/B0/D3 status=okay 30 SB0/P3 status=online 31 SB0/P3/B0/D0 status=okay 32 SB0/P3/B0/D1 status=okay 33 SB0/P3/B0/D2 status=okay 34 SB0/P3/B0/D3 status=okay 35 SB2 status=ok...
  • Page 72 Vérification de la température interne (lom -t) Pour vérifier la température interne du système ainsi que les seuils thermiques d'avertissement et d'arrêt du système, tapez : Exemple de sortie issue de la commande lom -t EXEMPLE DE CODE 5-6 # lom -t System Temperature Sensors: 1 SSC1 t_sbbc0...
  • Page 73 Exemple de sortie issue de la commande lom -t (Suite) EXEMPLE DE CODE 5-6 40 SB2 t_sbbc0 52 degC : warning 102 degC : shutdown 107 degC 41 SB2 t_sbbc1 42 degC : warning 102 degC : shutdown 107 degC 42 SB2/P0 Ambient 27 degC : warning 82 degC : shutdown 87 degC...
  • Page 74 Autres tâches LOM exécutées depuis Solaris Cette section explique comment : activer et désactiver les indicateurs d'alarme ; modifier la séquence d'échappement LOM ; interdire au logiciel LOM d'envoyer des rapports à la console ; mettre à jour le microprogramme. Activation et désactivation des alarmes (lom -A) Deux alarmes sont associées au logiciel LOM.
  • Page 75 Modification de la séquence d'échappement de l'invite lom> (lom -X) La séquence de caractères . (dièse, point) vous permet de passer de l'invite Solaris à l'invite lom>. Pour modifier la séquence d'échappement par défaut, tapez : # lom -X xy où...
  • Page 76 Pour réactiver cette fonction, tapez : # lom -E on Mise à niveau du microprogramme (lom -G nom du fichier) Pour obtenir une description plus complète, reportez-vous au chapitre 9. Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 77 C H A P I T R E Exécution de l'autotest à la mise sous tension (POST) Chaque carte système (cartes de CPU/mémoire et bloc IB_SSC) contient une mémoire flash PROM permettant de stocker les diagnostics de l'autotest à la mise sous tension (POST).
  • Page 78 Pour afficher les paramètres actuels, utilisez la commande OpenBoot printenv : {3} ok printenv diag-level diag-level init (init) Pour modifier le paramétrage d'une variable, utilisez la commande OpenBoot PROM setenv : {1} ok setenv diag-level quick diag-level=quick Par exemple, pour configurer l'autotest POST de sorte qu'il s'exécute plus rapidement, procédez comme suit : {1} ok setenv diag-level init diag-level=init...
  • Page 79 Paramètres de configuration de l'autotest à la mise sous tension (Suite) TABLEAU 6-1 Paramètre Valeur Description Identique à mem1 à la différence qu'un test DRAM mem2 supplémentaire compare les opérations des données DRAM de façon explicite. Aucun message d'état ne s'affiche. verbosity-level Des noms de test, des messages d'états et des messages (valeur par défaut)
  • Page 80 {/N0/SB0/P2} @(#) lpost 5.13.0007 2002/07/18 12:45 {/N0/SB0/P1} @(#) lpost 5.13.0007 2002/07/18 12:45 {/N0/SB0/P0} Copyright 2001 Sun Microsystems, Inc. All rights reserved. {/N0/SB0/P0} Subtest: Setting Fireplane Config Registers {/N0/SB0/P0} Subtest: Display CPU Version, frequency {/N0/SB0/P0} Version register = 003e0015.21000507 {/N0/SB0/P0} Cpu/System ratio = 6, cpu actual frequency = 900 {/N0/SB0/P1} Copyright 2001 Sun Microsystems, Inc.
  • Page 81 Probing /ssm@0,0/pci@19,600000 Device 2 network Sun Fire V1280 OpenFirmware version 5.13.0007 (18/07/02 12:45) Copyright 2001 Sun Microsystems, Inc. All rights reserved. SmartFirmware, Copyright (C) 1996-2001. Tous droits réservés. 16384 MB memory installed, Serial #9537054. Ethernet address 8:0:xx:xx:xx:xx, Host ID: 80xxxxxx.
  • Page 82 Pour exécuter les tests POST minimaux avant le prochain redémarrage, utilisez l'instruction suivante : lom>shutdown lom>bootmode skipdiag lom>poweron Si le système ne redémarre pas dans les 10 minutes suivant l'exécution de la commande bootmode, le paramètre bootmode revient sur normal et les valeurs diag-level et verbosity-level précédemment définies s'appliquent.
  • Page 83 Lorsque le niveau SCPOST diag-level est défini sur min, la sortie suivante s'affichera sur le port série lors de la prochaine réinitialisation du contrôleur système : Sortie SCPOST avec niveau de diagnostic défini sur min EXEMPLE DE CODE 6-3 @(#) SYSTEM CONTROLLER(SC) POST 21 2001/12/11 17:11 PSR = 0x044010e5 PCR = 0x04004000 SelfTest running at DiagLevel:0x20...
  • Page 84 Sortie SCPOST avec niveau de diagnostic défini sur min (Suite) EXEMPLE DE CODE 6-3 Local I2C LM75 Test TEMP2(CBH) Device Test Temparature : 32.0 Degree(C) Local I2C PCF8574 Test Sc CSR Device Test Console Bus Hub Test CBH Register Access Test POST Complete.
  • Page 85 C H A P I T R E Fonctions automatiques de diagnostic et de reprise Ce chapitre décrit les fonctions automatiques de diagnostic des erreurs et de reprise des domaines faisant partie du microprogramme des systèmes d'entrée de milieu de gamme Sun Fire.
  • Page 86 Le système est en cours d'exécution. Le contrôleur système détecte les erreurs liées au matériel et arrête le système d'exploitation. Diagnostic automatique Restauration automatique Redémarrage du système d'exploitation Procédures automatiques de diagnostic et de reprise FIGURE 7-1 Le récapitulatif ci-dessous explique la procédure représentée à la FIGURE 7-1 1.
  • Page 87 Il indique qu'il est impossible d'identifier les FRU à l'origine de l'erreur. Dans ce cas, le problème est considéré comme étant non résolu. Il est alors nécessaire que votre prestataire de services intervienne pour effectuer une analyse plus approfondie. Le moteur AD enregistre les informations de diagnostic relatives aux composants concernés et les ajoute à...
  • Page 88 Reprise automatique après blocage du système Le contrôleur système vérifie automatiquement si les systèmes sont bloqués lorsque l'un des incidents suivants se produit : Les pulsations du système d'exploitation s'arrêtent au cours d'un délai d'expiration donné. La valeur du délai d'expiration par défaut est de trois minutes. Vous pouvez la modifier par le biais du paramètre watchdog_timeout_seconds dans le fichier /etc/systems du domaine.
  • Page 89 Exemple de sortie de la console affiché pour la reprise automatique lorsqu'un EXEMPLE DE CODE 7-3 système d'exploitation cesse de répondre aux interruptions Tue Dec 09 12:37:38 commando lom: Domain is not responding to interrupts. Tue Dec 09 12:37:38 commando lom: Using default hang-policy (RESET). Tue Dec 09 12:37:38 commando lom: Resetting (XIR) domain Événements de diagnostic À...
  • Page 90 Contrôles de diagnostic et de reprise Cette section présente les divers contrôles et paramètres régissant les fonctions de restauration. Paramètres de diagnostic décrit les variables des paramètres contrôlant le processus de TABLEAU 7-1 diagnostic et de reprise du système d'exploitation. Les valeurs par défaut des paramètres de diagnostic et de reprise du système d'exploitation indiquées correspondent aux variables recommandées.
  • Page 91 Obtention d'informations de diagnostic et de reprise automatiques Cette section présente plusieurs manières de contrôler les erreurs liées au matériel et d'obtenir davantage d'informations sur les composants associés aux erreurs liées au matériel. Examen des messages d'événement relatifs au diagnostic automatique Les messages d'événement relatifs au diagnostic automatique [AD] et aux domaines [DOM] s'affichent sur la console.
  • Page 92 ADInfo : version du message de diagnostic automatique, nom du moteur de diagnostic (SCAPP ou SF-SOLARIS_DE) et version du moteur de diagnostic automatique. Pour les événements concernant le diagnostic des domaines, le moteur de diagnostic correspond à l'environnement d'exploitation Solaris (SF-SOLARIS-DE), tandis que la version du moteur de diagnostic correspond à...
  • Page 93 Contrôle de l'état des composants Pour obtenir davantage d'informations sur les composants déconfigurés au cours de la procédure de diagnostic automatique ou désactivés pour d'autres raisons, consultez les éléments suivants : Sortie de la commande showboards après l'exécution d'un diagnostic automatique indique l'emplacement et l'état de tous les composants du EXEMPLE DE CODE 7-6...
  • Page 94 Sortie de la commande showcomponent après l'exécution d'un diagnostic automatique La colonne Status de l' indique l'état des composants. L'état EXEMPLE DE CODE 7-7 peut être enabled (activé) ou disabled (désactivé). Les composants désactivés sont déconfigurés du système. L'état POST chs (abréviation de Component Health Status, c'est-à-dire état de viabilité...
  • Page 95 Exemple de sortie de la commande showcomponent – Composants désactivés EXEMPLE DE CODE 7-7 Consultation d'informations supplémentaires sur les erreurs Dans les systèmes dotés de contrôleurs système avec mémoire améliorée (SC V2), la commande showerrorbuffer -p affiche le contenu des erreurs système figurant dans la mémoire tampon permanente.
  • Page 96 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 97 C H A P I T R E Dépannage Ce chapitre contient des informations destinées à aider l'administrateur système, à identifier les incidents et à y remédier. Il contient les sections suivantes : « Incidents système », page 82 « Reprise après blocage du système », page 87 «...
  • Page 98 Chaque carte CPU/Mémoire est composée de quatre CPU, selon votre configuration. Chaque carte CPU/Mémoire est composée de quatre bancs de mémoire. Chaque banc de mémoire est contrôlé par une unité de gestion mémoire (MMU, memory management unit), à savoir le CPU. L'exemple de code suivant illustre l'entrée d'une arborescence de périphérique pour un CPU et sa mémoire associée : /ssm@0,0/SUNW/UltraSPARC-III@b,0 /ssm@0,0/SUNW/memory-controller@b,400000 où...
  • Page 99 Mappage de l'ensemble IB_SSC indique les types de blocs d'E/S, le nombre de logements présents sur TABLEAU 8-2 chaque bloc d'E/S et les systèmes qui prennent en charge les types de blocs d'E/S. Type de blocs d'E/S et nombre de logements TABLEAU 8-2 Type de blocs d'E/S Nombre de logements par bloc d'E/S...
  • Page 100 Cette section décrit les attributions des logements PCI de bloc d'E/S et propose un exemple de chemin de périphérique. L'exemple de code suivant détaille l'entrée d'une arborescence de périphérique pour un disque SCSI : /ssm@0,0/pci@19,700000/pci@3/SUNW,isptwo@4/sd@5,0 Remarque – Les chiffres du chemin de périphérique sont en notation hexadécimale. où...
  • Page 101 Mappage de périphérique PCI de l'ensemble IB_SSC (Suite) TABLEAU 8-5 Nom des blocs d'E/S Chemin de périphérique Numéro de logement physique Numéro de contrôleur d'E/S /ssm@0,0/pci@19,700000/*@3 /ssm@0,0/pci@19,600000/*@1 /ssm@0,0/pci@19,600000/*@2 où : w = contrôleur sur la carte LSI1010R SCSI x = contrôleur sur la carte CMD646U2 EIDE y = contrôleur 0 sur la carte Gigaswift Ethernet z = contrôleur 1 sur la carte Gigaswift Ethernet et * dépend du type de carte PCI installée dans le logement.
  • Page 102 Par exemple : Carte Ultra SCSI différentiel double (375-0006) dans le Logement 4 Carte FC-AL (375-3019) dans le Logement 3 Carte FC-AL (375-3019) dans le Logement 2 donneraient les chemins de périphérique suivants : /ssm@0,0/pci@19,700000/scsi@3,1 /ssm@0,0/pci@19,700000/scsi@3,1 (scsi-2) /ssm@0,0/pci@19,700000/scsi@3,1/tape (byte) /ssm@0,0/pci@19,700000/scsi@3,1/disk (block) /ssm@0,0/pci@19,700000/scsi@3 (scsi-2) /ssm@0,0/pci@19,700000/scsi@3/tape (byte) /ssm@0,0/pci@19,700000/scsi@3/disk (block)
  • Page 103 présente les différents états des indicateurs. En cas d'incident TABLEAU 8-6 système, il est impératif de prendre immédiatement des mesures correctives. États de l'indicateur Fault du système TABLEAU 8-6 Voyant Fault Voyant d'accès Voyant Fault système à la partie allumé en allumé...
  • Page 104 Unités interchangeables sur site (par le client) Sun Fire E2900 Les unités interchangeables sur site (FRU) suivantes sont celles dont vous pouvez résoudre les défaillances : Disques durs : remplaçables à chaud. Unité d'alimentation PSU (PS0/PS1/PS2/PS3) : remplaçable à chaud. Cartes de CPU/mémoire (SB0/SB2/SB4) : peuvent être ajoutées à...
  • Page 105 Cartes répéteur (RP0/RP2) : peuvent être ajoutées à la liste des composants désactivés si elles sont considérées comme défectueuses. Si un incident est détecté sur toute autre unité FRU ou s'il est nécessaire de remplacer une unité FRU désactivée ci-dessus, contactez l'assistance technique SunService.
  • Page 106 Les deux commandes suivantes du contrôleur système s'appliquent aux listes de composants à désactiver : setls showcomponent Remarque – La commande setls remplace désormais les commandes enablecomponent et disablecomponent, qui servaient à gérer les composants. Les commandes enablecomponent et disablecomponent sont toujours disponibles, mais il est conseillé...
  • Page 107 Jul 15 15:58:13 noname lom: SB0/ar0 Bit in error P3_INCOMING [0] Jul 15 15:58:17 noname lom: SB0/ar0 Bit in error P3_PREREQ [0] Jul 15 15:58:17 noname lom: SB0/ar0 Bit in error P3_ADDR [18] Jul 15 15:58:17 noname lom: SB0/ar0 Bit in error P3_ADDR [17] Une carte processeur/mémoire échouant le test d'interconnexion peut empêcher la commande poweron de mettre le système entièrement sous tension.
  • Page 108 Réamorçage manuel d'un système bloqué 1. Suivez la procédure de la section « Assistance du personnel technique Sun pour identifier la cause d'un incident », page 93. 2. Accédez au shell LOM. Reportez-vous au chapitre 3. 3. Tapez la commande reset pour que la mémoire OpenBoot PROM reprenne le contrôle du système.
  • Page 109 5. Si les mesures présentées ci-dessus ne permettent pas de redémarrer le système, lancez le cycle de mise sous tension du système à l'aide des commandes poweroff et poweron. Pour mettre le système hors tension, tapez : lom>poweroff Pour mettre le système sous tension, tapez : lom>poweron Transfert de l'identité...
  • Page 110 Température La surchauffe de l'un des composants peut indiquer l'existence de problèmes. Pour afficher leur état actuel, exécutez la commande showenvironment. Vérification des conditions thermiques à l'aide de la commande showenvironment TABLEAU 8-8 lom>showenviroment Slot Device Sensor Value Units Status ---- --------- --------- ------ --------- ------- ------ SSC1 SBBC 0 Temp.
  • Page 111 Vérification des conditions thermiques à l'aide de la commande showenvironment (Suite) TABLEAU 8-8 /N0/RP2 DX 0 Temp. 0 Degrees C 5 sec OK /N0/RP2 DX 1 Temp. 0 Degrees C 5 sec OK /N0/SB0 Board 0 1.5 VDC 0 1.51 Volts DC 5 sec OK /N0/SB0 Board 0 3.3 VDC 0...
  • Page 112 Vérification des conditions thermiques à l'aide de la commande showenvironment (Suite) TABLEAU 8-8 /N0/IB6 Board 0 3.3 VDC 0 3.35 Volts DC 7 sec OK /N0/IB6 Board 0 5 VDC 0 4.95 Volts DC 7 sec OK /N0/IB6 Board 0 12 VDC 0 11.95 Volts DC 7 sec OK...
  • Page 113 Affichage des informations de diagnostic Pour savoir comment afficher les informations de diagnostic, reportez-vous au Guide de la plate-forme matérielle Sun, fourni avec votre version de l'environnement d'exploitation Solaris. Assistance du personnel technique Sun pour identifier la cause d'un incident Communiquez les informations suivantes au personnel technique Sun pour qu'il vous aide à...
  • Page 114 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 115 C H A P I T R E Procédures de mise à jour des microprogrammes Ce chapitre explique comment mettre à jour le microprogramme du système. Le microprogramme des systèmes d'entrée de milieu de gamme Sun Fire peuvent être mis à jour de deux manières : exécuter la commande flashupdate à...
  • Page 116 où : -y ne demande aucune confirmation avant l'exécution de la commande. -n n'exécute pas cette commande si une confirmation est requise. -f spécifie une URL en tant que source des images flash. Cette option nécessite une connexion réseau. Il faut également que l'image flash figure sur un serveur NFS. Utilisez cette option pour installer de nouveaux microprogrammes.
  • Page 117 Remarque – La commande flashupdate ne permet pas de récupérer des images depuis une URL HTTP protégée (ID_utilisateur/mot_de_passe). Même si le fichier existe, un message similaire au suivant s'affiche : flashupdate: failed, URL does not contain required file: <nom_du_fichier>. Attention – N'interrompez pas la commande flashupdate en cours d'exécution. Si elle s'arrête de façon anormale, le contrôleur système passe en mode d'utilisation simple et devient uniquement accessible à...
  • Page 118 3. Mettez à niveau le microprogramme de toutes les cartes système. lom>flashupdate -f <URL> sb0 sb2 sb4 ib6 Après cette étape, la version du microprogramme des cartes sb2, sb4 et IB6 est identique à celle de la carte sb0. Pour rétrograder le microprogramme d'un système Sun Fire V1280 ou Netra 1280 de la version 5.17.0 à...
  • Page 119 Utilisation de la commande lom –G Cette méthode nécessite de transférer quatre types d'images portant des noms de la forme suivante : lw8pci.flash (contient l'autotest à la mise sous tension local de la carte d'E/S) lw8cpu.flash (contient la mémoire OPB et l'autotest à la mise sous tension local des cartes de CPU/mémoire) sgsc.flash (contient le microprogramme LOM/Contrôleur système) sgrtos.flash (contient le système d'exploitation en temps réel...
  • Page 120 Exemples Téléchargement de l'image lw8pci.flash : Téléchargement de l'image lw8pci.flash EXEMPLE DE CODE 9-1 # lom -G lw8pci.flash This program will replace LOM firmware with version 5.17.0 Are you sure you want to continue? Enter ’C’ and return to Continue or anything else to Terminate Transferring 346 kB image to the system controller.
  • Page 121 Téléchargement de l'image lw8cpu.flash (Suite) EXEMPLE DE CODE 9-2 Image and flash are different, proceeding with update. Erasing ....Done Programming ....Done Verifying ....Done Fri Dec 12 08:23:43 commando lom: /N0/SB0/FP0 updated with version 5.17.0 12/12/03. Dec 12 11:23:42 commando-a lw8: /N0/SB0/FP0 updated with version 5.17.0 12/12/03.
  • Page 122 Téléchargement de l'image lw8cpu.flash (Suite) EXEMPLE DE CODE 9-2 Dec 12 11:26:30 commando-a lw8: /N0/SB4/FP0 updated with version 5.17.0 12/12/03. Programming /N0/SB4/FP1 Comparing image and flash Image and flash are different, proceeding with update. Erasing ....Done Programming ....Done Verifying ....
  • Page 123 Pour rétrograder le microprogramme d'un système Sun Fire V1280 ou Netra 1280 de la version 5.17.0 à la version 5.13.x à l'aide de la commande lom –G 1. Rétablissez la version antérieure du microprogramme sur le contrôleur système. 2. Réinitialisez le contrôleur système. 3.
  • Page 124 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 125 C H A P I T R E Remplacement des cartes de CPU/mémoire et reconfiguration dynamique (DR) Ce chapitre explique comment reconfigurer les cartes de CPU/mémoire des systèmes d'entrée de milieu de gamme Sun Fire de façon dynamique. Reconfiguration dynamique Présentation Le logiciel de reconfiguration dynamique (DR) fait partie de l'environnement d'exploitation Solaris.
  • Page 126 Interface de ligne de commande La commande Solaris cfgadm(1M) assure l'interface de ligne de commande pour l'administration de la fonctionnalité du logiciel DR. Concepts de la reconfiguration dynamique Dormance Au cours de la déconfiguration d'une carte système dotée de mémoire permanente (mémoire OpenBoot PROM ou noyau), l'environnement d'exploitation fait une brève pause, appelée dormance de l'environnement d'exploitation.
  • Page 127 Périphériques compatibles et incompatibles avec la suspension Lorsque le logiciel DR suspend l'environnement d'exploitation, il est nécessaire de suspendre tous les pilotes de périphériques qui y sont reliés. S'il est impossible d'en suspendre un (ou, par la suite, du rétablir), l'opération de reconfiguration dynamique échoue.
  • Page 128 x correspond à un numéro d'emplacement. Le numéro d'emplacement d'une carte système peut être égal à 0, 2 ou 4. est un nom abrégé créé par le système pour désigner le Un point d'attache logique point d'attache physique. Les points d'attache logiques se présentent comme suit : N0.SBx Notez que la commande cfgadm indique également le bloc d'E/S N0.IB6.
  • Page 129 Matériel connectable à chaud Les périphériques qui se connectent à chaud sont dotés de connecteurs spéciaux qui alimentent la carte ou le module avant que les broches n'établissent un contact. Il est possible d'insérer ou de retirer les cartes et les périphériques équipés de connecteurs à...
  • Page 130 Attention – Si vous retirez physiquement une carte qui se trouve dans l'état connecté ou qui est sous tension dans l'état déconnecté, l'environnement d'exploitation se bloque et vous risquez d'endommager la carte système de façon irrémédiable. États de logement d'une carte TABLEAU 10-2 Description Aucune carte n'est présente.
  • Page 131 Conditions d'une carte TABLEAU 10-4 Description La carte n'a pas été testée. unknown La carte est opérationnelle. Le test de la carte a échoué. failed L'emplacement de la carte est inutilisable. unusable États et conditions des composants Cette section définit les états et les conditions des composants. États de logement d'un composant Les composants ne peuvent pas être individuellement connectés ou déconnectés.
  • Page 132 Conditions d'un composant TABLEAU 10-6 Description Le composant n'a pas été testé. unknown Le composant est opérationnel. Le test du composant a échoué. failed Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...
  • Page 133 Types de composants Le logiciel de reconfiguration dynamique (DR) est capable de configurer ou déconfigurer plusieurs types de composants. Types de composants TABLEAU 10-7 Description CPU individuelle. Ensemble de la mémoire sur la carte. memory Mémoire permanente et volatile Pour que vous puissiez supprimer une carte, l'environnement doit libérer la mémoire qu'elle contient.
  • Page 134 Reconfiguration de la mémoire permanente Lorsqu'une carte de CPU/mémoire contenant de la mémoire impossible à réallouer (mémoire permanente) est reconfigurée dynamiquement à l'extérieur du système, il est nécessaire d'interrompre toutes les activités du domaine pendant un court moment, ce qui risque d'allonger les temps de réponse des applications. Cette condition s'applique normalement à...
  • Page 135 Commande cfgadm La commande cfgadm(1M) effectue les opérations d'administration de la configuration sur les ressources matérielles reconfigurables dynamiquement. Le TABLEAU 10-8 répertorie les états de reconfiguration dynamique des cartes. États de reconfiguration dynamique des cartes à partir du contrôleur système TABLEAU 10-8 États des cartes Description...
  • Page 136 Affichage de l'état détaillé des cartes Pour obtenir un rapport d'état plus détaillé, utilisez la commande cfgadm -av. L'option -a dresse la liste des points d'attache, tandis que l'option -v fournit des descriptions détaillées (commentaires). représente une partie de la sortie issue de la commande EXEMPLE DE CODE 10-2 cfgadm -av.
  • Page 137 détaille le mode d'affichage de l' FIGURE 10-1 EXEMPLE DE CODE 10-2 État de l'occupant Informations sur la ID du point Condition État du logement carte ou le composant d'attache N0.IB6 connected configured powered-on, assigned Apr 3 18:04 PCI_I/O_Boa n /devices/ssm@0,0:N0.IB6 En cas de connexion État occupé...
  • Page 138 commande Les options fournies par la cfgadm -x sont répertoriées dans le TABLEAU 10-10 Options de la commande cfgadm -x TABLEAU 10-10 Option de la commande cfgadm -x Fonction Met une carte de CPU/mémoire sous tension. poweron Met une carte de CPU/mémoire hors tension. poweroff Pour de plus amples informations sur les options des commandes cfgadm -c et cfgadm -x, reportez-vous à...
  • Page 139 Si vous n'indiquez pas le niveau, le niveau de diagnostic par défaut est utilisé. Les niveaux de diagnostic sont les suivants : Niveaux de diagnostic TABLEAU 10-11 Niveau de diagnostic Description Exécution du code d'initialisation de la carte système uniquement. init Aucun test n'est exécuté.
  • Page 140 Remarque – Pour remplacer des cartes, il vous faut parfois des caches SBus. Si vous ne savez pas comment insérer une carte dans le système, consultez le guide Sun Fire E2900 System Service Manual ou Sun Fire V1280/Netra 1280 Service Manual, comme il convient avant de commencer cette procédure.
  • Page 141 3. Vérifiez l'état des voyants Power (d'alimentation) et Hotplug OK (de connexion à chaud). Le voyant Power (d'alimentation) vert clignote pendant un court instant pendant le refroidissement de la carte de CPU/mémoire. Pour que vous puissiez supprimer la carte du système, le voyant d'alimentation vert doit être éteint et le voyant de connexion à...
  • Page 142 2. Retirez la carte du système. Pour le détail de cette procédure, reportez-vous au guide Sun Fire E2900 System Service Manual ou Sun Fire V1280/Netra 1280 Service Manual, comme il convient. 3. Insérez un cache SBus dans l'emplacement dans la minute qui suit le retrait de la carte pour éviter que le système ne surchauffe.
  • Page 143 Échec de l'opération de déconfiguration Une opération de déconfiguration d'une carte de CPU/mémoire peut échouer si le système ne se trouve pas dans un état approprié au début de l'opération. Échec de la déconfiguration d'une carte CPU/mémoire Avant la tentative de déconfiguration de la carte, la mémoire qu'elle contient est entrelacée entre plusieurs cartes Avant la tentative de déconfiguration d'un CPU, un processus est lié...
  • Page 144 Impossible de déconfigurer un CPU avant que l'ensemble de la mémoire ne soit déconfiguré Vous devez déconfigurer l'ensemble de la mémoire d'une carte système avant de déconfigurer un CPU. Si vous tentez de déconfigurer un CPU avant que l'ensemble de la mémoire sur la carte ne soit déconfiguré, le système affiche un message d'erreur du type suivant : cfgadm: Hardware specific failure: unconfigure N0.SB2::cpu0: Can’t unconfig cpu if mem online: /ssm@0,0/memory-controller...
  • Page 145 Mémoire disponible insuffisante Si la déconfiguration échoue et qu'un message semblable à l'un des suivants s'affiche, le système ne disposera pas de suffisamment de mémoire une fois la carte supprimée : cfgadm: Hardware specific failure: unconfigure N0.SB0: Insufficient memory Réduisez la charge de la mémoire sur le système, puis réessayez. Pour des raisons mémoire supplémentaire dans un autre emplacement.
  • Page 146 Impossible de déconnecter une carte Il est possible de déconfigurer une carte, puis de découvrir qu'il est impossible de la déconnecter. L'écran d'état cfgadm indique qu'il est impossible de déconnecter la carte. Ce problème se produit lorsque la carte assure un service matériel essentiel qu'il est impossible de transférer sur une autre carte.
  • Page 147 Glossaire amovible Le pilote de périphérique prend la fonction DDI_DETACH en charge et le périphérique (carte d'E/S ou chaîne SCSI) est placé de telle sorte qu'il puisse être retiré. capacité de suspension Pour pouvoir être reconfiguré dynamiquement, un pilote de périphérique doit être capable d'arrêter les threads utilisateur, d'exécuter l'appel DDI_SUSPEND, d'arrêter l'horloge et d'arrêter les CPU.
  • Page 148 configuration (système) Ensemble des périphériques connectés connus du système. Le système peut commencer à utiliser un périphérique physique une fois que sa configuration est à jour. Le système d'exploitation affecte des rôles fonctionnels à une carte et charge les pilotes de périphériques de la carte et des périphériques qui y sont connectés.
  • Page 149 IPMP (IP Multipathing) Internet Protocol Multipathing. Assure la disponibilité continue des applications en effectuant un équilibrage de la charge en cas d'incident (si plusieurs cartes réseau sont connectées au système). Si un incident se produit au niveau d'une carte réseau alors qu'une autre carte est connectée à la même liaison IP, le système transfère tous les accès réseau de la carte défectueuse vers l'autre carte.
  • Page 150 reconfiguration dynamique physique Opération de reconfiguration dynamique, qui implique l'ajout ou la suppression physique de matériel. Voir aussi reconfiguration dynamique logique. remplacement à Un périphérique remplaçable à chaud est doté de connecteurs d'alimentation chaud CC et de circuits logiques qui permettent de l'insérer sans avoir à mettre le système hors tension.
  • Page 151 Index type, 112 composants ajout manuel à la liste des composants à désactivation, 85 désactiver, 85 liste des composants à désactiver, 85 alarmes, configuration, 54 condition, composant, 109 alarmes, vérification de l'état, 47 console Solaris alimentation, 92 accès, 39 auto-boot?, variable OpenBoot, 59 contrôle autotest à...
  • Page 152 lom -l, commande, 47 lom -t, commande, 52 enablecomponent, commande, 85 lom -v, commande, 49 error-level, variable OpenBoot, 59 lom -X, commande, 55 error-reset-recovery, variable OpenBoot, 60 état de viabilité des composants, 67 état détaillé de la carte, 115 état, composant, 109 maintenance, 95 mappage, 77 bloc d'E/S, 79...
  • Page 153 surveillance de l'environnement, 4 surveillance, conditions ambiantes, 4 paramètres réseau, configuration, 20 système password, commande, 20 blocage, reprise, 88 périphériques à arrêt de sécurité, 107 système bloqué, reprise, 87, 88 périphériques connectables à chaud, 109 système, reprise après blocage, 87 périphériques sans arrêt de sécurité, 107 permanente, mémoire, 112 point d'attache logique, 108...
  • Page 154 Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • Avril 2004...