Sommaire des Matières pour Sun Microsystems Sun Fire Serie
Page 1
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire™ Microprogramme version 5.19.0 Sun Microsystems, Inc. www.sun.com Référence : 819-3262-10 Août 2005, révision A Envoyez vos commentaires sur ce document à : http://www.sun.com/hwdocs/feedback...
Page 2
Copyright 2005 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, California 95054, États-Unis. Tous droits réservés. Sun Microsystems, Inc. détient les droits de propriété intellectuelle relatifs à la technologie incorporée dans le produit décrit dans ce document. En particulier, et sans limitation aucune, ces droits de propriété intellectuelle peuvent inclure un ou plusieurs des brevets américains répertoriés à...
Page 3
Table des matières Préface xix Présentation 1 Contrôleur système 1 Ports d’E/S 2 Invite LOM 3 Console Solaris 4 Contrôle des conditions ambiantes 4 Carte des indicateurs du système 4 Fiabilité, disponibilité et entretien (RAS) 6 Fiabilité 6 Désactivation de composants ou de cartes et autotest à la mise sous tension (POST) 7 Désactivation manuelle des composants 7 Contrôle des conditions ambiantes 7...
Page 4
Entretien 9 DEL 9 Nomenclature 9 Consignation des erreurs du contrôleur système 9 Prise en charge XIR (eXternally Initiated Reset) du contrôleur système 9 Option Capacity on Demand 10 Démarrage et configuration des systèmes d’entrée de milieu de gamme Sun Fire 11 Configuration du matériel 12 ▼...
Page 5
Installation des packages LOM (Lights Out Management) 23 ▼ Pour installer les pilotes LOM 23 ▼ Pour installer l’utilitaire LOM 25 ▼ Pour installer les pages de manuel LOM 26 Réinitialisation du système 27 ▼ Pour effectuer une réinitialisation forcée du système 27 ▼...
Page 6
Utilisation des commandes LOM (Lights Out Management) et du contrôleur système du système d’exploitation Solaris 43 Syntaxe des commandes LOM 44 Contrôle du système à partir du système d’exploitation Solaris 45 Affichage de la documentation électronique sur LOM 45 Affichage de la configuration LOM (lom -c) 45 Vérification de l’état de la DEL d’erreur et des alarmes (lom -l) 46 Affichage du journal des événements (lom -e) 46 Vérification des ventilateurs (lom -f) 47...
Page 7
Obtention d’informations de diagnostic et de reprise automatiques 69 Analyse des messages d’événements de diagnostic automatique 69 Analyse de l’état des composants 71 Consultation d’informations supplémentaires sur les erreurs 73 Directives de sécurité 75 Sécurité du système 75 Définition du mot de passe de la console 76 Utilisation de la configuration par défaut du protocole SNMP 76 ▼...
Page 8
Prise en main de l’option COD 87 Gestion des licences d’utilisation COD 87 ▼ Pour obtenir une clé de licence d’utilisation COD et ajout à la base de données de licences COD 88 ▼ Pour supprimer une clé de licence COD de la base de données de licences COD 89 ▼...
Page 9
Pannes système 104 Unités remplaçables sur site (par le client) 105 Système Sun Fire E2900 105 Système Sun Fire V1280 106 Système Netra 1280 106 Ajout manuel à la liste des composants désactivés (en attente de réparation) 107 Conditions spéciales relatives aux cartes CPU/Mémoire 108 Récupération après blocage du système 109 ▼...
Page 10
Utilisation de la commande lom –G 123 Exemples 124 ▼ Pour mettre à niveau le microprogramme d’un système Sun Fire E2900, Sun Fire V1280 ou Netra 1280 à l’aide de la commande lom –G 126 ▼ Pour mettre à niveau inférieur le microprogramme d’un système Sun Fire E2900, Sun Fire V1280 ou Netra 1280 à...
Page 11
Interface de ligne de commande 137 Commande cfgadm 138 ▼ Pour afficher l’état de base des cartes 138 ▼ Pour afficher l’état détaillé des cartes 139 Options de la commande 140 Test des cartes et des assemblages 141 ▼ Pour tester une carte CPU/mémoire 141 Installation ou remplacement des cartes processeur/mémoire 142 ▼...
Page 12
Description du mode application de l’horloge chien de garde 151 Description du mode application de l’horloge chien de garde 152 Utilisation du pilote ntwdt 153 Description des API utilisateur 153 Définition du délai d’expiration 154 Activation ou désactivation du chien de garde 154 Réarmement ou réinitialisation du chien de garde 155 Obtention de l’état de l’horloge chien de garde 155 Recherche et définition des structures de données 156...
Page 13
Figures Ports d’E/S 2 FIGURE 1-1 Carte des indicateurs du système 4 FIGURE 1-2 Interrupteur d’alimentation Marche/Veille 13 FIGURE 2-1 Procédures de navigation entre consoles 37 FIGURE 3-1 Consignation des messages du contrôleur système 42 FIGURE 4-1 Procédure de diagnostic et de reprise automatiques 64 FIGURE 7-1 Désignation des emplacements physiques PCI IB_SSC pour IB6 sur les systèmes d’entrée FIGURE 10-1...
Page 14
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 15
Tableaux Sélection de tâches de gestion du contrôleur système 3 TABLEAU 1-1 Fonctions des DEL du système 5 TABLEAU 1-2 Description de l’interrupteur d’alimentation Marche/Veille 13 TABLEAU 2-1 Paramètres de configuration de POST 56 TABLEAU 6-1 Paramètres de diagnostic et de reprise du système d’exploitation 68 TABLEAU 7-1 Attributs du serveur SSH 77 TABLEAU 8-1...
Page 16
Conditions d’une carte 134 TABLEAU 12-4 États des occupants de type composant 135 TABLEAU 12-5 Conditions des composants 135 TABLEAU 12-6 Types de composants 136 TABLEAU 12-7 États des cartes DR d’après le contrôleur système (SC) 138 TABLEAU 12-8 Options de la commande cfgadm -c 140 TABLEAU 12-9 Options de la commande cfgadm -x 141 TABLEAU 12-10...
Page 17
Exemples de code Sortie issue de la réinitialisation matérielle du contrôleur système 18 EXEMPLE DE CODE 2-1 Sortie de la commande setupnetwork 21 EXEMPLE DE CODE 2-2 Installation des pilotes LOM 23 EXEMPLE DE CODE 2-3 Installation de l’utilitaire LOM 25 EXEMPLE DE CODE 2-4 Installation des pages de manuel LOM 26 EXEMPLE DE CODE 2-5...
Page 18
Sortie de la commande showboards – Composants Disabled et Degraded 72 EXEMPLE DE CODE 7-6 Sortie de la commande showcomponent – Composants désactivés 73 EXEMPLE DE CODE 7-7 Sortie de la commande showerrorbuffer — Erreur matérielle 74 EXEMPLE DE CODE 7-8 Sortie de journal de console indiquant des CPU COD désactivées 95 EXEMPLE DE CODE 9-1 Sortie de la commande showcomponent –...
Page 19
Préface Ce manuel offre une vue d’ensemble du système et une description détaillée des procédures d’administration courantes. Il explique comment configurer et gérer le microprogramme du contrôleur système sur les serveurs d’entrée de milieu de gamme de la famille Sun Fire™, autrement dit les systèmes Sun Fire E2900 et Sun Fire V1280/Netra 1280.
Page 20
Chapitre 8 décrit les consignes de sécurité. Chapitre 9 décrit l’option COD (Capacity on Demand) et le mode d’allocation, d’activation et de surveillance des ressources COD. Chapitre 10 fournit des informations sur la résolution des problèmes, notamment sur les DEL et les pannes système. Il explique comment afficher les données de diagnostic et de configuration du système, désactiver des composants (en les plaçant sur la liste noire) et mapper les chemins d’accès des périphériques aux périphériques physiques du système.
Page 21
Conventions typographiques Police Signification Exemples Noms de commandes, de Modifiez le fichier .login. AaBbCc123 fichiers et de répertoires ; Utilisez ls -a pour dresser la liste de tous affichage sur -l’écran de les fichiers. l’ordinateur % Vous avez du courrier. Ce que vous tapez, par AaBbCc123 opposition à...
Page 22
Documentation connexe Type de manuel Titre Référence Référence des Manuel de référence des commandes des contrôleurs des 819-1268-10 commandes systèmes d’entrée de milieu de gamme Sun Fire Documentation Sun en ligne Vous pouvez visualiser et imprimer une large sélection de documents Sun™ (y compris des versions traduites) à...
Page 23
C H A P I T R E Présentation Ce chapitre fournit une description de base des fonctions des serveurs d’entrée de milieu de gamme Sun Fire (systèmes Sun Fire E2900 et Sun Fire V1280/Netra 1280). La présentation des procédures de configuration du système est traitée dans le Chapitre Ce chapitre comprend les rubriques suivantes : «...
Page 24
Ports d’E/S À l’arrière du système, vous trouverez les ports suivants : Port série de la console (RS-232) (RJ-45) ■ Port série réservé (RS-232) (RJ-45) ■ 2 ports Gigabit Ethernet (RJ-45) ■ Port d’alarmes (DB-15) ■ Port Ethernet 10/100 du contrôleur système (RJ-45) ■...
Page 25
Le port série de la console et le port Ethernet 10/100 peuvent servir à accéder au contrôleur système. Le port série vous permet de vous connecter directement à un terminal ASCII ou à un serveur de terminal de réseau (NTS - Network Terminal Server). La connexion de la carte du contrôleur système avec un câble série vous permet d’accéder à...
Page 26
Console Solaris Si le système d’exploitation Solaris, la mémoire OpenBoot PROM ou l’autotest à la mise sous tension sont en cours d’exécution, la console Solaris est accessible. Lorsque vous vous connectez à la console Solaris, vous vous trouvez dans l’un des modes de fonctionnement suivants : console du système d’exploitation Solaris (invites % ou #) ;...
Page 27
explique le rôle de chaque DEL. TABLEAU 1-2 Fonctions des DEL du système TABLEAU 1-2 Couleur Fonction Localisateur Blanc Normalement éteint ; peut s’allumer à l’aide d’une commande utilisateur Erreur système Orange S’allume lorsque LOM détecte une panne. Système actif Vert S’allume lorsque le système est sous tension.
Page 28
Fiabilité, disponibilité et entretien (RAS) Les fonctions de fiabilité, de disponibilité et d’entretien font partie de ce système. La fiabilité est la probabilité qu’un système reste opérationnel pendant un temps ■ donné, dans des conditions normales de fonctionnement. Contrairement à la disponibilité, elle tient compte uniquement des échecs, et non pas des échecs et des reprises.
Page 29
Désactivation de composants ou de cartes et autotest à la mise sous tension (POST) L’autotest à la mise sous tension s’exécute au démarrage du système. Si le test sur une carte ou un composant échoue, l’autotest à la mise sous tension les désactive. Pour afficher l’état de la carte (échec ou dommage), utilisez la commande showboards.
Page 30
Disponibilité La fonction de disponibilité du logiciel inclut les caractéristiques suivantes : Reconfiguration dynamique ■ Coupure d’alimentation ■ Redémarrage du contrôleur système ■ Chien de garde de l’hôte ■ Reconfiguration dynamique Il est possible de reconfigurer les éléments suivants de façon dynamique : Disques durs ■...
Page 31
Entretien Les fonctions d’entretien permettent d’améliorer l’efficacité et la rapidité des services de dépannage (réguliers et d’urgence) fournis au système. ■ Nomenclature ■ Consignation des erreurs du contrôleur système ■ Prise en charge XIR (eXternally Initiated Reset) du contrôleur système ■...
Page 32
Option Capacity on Demand L’option Capacity on Demand (COD) permet d’obtenir davantage de ressources de traitement (CPU supplémentaires) sur les systèmes dotés de cartes CPU/mémoire UltraSPARC IV (tels que les serveurs Sun Fire E2900) lorsque vous en avez besoin. Ces CPU supplémentaires sont fournis sur des cartes CPU/mémoire COD installées sur votre système.
Page 33
C H A P I T R E Démarrage et configuration des systèmes d’entrée de milieu de gamme Sun Fire Ce chapitre explique comment mettre le système sous tension à l’aide de l’interface de ligne de commande du contrôleur système (invite LOM), comment configurer le contrôleur système à...
Page 34
Configuration du matériel ▼ Pour installer et câbler le matériel 1. Reliez un terminal au port série de la carte du contrôleur système(voir FIGURE 1-1 2. Appliquez la vitesse de transmission du port série (9600 8N1) au terminal. Les paramètres du port série de la carte du contrôleur système sont les suivants : 9 600 bauds ■...
Page 35
Utilisation de l’interrupteur d’alimentation Marche/Veille L’interrupteur d’alimentation (Marche/Veille) des systèmes d’entrée de milieu de gamme Sun Fire est un interrupteur à bascule, à fonctionnement momentané. Il contrôle uniquement les signaux basse tension et filtre les signaux haute tension. Remarque – L’interrupteur d’alimentation n’est pas de type Marche/Arrêt, mais Marche/Veille.
Page 36
Mise sous et hors tension Une fois tous les câbles d’alimentation branchés et les disjoncteurs externes activés, le système se met en mode Veille. Les seules DEL allumées sur la carte des indicateurs système sont les DEL Source A et Source B. La DEL d’activité du bloc IB_SSC est allumée, mais n’est pas visible à...
Page 37
Le contrôleur système met sous tension les blocs d’alimentation, puis le plateau de ventilation Il finit par les cartes système. Si la valeur de la variable OpenBoot PROM auto-boot? est définie sur true, le système initialise également le système d’exploitation Solaris. La commande poweron peut également servir à...
Page 38
Pour utiliser la commande LOM shutdown ▼ Utilisez la commande LOM shutdown pour fermer correctement Solaris et mettre en veille tous les modules et châssis du système. Remarque – Si le logiciel Solaris est en cours d’exécution, cette commande tente d’arrêter le système correctement avant de le mettre en veille.
Page 39
lom>poweroff This will abruptly terminate Solaris. Do you want to continue? [no] Répondez yes si vous souhaitez arrêter le système Solaris sans vous préoccuper de l’état dans lequel il se trouve. Dans des conditions normales de fonctionnement, utilisez la commande shutdown. 2.
Page 40
Attached TCP/IP interface to eri unit 0 Attaching interface lo0...done Gateway: xxx.xxx.xxx.xxx interrupt: 100 Mbps half duplex link up Copyright 2001-2002 Sun Microsystems, Inc. All rights reserved. Use is subject to license terms. Lights Out Management Firmware RTOS version: 23 ScApp version: 5.13.0007 LW8_build0.7...
Page 41
Sortie issue de la réinitialisation matérielle du contrôleur système (suite) EXEMPLE DE CODE 2-1 Hardware Reset... Fri Jul 19 15:49:06 some_name lom: NOTICE: /N0/FT0 is powered off Connected. lom> Configuration du système Après la mise sous tension, vous devez configurer le système à l’aide des commandes setdate et setupnetwork du contrôleur système présentées dans ce chapitre.
Page 42
Pour configurer le mot de passe ▼ 1. À l’invite LOM, tapez la commande password du contrôleur système. 2. À l’invite Enter new password:, saisissez votre mot de passe. 3. À l’invite Enter new password again:, ressaisissez votre mot de passe. lom>password Enter new password: Enter new password again:...
Page 43
Reportez-vous au Manuel de référence des commandes des contrôleurs des systèmes d’entrée de milieu de gamme Sun Fire pour une description détaillée de la commande setupnetwork. L’ illustre l’emploi de la commande EXEMPLE DE CODE 2-2 setupnetwork. Sortie de la commande setupnetwork EXEMPLE DE CODE 2-2 lom>...
Page 44
Installation et démarrage du système d’exploitation Solaris Pour utiliser les commandes LOM, installez les packages Lights Out Management 2.0 (SUNWlomu, SUNWlomr et SUNWlomm) à partir du CD Solaris Supplemental. Pour installer et initialiser le système ▼ d’exploitation Solaris 1. Accédez à l’invite LOM. Pour des instructions détaillées sur l’accès à...
Page 45
# pkgadd -d . SUNWlomr Processing package instance <SUNWlomr> from </var/tmp> LOMlite driver (root) (sparc) 2.0,REV=2000.08.22.14.14 Copyright 2000 Sun Microsystems, Inc. All rights reserved. ## Executing checkinstall script. Using </> as the package base directory. ## Processing package information. ## Processing system information.
Page 46
Installation des pilotes LOM (suite) EXEMPLE DE CODE 2-3 ## Checking for setuid/setgid programs. This package contains scripts which will be executed with super-user permission during the process of installing this package. Do you want to continue with the installation of <SUNWlomr> [y,n,?] y Installing LOMlite driver (root) as <SUNWlomr>...
Page 47
Processing package instance <SUNWlomu> from </cdrrom/suppcd_s28u7_multi_s28u7_supp.08al1/Lights_Out_Management_2.0/Product> LOMlite Utilities (usr) (sparc) 2.0,REV=2000.08.22.14.14 Copyright 2000 Sun Microsystems, Inc. All rights reserved. Using </> as the package base directory. ## Processing package information. ## Processing system information. 4 package pathnames are already properly installed.
Page 48
Processing package instance <SUNWlomm> from </cdrom/suppcd_s28u7_multi_s28u7_supp.08al1/Lights_Out_Management_2.0/Product> LOMlite manual pages (sparc) 2.0,REV=2000.08.22.14.14 Copyright 2000 Sun Microsystems, Inc. All rights reserved. Using </> as the package base directory. ## Processing package information. ## Processing system information. 5 package pathnames are already properly installed.
Page 49
Réinitialisation du système La commande reset permet de réinitialiser le système s’il se bloque ou en cas de problème matériel. Si le système d’exploitation Solaris est en cours d’exécution, vous êtes invité à confirmer cette action : ▼ Pour effectuer une réinitialisation forcée du système ●...
Page 50
Pour réinitialiser le contrôleur système ▼ ● Utilisez la commande resetsc pour réinitialiser le contrôleur système. Elle peut être utile en cas de problème de matériel ou de logiciel affectant le fonctionnement du contrôleur système. lom>resetsc Are you sure you want to reboot the system controller now? [no] y Ceci permet de réinitialiser le contrôleur système, d’exécuter le niveau de test POST spécifié...
Page 51
C H A P I T R E Procédures de navigation Ce chapitre présente les procédures détaillées, accompagnées d’illustrations, à suivre pour se connecter au système et se déplacer entre le shell LOM et la console. Il explique également comment mettre fin à une session du contrôleur système. Ce chapitre comprend les rubriques suivantes : «...
Page 52
Établissement d’une connexion console Il existe deux manières d’accéder à l’interface console LOM : via le port série (direct) du contrôleur système ; ■ via une connexion (réseau) telnet à l’aide du port Ethernet 10/100. ■ Attention – À partir de la version 5.17.0 du microprogramme, les connexions réseau sont désactivées par défaut.
Page 53
1. Saisissez le mot de passe défini précédemment à l’aide de la commande password. Enter Password: Si le mot de passe est accepté, le contrôleur système indique qu’une connexion est établie. Si le système est en veille, l’invite lom s’affiche automatiquement. Connected.
Page 54
Pour établir une connexion avec un serveur de ▼ terminal réseau Un menu comportant les divers serveurs auxquels vous pouvez vous connecter s’affiche. Sélectionnez le serveur qui vous intéresse. S’il existe un mot de passe LOM (et que la connexion précédente est fermée), vous êtes invité...
Page 55
4. Sinon, appuyez sur Entrée pour afficher l’invite de la console Solaris. Connected. Pour établir une connexion avec le port série B ▼ d’une station de travail 1. À l’invite du shell Solaris, tapez : # tip hardwire Pour une description complète de la commande tip, reportez-vous à la page de manuel tip.
Page 56
3. Si une connexion à la console LOM est déjà établie via un port réseau, vous êtes invité à vous connecter en mettant fin à la connexion existante : Enter Password: The console is already in use. Host: somehost.acme.com Connected: May 24 10:27 Idle time: 00:23:17 Force logout of other user? (y/n) y Connected.
Page 57
4. Sinon, appuyez sur Entrée pour afficher l’invite de la console Solaris. Connected. 5. Si une connexion à la console LOM est déjà établie via le port série, vous êtes invité à vous connecter en mettant fin à la connexion existante : # ssh nom-hôte The console is already in use.
Page 58
Dans le cas d’une connexion réseau, la réponse se présente comme suit : lom>logout Connection closed. Connection to nom-hôte closed by remote host. Connection to nom-hôte closed.Connection closed. Navigation entre différentes consoles La connexion à la console du contrôleur système permet d’accéder à l’interface de ligne de commande LOM du contrôleur système, au système d’exploitation (SE) Solaris et à...
Page 59
Système d’exploitation Solaris Tapez la séquence d’échappement OpenBoot PROM Tapez la séquence d’échappement Shell LOM Saisissez : lom>console Saisissez : lom>break lom> Procédures de navigation entre consoles FIGURE 3-1 Chapitre 3 Procédures de navigation...
Page 60
Pour accéder à l’invite LOM ▼ ● Pour accéder à l’invite LOM depuis la console Solaris, tapez la séquence d’échappement. Par défaut, il s’agit de « #. » (signe dièse suivi d’un point). Par exemple, si la séquence d’échappement par défaut est #.., vous verrez : lom>...
Page 61
Pour accéder à l’invite LOM à partir de ▼ l’OpenBoot PROM ● Pour passer de l’OpenBoot PROM à l’invite LOM, suivez la même procédure que pour passer du système d’exploitation Solaris à l’invite LOM. Tapez la séquence de caractères d’échappement (#., par défaut). {2} ok lom>...
Page 62
Pour terminer une session lorsque la connexion ▼ au contrôleur système est établie via le port série Si vous vous trouvez à l’invite Solaris ou dans l’OpenBoot PROM, accédez à ■ l’invite LOM en tapant la séquence d’échappement, mettez fin à la session de l’invite LOM à...
Page 63
C H A P I T R E Consignation des messages du contrôleur système Le contrôleur système génère des messages horodatés pour les événements système et les processus, tels que la mise sous tension, l’initialisation, la mise hors tension, la modification des unités enfichables à...
Page 64
Fire). Cela permet de déterminer si un message s’imprime à l’invite lom> au moment où le message est enregistré, et s’il est dirigé vers le système de connexion Solaris afin d’être consigné dans /var/adm/messages. Remarque – Les systèmes équipés du contrôleur système à mémoire améliorée (également appelé...
Page 65
C H A P I T R E Utilisation des commandes LOM (Lights Out Management) et du contrôleur système du système d’exploitation Solaris Ce chapitre explique l’utilisation des commandes LOM disponibles dans le système d’exploitation Solaris pour le contrôle et la gestion du système d’entrée de milieu de gamme Sun Fire.
Page 66
Syntaxe des commandes LOM lom [-c] [-l] [-f] [-v] [-t] [-a] [-G] [-X] lom -e <n>, [x] lom -A on|off <n> lom -E on|off où : -c affiche la configuration LOM. -l affiche l’état des DEL d’erreur et d’alarmes. -e affiche le journal des événements. -f affiche l’état du ventilateur.
Page 67
Contrôle du système à partir du système d’exploitation Solaris Il existe deux manières d’interroger le périphérique LOM (contrôleur système) ou de lui envoyer des commandes à exécuter : en exécutant des commandes LOM à partir de l’invite de shell lom> (voir Chapitre 3) ;...
Page 68
Vérification de l’état de la DEL d’erreur et des alarmes (lom -l) ● Pour vérifier si la DEL d’erreur du système et les alarmes sont allumées ou éteintes, tapez : Exemple de sortie de la commande lom -l EXEMPLE DE CODE 5-2 # lom -l LOM alarm states: Alarm1=off...
Page 69
Si vous ne spécifiez aucun niveau, les rapports qui s’affichent concernent les événements de niveau 1, 2 et 3. L’ représente un exemple de journal des événements. EXEMPLE DE CODE 5-3 Exemple de journal des événements LOM (par ordre d’ancienneté EXEMPLE DE CODE 5-3 des événements) # lom -e 11...
Page 70
Si vous devez remplacer un ventilateur, contactez le représentant commercial Sun de votre région et indiquez la référence du composant requis. Pour de plus amples informations, reportez-vous au guide Sun Fire V1280/Netra 1280 Service Manual. Les informations incluses dans la sortie générée par cette commande figurent également dans la sortie issue de la commande Solaris prtdiag -v.
Page 71
Exemple de sortie de la commande lom -v (suite) EXEMPLE DE CODE 5-5 27 IB6 v_2.4vdc0 status=ok System status flags: 1 PS0 status=okay 2 PS1 status=okay 3 FT0 status=okay 4 FT0/FAN0 status=okay 5 FT0/FAN1 status=okay 6 FT0/FAN2 status=okay 7 FT0/FAN3 status=okay 8 FT0/FAN4 status=okay...
Page 72
Exemple de sortie de la commande lom -v (suite) EXEMPLE DE CODE 5-5 46 SB2/P2 status=online 47 SB2/P2/B0/D0 status=okay 48 SB2/P2/B0/D1 status=okay 49 SB2/P2/B0/D2 status=okay 50 SB2/P2/B0/D3 status=okay 51 SB2/P3 status=online 52 SB2/P3/B0/D0 status=okay 53 SB2/P3/B0/D1 status=okay 54 SB2/P3/B0/D2 status=okay 55 SB2/P3/B0/D3 status=okay 56 IB6 status=ok...
Page 73
Exemple de sortie de la commande lom -t (suite) EXEMPLE DE CODE 5-6 19 SB0 t_ar0 39 degC : warning 102 degC : shutdown 107 degC 20 SB0 t_dx0 49 degC : warning 102 degC : shutdown 107 degC 21 SB0 t_dx1 54 degC : warning 102 degC : shutdown 107 degC 22 SB0...
Page 74
Affichage de toutes les données relatives à l’état des composants et à la configuration LOM (lom -a) ● Pour afficher toutes les données d’état et de configuration LOM, tapez : # lom -a Autres tâches LOM exécutées depuis Solaris Cette section explique comment : activer et désactiver les indicateurs d’alarme ;...
Page 75
Modification de la séquence d’échappement de l’invite lom> (lom -X) La séquence de caractères (dièse, point) vous permet de passer de l’invite du système d’exploitation Solaris à l’invite lom>. ● Pour modifier la séquence d’échappement par défaut, tapez : # lom -X xy où...
Page 76
Mise à niveau du microprogramme (lom -G nom du fichier) Pour obtenir une description complète, reportez-vous au Chapitre Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 77
C H A P I T R E Exécution de POST Chaque carte système (cartes CPU/mémoire et bloc IB_SSC) contient une mémoire flash PROM permettant de stocker les diagnostics de l’autotest POST. Les éléments suivants sont testés au cours de l’autotest : Puces de CPU ■...
Page 78
Pour afficher les paramètres actuels, utilisez la commande OpenBoot printenv : {3} ok printenv diag-level diag-level init (init) Pour modifier le paramétrage d’une variable, utilisez la commande OpenBoot PROM setenv : {1} ok setenv diag-level quick diag-level=quick Par exemple, pour configurer l’autotest POST de sorte qu’il s’exécute plus rapidement, procédez comme suit : {1} ok setenv diag-level init diag-level=init...
Page 79
Paramètres de configuration de POST (suite) TABLEAU 6-1 Paramètre Valeur Description Exécute tous les tests du niveau par défaut, ainsi que des mem1 algorithmes de test DRAM et SRAM plus complets. Identique à mem1 à la différence qu’un test DRAM supplémentaire mem2 compare les opérations des données DRAM de façon explicite.
Page 80
{/N0/SB0/P2} @(#) lpost 5.13.0007 2002/07/18 12:45 {/N0/SB0/P1} @(#) lpost 5.13.0007 2002/07/18 12:45 {/N0/SB0/P0} Copyright 2001 Sun Microsystems, Inc. All rights reserved. {/N0/SB0/P0} Subtest: Setting Fireplane Config Registers {/N0/SB0/P0} Subtest: Display CPU Version, frequency {/N0/SB0/P0} Version register = 003e0015.21000507 {/N0/SB0/P0} Cpu/System ratio = 6, cpu actual frequency = 900 {/N0/SB0/P1} Copyright 2001 Sun Microsystems, Inc.
Page 81
Probing /ssm@0,0/pci@19,600000 Device 2 network Sun Fire V1280 OpenFirmware version 5.13.0007 (18/07/02 12:45) Copyright 2001 Sun Microsystems, Inc. All rights reserved. SmartFirmware, Copyright (C) 1996-2001. All rights reserved. 16384 MB memory installed, Serial #9537054. Ethernet address 8:0:xx:xx:xx:xx, Host ID: 80xxxxxx.
Page 82
Pour exécuter les tests POST minimaux avant le prochain redémarrage, utilisez l’instruction suivante : lom>shutdown lom>bootmode skipdiag lom>poweron Si le système ne redémarre pas dans les 10 minutes suivant l’exécution de la commande bootmode, le paramètre bootmode est redéfini sur normal et les valeurs diag-level et verbosity-level précédemment définies s’appliquent.
Page 83
Lorsque le niveau SC POST diag-level est défini sur min, la sortie suivante s’affiche sur le port série à la prochaine réinitialisation du contrôleur système : Sortie SC POST du contrôleur système avec le niveau de diagnostic défini sur min EXEMPLE DE CODE 6-3 @(#) SYSTEM CONTROLLER(SC) POST 21 2001/12/11 17:11 PSR = 0x044010e5...
Page 84
Sortie SC POST du contrôleur système avec le niveau de diagnostic défini sur min (suite) EXEMPLE DE CODE 6-3 Local I2C LM75 Test TEMP2(CBH) Device Test Temperature : 32.0 Degree(C) Local I2C PCF8574 Test Sc CSR Device Test Console Bus Hub Test CBH Register Access Test...
Page 85
C H A P I T R E Diagnostic et reprise d’erreurs automatiques Ce chapitre décrit les fonctionnalités de diagnostic d’erreurs et de reprise de domaine comprises dans le microprogramme pour les systèmes d’entrée de milieu de gamme Sun Fire. Il comprend les rubriques suivantes : «...
Page 86
Le système est en cours d’exécution. Le contrôleur système détecte les erreurs liées au matériel et interrompt le système d’exploitation (SE). Diagnostic automatique Restauration automatique Se redémarré Procédure de diagnostic et de reprise automatiques FIGURE 7-1 Le résumé ci-dessous décrit le processus illustré par la FIGURE 7-1 1.
Page 87
Le moteur AD enregistre les informations de diagnostic pour les composants affectés et les intègre au statut de viabilité du composant (CHS). Le moteur AD consigne les informations de diagnostic dans les messages d’événement de la console. L’ représente un message d’événement de diagnostic EXEMPLE DE CODE 7-1 ■...
Page 88
Reprise automatique après blocage du système Le contrôleur système vérifie automatiquement si les systèmes sont bloqués lorsque l’un des incidents suivants se produit : Les pulsations du système d’exploitation s’arrêtent au cours d’un délai ■ d’expiration donné. La durée de ce timeout est par défaut de trois minutes mais vous pouvez modifier cette valeur en configurant le paramètre watchdog_timeout_seconds dans le fichier /etc/systems du domaine.
Page 89
Événements de diagnostic Le système d’exploitation Solaris identifie certaines erreurs non critiques liées au matériel et les signale au contrôleur système. Le contrôleur système effectue les opérations suivantes : Il enregistre et administre les informations de diagnostic relatives aux ressources ■...
Page 90
Contrôles de diagnostic et de reprise Cette section présente les divers contrôles et paramètres régissant les fonctions de restauration. Paramètres de diagnostic décrit les variables des paramètres contrôlant le processus de TABLEAU 7-1 diagnostic et de reprise du système d’exploitation. Les valeurs par défaut des paramètres de diagnostic et de reprise du système d’exploitation indiquées correspondent aux variables recommandées.
Page 91
Paramètres de diagnostic et de reprise du système d’exploitation (suite) TABLEAU 7-1 Paramètre Défini avec Valeur par défaut Description Redémarre automatiquement le domaine lors de la reboot-on-error OBP setenv true détection d’une erreur liée au matériel. Redémarre également le système d’exploitation Solaris lorsque le paramètre OBP.auto-boot est défini sur true.
Page 92
Les messages d’événements [AD] ou [DOM] (voir EXEMPLE DE CODE 7-1 EXEMPLE ) incluent les informations DE CODE 7-4 EXEMPLE DE CODE 7-5 EXEMPLE DE CODE 7-6 suivantes : [AD]ou [DOM] – Début du message. AD indique que le moteur de diagnostic ■...
Page 93
Recommended-Action: Service action required : recommande à ■ l’administrateur de contacter leur prestataire de services de maintenance pour qu’il effectue des opérations de maintenance supplémentaires. Marque également la fin du message de diagnostic automatique. Exemple de message de diagnostic automatique EXEMPLE DE CODE 7-5 Tue Dec 02 14:35:56 commando lom: ErrorMonitor: Domain A has a SYSTEM ERROR Tue Dec 02 14:35:59 commando lom: [AD] Event: E2900...
Page 94
Vous pouvez obtenir des informations supplémentaires sur les composants Failed, Disabled ou Degraded en examinant la sortie de la commande showcomponent. Sortie de la commande showboards – Composants Disabled et Degraded EXEMPLE DE CODE 7-6 Slot Pwr Component Type State Status ---- --- --------------...
Page 95
Sortie de la commande showcomponent – Composants désactivés EXEMPLE DE CODE 7-7 nomhôtesc: SC> showcomponent Component Status Pending POST Description --------- ------ ------- ---- ----------- /N0/SB0/P0 disabled UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB0/P1 disabled UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB0/P2 disabled UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB0/P3 disabled UltraSPARC-IV, 1050MHz, 16M ECache...
Page 96
L’ représente la sortie affichée dans le cas d’une erreur liée au EXEMPLE DE CODE 7-8 matériel sur un domaine. Sortie de la commande — Erreur matérielle showerrorbuffer EXEMPLE DE CODE 7-8 EX07: lom>showerrorbuffer ErrorData[0] Date: Fri Jan 30 10:23:32 EST 2004 Device: /SSC1/sbbc0/systemepld Register: FirstError[0x10]: 0x0200 SB0 encountered the first error...
Page 97
C H A P I T R E Directives de sécurité Ce chapitre aborde le thème crucial de la sécurité du système. Il détaille les recommandations en matière de sécurité, analyse le problème de minimisation de domaine et fournit des références pour la sécurité des systèmes d’exploitation Solaris. Ce chapitre comprend les rubriques suivantes : «...
Page 98
Définition du mot de passe de la console Les seules restrictions applicables aux mots de passe du contrôleur système sont qu’ils doivent être reconnus par le code ASCII et l’émulateur de terminal utilisé. Le SC utilise l’algorithme MD5 pour générer un hachage du mot de passe saisi. En conséquence, tous les caractères ont leur importance.
Page 99
Pour obtenir plus d’informations sur l’outil de sécurité développé par Sun afin de créer des configurations sécurisées pour les systèmes fonctionnant sous Solaris, consultez le site Web suivant : http://www.sun.com/security/jass Sélection d’un type de connexion à distance Les services SSH et Telnet du contrôleur système sont désactivés par défaut. Activation de SSH Si le SC se trouve sur un réseau polyvalent, vous pouvez garantir un accès à...
Page 100
Attributs du serveur SSH (suite) TABLEAU 8-1 Attribut Valeur Commentaires PubkeyAuthentication Authentification des clés publiques désactivée PermitEmptyPasswords Oui Authentification des mots de passe contrôlée par le SC hmac-sha1,hmac-md5 Implémentation de serveur SSH identique à celle du système d’exploitation Solaris 9 Ciphers aes128-cbc,blowfish-cbc,3des-cbc Implémentation de serveur SSH identique à...
Page 101
Fonctions non prises en charge par SSH Le serveur SSH des systèmes d’entrée de milieu de gamme Sun Fire ne prend pas en charge les fonctionnalités suivantes : Exécution sur la ligne de commande à distance ■ Commande scp (programme de copie sécurisé) ■...
Page 102
Remarques supplémentaires sur la sécurité Cette section comprend les rubriques suivantes : Séquences de touches spéciales autorisant l’accès au shell du RTOS ■ Minimisation des domaines ■ Sécurité du système d’exploitation Solaris ■ Séquences de touches spéciales autorisant l’accès au shell du RTOS Des séquences de touches spéciales peuvent être envoyées au SC, via sa connexion série, pendant son initialisation.
Page 103
Sécurité du système d’exploitation Solaris Pour plus d’informations sur la sécurité du système d’exploitation Solaris, reportez- vous aux manuels et articles suivants : Solaris Security Best Practices – disponible en ligne sur ■ http://www.sun.com/security/blueprints Articles figurant dans le kit d’outils de sécurité de Solaris – disponibles en ligne à ■...
Page 104
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 105
C H A P I T R E Option Capacity on Demand (COD) Les systèmes d’entrée de milieu de gamme Sun Fire sont configurés avec des CPU installés sur des cartes CPU/mémoire. Ces dernières sont livrées avec votre configuration système initiale ou sont vendues en tant que composants additionnels. Les droits d’utilisation des CPU de ces cartes sont compris dans le prix d’achat initial.
Page 106
Présentation de l’option COD L’option COD ajoute des ressources CPU sur les cartes CPU/mémoire COD installées sur votre système. Bien que votre système de milieu de gamme soit configuré avec un nombre minimal de cartes CPU/mémoire standard (actives), il peut être composé d’un nombre maximal défini de cartes CPU/mémoire standard et COD.
Page 107
Allocation des licences d’utilisation COD Avec l’option COD, votre système est configuré pour disposer d’un certain nombre de CPU COD, selon le nombre de cartes CPU/mémoire COD et de licences d’utilisation COD que vous avez acquises. Les licences d’utilisation COD que vous obtenez sont traitées comme un groupe de licences disponibles.
Page 108
CPU à accès instantané Si vous avez besoin de ressources CPU COD avant la fin du processus d’acquisition d’une licence d’utilisation COD, vous pouvez activer temporairement un nombre limité de ressources CPU appelés CPU à accès instantané (ou plafond). Ces CPU à accès instantané...
Page 109
Prise en main de l’option COD Avant d’utiliser l’option COD sur les systèmes d’entrée de milieu de gamme Sun Fire, vous devez remplir certaines conditions. Ces tâches sont les suivantes : Installer une version identique du microprogramme (version 5.18.0 ou supérieure) ■...
Page 110
Les clés de licence d’utilisation COD du système d’origine se trouvent maintenant sur le deuxième système, mais elles demeurent associées au système d’origine. Ces clés de licence seront considérées comme non valides. Pour éviter d’obtenir des clés de licence d’utilisation COD erronées, exécutez la commande setdefaults sur le premier système (afin de définir les valeurs de configuration par défaut du système) avant de retirer une carte IB_SSC.
Page 111
4. Vérifiez que la clé de licence spécifiée a été ajoutée à la base de données de licences en exécutant la commande showcodlicense -r (voir « Pour vérifier les informations sur les licences COD », page 90). La clé de licence d’utilisation COD que vous avez ajoutée doit figurer dans la sortie showcodlicense.
Page 112
Pour vérifier les informations sur les licences ▼ ● Depuis la console du contrôleur système, procédez comme suit pour afficher les informations de licence COD : Pour afficher les données de licence dans un format interprété, saisissez : ■ lom> showcodlicense Exemple : lom>...
Page 113
Remarque – La clé de licence d’utilisation COD ci-dessus est donnée à titre d’exemple et n’est pas une clé de licence valable. Pour plus d’informations, reportez-vous à la description de la commande showcolicense dans le Manuel de référence des commandes des contrôleurs des systèmes d’entrée de milieu de gamme Sun Fire.
Page 114
Notez les informations suivantes concernant les invites affichées : Nombre de CPU à accès instantané (plafond). ■ Le texte entre parenthèses indique le nombre maximal de CPU à accès instantané (plafond) permis. La valeur entre crochets représente le nombre de CPU à accès instantané...
Page 115
Contrôle des ressources COD Cette section décrit les différentes façons d’effectuer le suivi de l’utilisation des ressources COD et d’obtenir des informations les concernant. Cartes CPU/mémoire COD Vous pouvez déterminer quelles cartes CPU/mémoire de votre système sont des cartes COD à l’aide de la commande showboards. ▼...
Page 116
Utilisation des ressources COD Pour obtenir des informations sur l’utilisation des ressources COD dans votre système, exécutez la commande showcodusage. ▼ Pour afficher l’utilisation de l’option COD ● Depuis la console du contrôleur système, tapez : lom> showcodusage -v Les renseignements fournis concernent également l’état des CPU. Exemple : lom>showcodusage -v Domain/Resource In Use...
Page 117
CPU dont l’option COD est désactivée Lorsque vous activez un domaine qui utilise des cartes CPU/mémoire COD, toutes les CPU COD qui n’ont pas obtenu de licence d’utilisation COD sont désactivées par le contrôleur système. Vous pouvez déterminer les CPU COD désactivées en vérifiant les éléments suivants : le journal de la console pour une opération de type poweron : ■...
Page 118
Sortie de la commande showcomponent – CPU dont l’option COD est désactivée (suite) EXEMPLE DE CODE 9-2 /N0/SB2/P0 Cod-dis untest UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB2/P1 Cod-dis untest UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB2/P2 Cod-dis untest UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB2/P3 Cod-dis untest UltraSPARC-IV, 1050MHz, 16M ECache /N0/SB2/P0/B0/L0 Cod-dis...
Page 119
C H A P I T R E Maintenance et dépannage Ce chapitre contient des informations destinées à aider l’administrateur système, à identifier les pannes et à y remédier. Il contient les sections suivantes : « Définition du mode PCI », page 97 ■...
Page 120
Pour définir une carte insérée dans un ▼ emplacement de carte PCI-X sur le mode PCI ● Exécutez la commande forcepci spécification_carte on. La commande utilisée dans cet exemple change le mode de fonctionnement par défaut de la carte insérée dans l’emplacement IB6/P0/B0 pour le mode PCI. Le changement de mode entre en vigueur après la mise sous tension progressive du bloc d’E/S.
Page 121
Mappage des périphériques L’adresse physique d’un périphérique est une caractéristique qui lui est propre. L’adresse du bus et le numéro d’emplacement d’un périphérique constituent des exemples d’adresses physiques. Le numéro d’emplacement indique la position du périphérique. Un périphérique physique est identifié par son identificateur de nœud (ID agent ou AID).
Page 122
Les CPU dotées des ID d’agent 8 à 11 se trouvent sur la carte SB2, et ainsi de suite. ■ Assignation des AID des CPU et de la mémoire TABLEAU 10-1 Carte CPU/mémoire AID sur chaque carte CPU/mémoire CPU 0 CPU 1 CPU 2 CPU 3...
Page 123
indique l’AID des deux contrôleurs d’E/S de chaque bloc d’E/S. TABLEAU 10-4 Assignation de l’AID des contrôleurs d’E/S TABLEAU 10-4 Numéro d’emplacement Nom du bloc d’E/S AID de contrôleur d’E/S pair AID du contrôleur impair 24 (18) 25 (19) La première valeur de la colonne est en notation décimale. Le nombre (ou la combinaison de chiffres et lettres) entre parenthèses est en notation hexadécimale.
Page 124
répertorie, en notation hexadécimale, le numéro d’emplacement, le TABLEAU 10-5 nom du bloc d’E/S, le chemin d’accès à chaque bloc d’E/S, le numéro du contrôleur d’E/S et le bus. Mappage de périphérique PCI du bloc IB_SSC TABLEAU 10-5 Nom du bloc d’E/S Chemin d’accès au périphérique N˚...
Page 125
Emplacements Désignation des emplacements physiques PCI IB_SSC pour IB6 sur les FIGURE 10-1 systèmes d’entrée de milieu de gamme Sun Fire où * dépend du type de carte PCI installée dans l’emplacement. Par exemple : Carte Ultra SCSI différentiel double (375-0006) dans l’emplacement 4 ■...
Page 126
Pannes système Par panne système, on entend toute condition préjudiciable au fonctionnement normal du système. Lorsqu’une panne système se produit, la DEL d’erreur ) s’allume. La illustre les indicateurs du système. FIGURE 10-2 Interrupteur marche/veille SYSTEM ALARM POWER SOURCE SERVICE REQUIRED Localisateur UNIX exécuté...
Page 127
États de l’indicateur de panne du système (suite) TABLEAU 10-6 DEL d’accès à la DEL d’erreur DEL d’erreur partie supérieure allumée en cas système allumée allumée en cas Nom de l’unité remplaçable de détection en cas de panne de panne de sur site (FRU) de panne de l’unité...
Page 128
Cartes CPU/mémoire (SB0/SB2/SB4) : peuvent être ajoutées à la liste des ■ composants désactivés si elles sont considérées comme défectueuses Cartes répéteur (RP0/RP2) : peuvent être ajoutées à la liste des composants ■ désactivés si elles sont considérées comme défectueuses Si une panne est détectée sur toute autre unité...
Page 129
Ajout manuel à la liste des composants désactivés (en attente de réparation) Le contrôleur système prend en charge l’établissement de listes de composants désactivés sur une carte (voir TABLEAU 10-7 Les éléments de cette liste ne sont ni testés ni configurés dans le système d’exploitation Solaris.
Page 130
Remarque – Les commandes enablecomponent et disablecomponent ont été remplacées par la commande setls. Ces commandes étaient auparavant utilisées pour gérer les ressources des composants. Alors que les commandes enablecomponent et disablecomponent restent disponibles, il est recommandé d’utiliser la commande setls pour contrôler la configuration des composants dans ou à...
Page 131
Une carte CPU/mémoire échouant le test d’interconnexion peut empêcher la commande poweron de mettre le système sous tension. Le système retourne alors à l’invite lom>. Par mesure de prudence, avant toute réparation, la carte CPU/mémoire défaillante peut être isolée du système, en saisissant la séquence de commandes suivante à l’invite lom>...
Page 132
Pour récupérer manuellement un système bloqué ▼ 1. Suivez la procédure décrite à la section « Assistance du personnel technique Sun pour identifier la cause d’une panne », page 115. 2. Accédez au shell LOM. Reportez-vous au Chapitre 3. Exécutez la commande reset pour redonner le contrôle du système à l’OpenBoot PROM.
Page 133
5. Si les mesures présentées ci-dessus ne permettent pas de redémarrer le système, mettez progressivement sous tension le système à l’aide des commandes poweroff et poweron. Pour mettre le système hors tension, tapez : lom>poweroff Pour mettre le système sous tension, tapez : lom>poweron Transfert de l’identité...
Page 134
Température La surchauffe de l’un des composants peut indiquer l’existence de problèmes. Pour afficher leur état actuel, exécutez la commande showenvironment. Vérification des conditions thermiques à l’aide de la commande showenvironment TABLEAU 10-8 lom>showenviroment Slot Device Sensor Value Units Status ---- --------- --------- ------ --------- ------- ------ SSC1 SBBC 0 Temp.
Page 135
Vérification des conditions thermiques à l’aide de la commande showenvironment (suite) TABLEAU 10-8 /N0/RP2 DX 0 Temp. 0 Degrees C 5 sec OK /N0/RP2 DX 1 Temp. 0 Degrees C 5 sec OK /N0/SB0 Board 0 1.5 VDC 0 1.51 Volts DC 5 sec OK /N0/SB0 Board 0 3.3 VDC 0...
Page 136
Vérification des conditions thermiques à l’aide de la commande showenvironment (suite) TABLEAU 10-8 /N0/IB6 Board 0 3.3 VDC 0 3.35 Volts DC 7 sec OK /N0/IB6 Board 0 5 VDC 0 4.95 Volts DC 7 sec OK /N0/IB6 Board 0 12 VDC 0 11.95 Volts DC 7 sec OK...
Page 137
Affichage des informations de diagnostic Pour savoir comment afficher les informations de diagnostic, reportez-vous au Guide de la plate-forme matérielle Sun, fourni avec votre version du système d’exploitation Solaris. Assistance du personnel technique Sun pour identifier la cause d’une panne Communiquez les informations suivantes au personnel technique Sun pour qu’il vous aide à...
Page 138
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 139
C H A P I T R E Procédures de mise à jour du microprogramme Ce chapitre explique comment mettre à jour le microprogramme du système. Le microprogramme des systèmes d’entrée de milieu de gamme Sun Fire peut être mis à jour de deux manières : en exécutant la commande flashupdate à...
Page 140
La syntaxe de la commande flashupdate est la suivante : flashupdate [-y|-n] -f url all|systemboards|scapp|rtos|carte . . . flashupdate [-y|-n] -c carte_source carte_cible . . . flashupdate [-y|-n] -u où : –y ne demande aucune confirmation. -n n’exécute pas cette commande si une confirmation est requise. -f spécifie une URL en tant que source des images flash.
Page 141
Il est nécessaire d’effectuer un cycle d’alimentation pour activer la mémoire OpenBoot PROM mise à jour. Remarque – La commande flashupdate ne permet pas de récupérer des images depuis une URL HTTP protégée (ID_utilisateur/mot_de_passe). Un message de la forme flashupdate: failed, URL does not contain required file: fichier est renvoyé, même si le fichier existe vraiment.
Page 142
2. Mettez toutes les cartes sous tension : lom>poweron all 3. Mettez à niveau le microprogramme de toutes les cartes système : lom>flashupdate -f url sb0 sb2 sb4 ib6 Après cette étape, la version du microprogramme des cartes sb0, sb2, sb4 et IB6 est identique à...
Page 143
Pour procéder à la mise à niveau inférieur du ▼ microprogramme d’un système Sun Fire V1280 ou Netra 1280 de la version 5.17.x à la version 5.13.x à l’aide de la commande flashupdate 1. Procédez à la mise à niveau inférieur du microprogramme sur le contrôleur système : lom>flashupdate -f url scapp rtos 2.
Page 144
Pour procéder à la mise à niveau inférieur du ▼ microprogramme d’un système Sun Fire E2900, Sun Fire V1280 ou Netra 1280 de la version 5.18.x ou 5.19.0 à la version 5.17.x à l’aide de la commande flashupdate 1. Mettez toutes les cartes sous tension : lom>poweron all 2.
Page 145
Utilisation de la commande lom –G Cette méthode implique le transfert de quatre types d’images portant des noms de la forme suivante : lw8pci.flash (contient l’autotest POST local de la carte d’E/S) ■ lw8cpu.flash (contient l’OBP et l’autotest POST local des cartes CPU/mémoire) ■...
Page 146
Exemples Téléchargement de l’image lw8pci.flash : Téléchargement de l’image lw8pci.flash : EXEMPLE DE CODE 11-1 # lom -G lw8pci.flash This program will replace LOM firmware with version 5.17.0 Are you sure you want to continue? Enter ‘C’ and return to Continue or anything else to Terminate Transferring 346 kB image to the system controller.
Page 147
Téléchargement de l’image lw8cpu.flash (suite) EXEMPLE DE CODE 11-2 Image and flash are different, proceeding with update. Erasing ....Done Programming ....Done Verifying ....Done Fri Dec 12 08:23:43 commando lom: /N0/SB0/FP0 updated with version 5.17.0 12/12/2003. Dec 12 11:23:42 commando-a lw8: /N0/SB0/FP0 updated with version 5.17.0 12/12/2003.
Page 148
Téléchargement de l’image lw8cpu.flash (suite) EXEMPLE DE CODE 11-2 Dec 12 11:26:30 commando-a lw8: /N0/SB4/FP0 updated with version 5.17.0 12/12/2003. Programming /N0/SB4/FP1 Comparing image and flash Image and flash are different, proceeding with update. Erasing ....Done Programming ....Done Verifying ....
Page 149
4. Arrêtez le système d’exploitation Solaris. 5. Mettez le système hors tension. 6. Mettez le système sous tension. Pour mettre à niveau inférieur le microprogramme ▼ d’un système Sun Fire E2900, Sun Fire V1280 ou Netra 1280 à l’aide de la commande lom –G La même procédure s’applique pour passer de la version 5.19.0 ou 5.18.x à...
Page 150
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 151
C H A P I T R E Remplacement des cartes CPU/mémoire et reconfiguration dynamique (DR) Ce chapitre explique comment reconfigurer les cartes CPU/mémoire des systèmes d’entrée de milieu de gamme Sun Fire de façon dynamique. Ce chapitre comprend les rubriques suivantes : «...
Page 152
Interface de ligne de commande La commande Solaris cfgadm(1M) assure l’interface de ligne de commande pour l’administration de la fonctionnalité du logiciel DR. Concepts DR Quiescence Au cours de la déconfiguration d’une carte système dotée de mémoire permanente (mémoire OpenBoot PROM ou noyau), le système d’exploitation fait une brève pause, appelée quiescence du système d’exploitation.
Page 153
Périphériques sûrs/pas sûrs en cas d’interruption Lorsque le logiciel DR suspend le système d’exploitation, il est nécessaire de suspendre tous les pilotes de périphériques reliés à ce système. S’il s’avère impossible d’interrompre un pilote (ou de le rétablir par la suite), l’opération DR échoue. Un périphérique sûr en cas d’interruption n’a pas accès à...
Page 154
Un point d’attache logique est un nom abrégé créé par le système pour désigner le ■ d’attache physique. Les points d’attache logiques se présentent comme suit : point N0.SBx Notez que la commande cfgadm indique également le bloc d’E/S N0.IB6. ■...
Page 155
Matériel enfichable à chaud Les périphériques enfichables à chaud sont dotés de connecteurs spéciaux qui alimentent la carte ou le module en courant électrique avant même que les broches de données n’entrent en contact. Les cartes et les périphériques qui ne sont pas munis de ces connecteurs ne peuvent pas être insérés ni retirés pendant que le système fonctionne.
Page 156
États des réceptacles de type carte TABLEAU 12-2 Description Aucune carte n’est présente. empty La carte est déconnectée du bus système. Une carte peut être disconnected déconnectée sans être mise hors tension. Cependant, une carte doit obligatoirement être déconnectée et mise hors tension pour que vous puissiez la retirer de son emplacement.
Page 157
États et conditions des composants Cette section contient la description des états et conditions pour les composants. États des réceptacles de type composant Un composant ne peut pas être connecté ni déconnecté individuellement. Par conséquent, les composants ne peuvent se trouver que dans un état : connected (connecté).
Page 158
Types de composants Le logiciel de reconfiguration dynamique (DR) est capable de configurer ou de déconfigurer plusieurs types de composants. Types de composants TABLEAU 12-7 Description CPU individuel Mémoire totale disponible sur la carte Mémoire Mémoire permanente et volatile Pour que vous puissiez supprimer une carte, l’environnement doit libérer la mémoire qu’elle contient.
Page 159
Reconfiguration de la mémoire permanente Lorsqu’une carte CPU/mémoire contenant de la mémoire impossible à réallouer (mémoire permanente) est reconfigurée dynamiquement à l’extérieur du système, il est nécessaire d’interrompre toutes les activités du domaine pendant un court moment, ce qui risque d’allonger les temps de réponse des applications. Cette condition s’applique normalement à...
Page 160
Commande cfgadm La commande cfgadm(1M) permet d’effectuer les opérations d’administration de configuration sur des ressources matérielles reconfigurables dynamiquement. dresse la liste des états de carte DR disponibles. TABLEAU 12-8 États des cartes DR d’après le contrôleur système (SC) TABLEAU 12-8 État Description L’emplacement n’est affecté...
Page 161
Pour afficher l’état détaillé des cartes ▼ ● Utilisez la commande cfgadm -av pour obtenir un rapport d’état plus détaillé. L’option -a liste les points d’attache tandis que l’option -v affiche les descriptions complètes (mode détaillé). L’ représente une partie de la sortie générée par la commande EXEMPLE DE CODE 12-2 cfgadm -av.
Page 162
détaille l’affichage de l’ FIGURE 12-1 EXEMPLE DE CODE 12-2 État de l’occupant Informations sur la ID du point Condition carte ou le composant État du réceptacle d’attache N0.IB6 connected configured powered-on, assigned Apr 3 18:04 PCI_I/O_Boa n /devices/ssm@0,0:N0.IB6 Pendant la connexion État occupé...
Page 163
Les options disponibles pour la commande cfgadm -x sont répertoriées dans le TABLEAU 12-10 Options de la commande cfgadm -x TABLEAU 12-10 Option de cfgadm -x Fonction Met une carte CPU/mémoire sous tension. poweron Met une carte CPU/mémoire hors tension. poweroff La page de manuel cfgadm_sbd fournit des informations supplémentaires sur les options cfgadm -c et cfgadm -x.
Page 164
Si vous ne précisez pas la variable niveau, le niveau de diagnostic init est appliqué. Les niveaux de diagnostic sont les suivants : Niveaux de diagnostic TABLEAU 12-11 Niveau Description Seul le code d’initialisation de la carte système est exécuté. Aucun test init n’est effectué.
Page 165
Pour installer une nouvelle carte ▼ Attention – Pour des informations complètes sur le retrait et le remplacement physiques de cartes CPU/mémoire, reportez-vous au Sun Fire E2900 System Service Manual ou Sun Fire V1280/Netra 1280 Service Manual. Le non respect des procédures détaillées peut être à...
Page 166
Pour remplacer à chaud une carte ▼ CPU/mémoire Attention – Pour de plus amples informations sur le retrait et le remplacement physiques des cartes, reportez-vous au Sun Fire E2900 System Service Manual ou Sun Fire V1280/Netra 1280 Service Manual. Le non respect des procédures détaillées peut être à...
Page 167
Pour retirer une carte CPU/mémoire du système ▼ Remarque – Avant de commencer cette procédure, munissez-vous d’un cache SBus pour remplacer la carte système à retirer. Un bloc de remplissage de carte système est une carte métallique dotée de fentes qui permettent la circulation de l’air. 1.
Page 168
Dépannage Cette section traite des types d’incidents courants : Échec de l’opération de déconfiguration ■ Échec d’une opération de configuration ■ Les exemples suivants illustrent des messages de diagnostic cfgadm. (Les messages d’erreur de syntaxe ne sont pas compris dans cette section.) cfgadm: hardware component is busy, try again cfgadm: operation: Data error: error_text cfgadm: operation: Hardware specific failure: error_text...
Page 169
Impossible de déconfigurer une carte dont la mémoire est entrelacée sur plusieurs cartes Si vous essayez de déconfigurer une carte système dont la mémoire est entrelacée sur plusieurs cartes système, le système affiche un message d’erreur tel que : cfgadm: Hardware specific failure: unconfigure N0.SB2::memory: Memory is interleaved across boards: /ssm@0,0/memory-controller@b,400000 Impossible de déconfigurer une CPU à...
Page 170
Impossible de reconfigurer la mémoire Si l’opération de déconfiguration échoue avec un message tel que le suivant, cela indique qu’il n’a pas été possible de déconfigurer la mémoire de la carte : cfgadm: Hardware specific failure: unconfigure N0.SB0: No available memory target: /ssm@0,0/memory-controller@3,400000 Ajoutez à...
Page 171
Impossible de déconfigurer une CPU La déconfiguration de la CPU fait partie du processus de déconfiguration d’une carte CPU/mémoire. Si, au cours d’une telle opération, la CPU n’est pas mise hors ligne, le message suivant est enregistré sur la console : WARNING: Processor nombre failed to offline.
Page 172
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 173
A N N E X E Description du mode application de l’horloge chien de garde Cette annexe fournit des informations sur le mode application de l’horloge chien de garde installé sur le serveur Netra 1280. Ce mode vous permet d’effectuer les opérations suivantes : Configuration de l’horloge chien de garde : les applications exécutées sur l’hôte ■...
Page 174
Description du mode application de l’horloge chien de garde Le mécanisme du chien de garde détecte les éventuels blocages du système ou d’une application, de même que les pannes d’application. Le chien de garde est une horloge constamment réinitialisée par une application utilisateur, tant que le système d’exploitation et l’application en question sont en cours d’exécution.
Page 175
Utilisation du pilote ntwdt Si vous souhaitez utiliser la nouvelle fonction de chien de garde pour applications, installez au préalable le pilote ntwdt. Pour activer et contrôler le mode application du chien de garde, programmez le système de chien de garde à l’aide des IOCTL LOMIOCDOGxxx, comme décrit à...
Page 176
Définition du délai d’expiration L’IOCTL LOMIOCDOGTIME définit le délai d’attente du chien de garde. Cet IOCTL programme le matériel du chien de garde en fonction du temps indiqué dans cet IOCTL. Vous devez définir le délai d’attente (LOMIOCDOGTIME) avant de tenter d’activer l’horloge chien de garde (LOMIOCDOGCTL).
Page 177
Remarque – Si LOMIOCDOGTIME n’a pas été exécuté de manière à configurer le délai d’attente avant le déclenchement de cet IOCTL, cela signifie que le chien de garde N’EST PAS activé au niveau du matériel. Réarmement ou réinitialisation du chien de garde L’IOCTL LOMIOCDOGPAT réarme (ou réinitialise) le chien de garde de sorte qu’il commence à...
Page 178
Recherche et définition des structures de données Toutes les structures de données et contrôles de entrées/sorties (IOCTL) sont définis dans lom_io.h, disponible dans le package SUNWlomh. Les structures de données de l’horloge chien de garde sont indiquées ci-après : 1. La structure des données du chien de garde pour la fonction de réinitialisation de l’état est définie ainsi : Structure des données du chien de garde : fonction de réinitialisation EXEMPLE DE CODE A-1...
Page 179
Utilisation de l’exemple de programme chien de garde L’exemple qui suit illustre un programme conçu pour l’horloge chien de garde. Exemple de programme chien de garde EXEMPLE DE CODE A-3 #include “sys/types.h” #include “lom_io.h” #include “fnctl.h” #include “unistd.h” #include “sys/stat.h” main() uint_t timeout = 30;...
Page 180
Programmation de l’alarme 3 L’alarme 3 est disponible pour les utilisateurs du système d’exploitation Solaris indépendemment du mode chien de garde. L’alarme 3 ou l’alarme système d’activation (ON) et de désactivation (OFF) ont été redéfinies (reportez-vous au tableau ci-dessous). Définissez la valeur de l’alarme 3 à l’aide de l’IOCTL LOMIOCALCTL. Vous pouvez programmer l’alarme 3 de la même façon que vous configurez et désactivez l’alarme 1 et l’alarme 2.
Page 181
La structure des données utilisée avec les IOCTL LOMIOCALCTL et LOMIOCALSTATE est la suivante : Structure des données des IOCTL LOMIOCALCTL LOMIOCALSTATE EXEMPLE DE CODE A-4 #include <lom_io.h> #define ALARM_NUM_1 1 #define ALARM_NUM_2 2 #define ALARM_NUM_3 3 #define ALARM_OFF 0 #define ALARM_ON 1 typedef struct { int alarm_no;...
Page 182
EINTR Ce message d’erreur s’affiche lorsqu’un thread en attente d’un changement d’état de composant est interrompu. ENXIO Ce message d’erreur s’affiche lorsque le pilote n’est pas installé sur le système. Fonctions non prises en charge et limitations 1. Dans le cas de l’expiration de l’horloge chien de garde détectée par le SC, la récupération de domaine est tentée une seule fois ;...
Page 183
Vous pouvez identifier les cartes système contenant de la mémoire (permanente) de noyau à l’aide de la commande suivante : sh> cfgadm -lav | grep -i permanent 4. Si le système d’exploitation Solaris se bloque dans les conditions suivantes, le microprogramme du contrôleur système ne peut pas détecter la condition du logiciel Solaris : Le mode application de l’horloge chien de garde est défini.
Page 184
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...
Page 185
Glossaire Amovibilité Le pilote de périphérique prend en charge DDI_DETACH et le périphérique (par exemple, une carte E/S ou une chaîne SCSI) est préparé au niveau physique de façon à pouvoir être détaché. ap-id Identificateur du point d’attache ; un ap-id définit de façon unique le type et l’emplacement du point d’attache du système.
Page 186
CPU à accès CPU COD sans licence sur des cartes CPU/mémoire COD installées sur les instantané systèmes d’entrée de milieu de gamme Sun Fire. Vous pouvez accéder à un maximum de quatre CPU COD destinés à un usage immédiat au cours du processus d’acquisition des licences d’utilisation COD.
Page 187
Quiescence Brève pause marquée par le système d’exploitation afin de permettre une opération de déconfiguration et de déconnexion sur une carte système équipée d’une mémoire noyau ou OpenBoot PROM (OBP) non paginable. Toutes les activités ayant cours sur le système d’exploitation et les périphériques au niveau du backplane doivent cesser pendant quelques secondes lors d’une phase critique de l’opération.
Page 188
Sûr en cas Un périphérique sûr en cas d’interruption n’accède pas à la mémoire et d’interruption n’interrompt pas le système pendant que le système d’exploitation est en mode quiescence. Un pilote est considéré comme sûr en cas d’interruption s’il prend en charge la quiescence du système d’exploitation (suspend/resume).
Page 189
Index Clé d’hôte, SSH, 79 COD (Capacity on Demand), 84 addcodlicense, commande, 88 Conditions préalables requises, 87 Alarmes CPU à accès instantané (plafond), 86 Définition, 52 Licence d’utilisation, 84 vérification de l’état, 46 Allocation, 85 Alimentation, 114 Certificat, 84 ALOM, horloge chien de garde Clés, 87, 90 Activation, 154 Obtention, 88...
Page 190
Date et heure, configuration, 19 Liste noire Composant, 107 DEL d’erreur, vérification de l’état à distance, 46 placement manuel, 107 deletecodlicense, commande, 89 Liste noire, placement manuel, 107 Dépannage, 97 Désactivation d’un composant, 107 Contrôle du système, 45 to 52 Détecteur de tension interne, 48 Définition des alarmes, 52 diag-level, variable OpenBoot, 56...
Page 191
Navigation, procédures, 29 SCPOST, contrôle, 60 Nœud, mappage, 99 Secure Shell (SSH), protocole Clé hôte, 79 Non permanente, Mémoire, 136 Serveur SSHv2, 77 Non sûr en cas d’interruption, périphérique, 131 Sécurité Considérations supplémentaires, 80 Utilisateurs et mots de passe, 75 OpenBoot PROM, variables, 55 setdate, commande, 19 OpenBoot, accès à...
Page 192
Guide d’administration des systèmes d’entrée de milieu de gamme Sun Fire • août 2005...