5. La surchauffe concerne-t-elle un seul GPU, les autres GPU et les processeurs étant à leur température
normale de fonctionnement ?
Si
Action
Remplacez le matériau d'interface thermique entre la plaque froide et le GPU en surchauffe.
Oui :
Allez à la section Retrait de l'unité GPU dans un système 8335-GTB à refroidissement par
eau et suivez les étapes de séparation de la plaque froide du GPU. Allez ensuite à la section
Remise en place de l'unité GPU dans un système 8335-GTB à refroidissement par eau et
suivez les étapes d'installation d'un matériau d'interface thermique neuf. Si le problème
n'est pas résolu, remplacez le GPU. Pour les instructions, voir Retrait et remise en place
d'un processeur graphique dans le système 8335-GTB. La procédure est terminée.
Non :
Passez à l'étape suivante.
6. Remplacez les plaques froides. Pour la procédure à suivre, voir Retrait et remise en place des plaques
froides dans le 8335-GTB. Le problème se manifeste-t-il encore ?
Si
Action
Oui :
Passez à la section «Contacter le service de maintenance et de support IBM», à la page 119.
La procédure est terminée.
Non :
La procédure est terminée.
Identification d'une procédure de maintenance
Utilisez les procédures ci-après pour identifier la procédure de maintenance qui est nécessaire.
Identification d'une procédure de maintenance à l'aide des journaux
des événements du système
Utilisez l'interface IPMI (Intelligent Platform Management Interface) pour examiner les journaux des
événements du système et identifier une procédure de maintenance.
1. Utilisez la commande ipmitool pour examiner les journaux des événements du système.
v Pour afficher la liste des journaux des événements du système au sein d'un réseau interne, utilisez
la commande suivante :
ipmitool sel elist
v Pour afficher la liste des journaux des événements du système sur le réseau local, utilisez la
commande suivante :
ipmitool -I lanplus -U <nom_util> -P <mot_passe> -H <adresse_IP_BMC ou nom_hôte_BMC> sel elist
2. Recherchez dans ces journaux un événement avec la valeur OEM record de. Avez-vous trouvé un
événement avec la valeur OEM record de ?
Si
Action
Oui :
Passez à l'étape suivante.
Non
Passez à l'étape 4, à la page 34.
3. Les informations de journal spécifiques à OEM record de specific sont indiquées par les chiffres les
plus à droite du journal des événements du système avec la valeur OEM record de. Utilisez le
tableau 17, à la page 33 pour déterminer la procédure de maintenance à effectuer.
32
Systèmes 8335-GCA, 8335-GTA, 8335-GTB et 8348-21C - Analyse des problèmes, composants système et emplacements