Toutefois, si le problème persiste, procédez comme suit.
a. Consultez le journal des événements XCC Web pour identifier l'unité défectueuse et le type de
problème (voir
« Spécifications du détecteur de GPU XCC » à la page
b. Collectez les données de maintenance XCC (voir
352).
c. Exécutez xpu-smi pour obtenir un diagnostic (voir
xpu-manager.html
d. Contactez le service de maintenance Lenovo.
Spécifications du détecteur de GPU XCC
Lorsque vous voyez un événement dans le journal des événements XCC Web, reportez-vous au tableau
suivant pour identifier l'unité défectueuse et le type de problème. Par exemple :
6 | 01/08/2021 | 14:34:53 | 0x0020 | Add-in Card GPU Board | Trasition to Critical from less severe | Asserted |0xA2F60F
Tableau 26. Spécifications du détecteur de GPU XCC
Nom du détecteur
Numéro de détecteur
Type de détecteur
Type de mesure du détecteur
ID d'entité
Instance/type
Assertions consignées par le
journal SEL
Annulations consignées par le
Processeurs
journal SEL
de GPU
Annulations de seuils
Requête de voyant allumé en
cas d'assertion
F = Voyant de défaillance
Requête de voyant éteint en
cas d'annulation
F = Voyant de défaillance
328
Plateau ThinkSystem SD650-I V3 Neptune DWC Guide d'utilisation
pour plus de détails)
EAh
17h
07h
0Bh
02h
02h
02h
N/A
02h - F
02h - F
328).
« Collecte des données de maintenance » à la page
https://www.intel.com/content/www/us/en/software/
Données
02h - Passage d'un état moins grave à l'état critique
Evt Data2 :
B#h : Alerte thermique
BBh : État de présence et d'alimentation
21h : État de la liaison PCIe
E0h : Décompte GPU à partir du SMBIOS
3Ah : Détecteur d'intégrité de carte
Evt Data3 :
XXh : Index CORE GPU, 01h : cœur 1
0Ch : cœur 3 + cœur 4
ED2 : B#h
ED3 : ID VR