Synthèse du traitement des erreurs de matériel (suite)
TABLEAU E-1
Erreur
Description
Erreur DRAM
Avec CHIP-KILL
4 bits
activé dans la
configuration du
BIOS, la CPU
détecte et corrige
une erreur de
mémoire DRAM
4 bits dans
l'interface DIMM.
Erreur ECC
La CPU détecte
DRAM non
une erreur de
corrigible
DIMM multibit
non corrigible.
Configuration
Des modules
DIMM non
DIMM non pris
prise en charge
en charge sont
utilisés ou des
modules DIMM
pris en charge ne
sont pas chargés
correctement.
92
Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440 • Juin 2008
Traitement
La CPU corrige l'erreur dans le
matériel. Aucune interruption d'erreur
machine n'est générée par le matériel.
L'interrogation est déclenchée toutes
les demi-secondes par les interruptions
du minuteur SMI et est effectuée par le
gestionnaire SMI du BIOS.
Le gestionnaire SMI du BIOS
commence à consigner chaque erreur
détectée et arrête la consignation
lorsque la limite est atteinte pour une
même erreur. L'interrogation du BIOS
peut être désactivée via l'interface du
logiciel.
La méthode Sync Flood est utilisée
pour empêcher les données erronées
d'être propagées via les liaisons
Hypertransport. Le système est
réinitialisé, le BIOS récupère les
informations du registre d'erreurs
machine, met en correspondance ces
informations avec le module DIMM
(lorsque CHIPKILL est désactivé) ou à
la paire de DIMM (lorsque CHIPKILL
est activé) et les consigne dans le
processeur de service.
Le BIOS arrête la CPU.
Le BIOS affiche un message d'erreur,
consigne une erreur et arrête le
système.
Consignée (journal
DMI ou journal
SEL du processeur
de service)
Fatale ?
Journal SEL du
Fonctionnement
processeur de
normal
service
Journal SEL du
Fatale
processeur de
service
Journal DMI
Fatale
Journal SEL du
processeur de
service