Fonctions Ras Au Niveau Des Lames - Bull Escala Blade BL460 Guide D'installation Et D'utilisation

Table des Matières

Publicité

1.5.2

Fonctions RAS au niveau des lames

Le serveur lame comprend les fonctions de RAS suivantes :
8
Escala BL460 - Guide d'installation et d'utilisation
Isolement des pannes de barrettes DIMM.
Identification des paires de barrettes DIMM par la définition de points de contrôle
d'erreur irrécupérable et d'actions de reprise liées à des messages.
Identification de barrette DIMM unique via l'utilisation de point de contrôle des
erreurs irrémédiables et le blocage des mémoires inutilisables.
Désallocation dynamique (protection du microprocesseur et de la mémoire contre les
zones inutilisables via POWER6 lors de l'exécution).
Suppression de lignes en mémoire cache de niveau 2.
Procédure chipkill - Mémoire Chipkill pour les barrettes DIMM.
Alertes PFA (Memory Predictive Failure Analysis) via l'épuration et la vérification et la
correction d'erreurs (ECC).
Surveillance et correction dynamique de la mémoire.
Parité du bus PCI, ECRC et gestion des erreurs de type Surprise Link Down.
Seuil d'anticipation des pannes disque liées à des erreurs matérielles remédiables sur
les microprocesseurs et la mémoire cache de niveau 2.
Diagnostics d'exécution du processeur (PRD) qui lancent les actions suivantes pour
effectuer une reprise après erreur :
Correction automatique, comme le réacheminement de bits redondants pour la
mémoire.
Désallocation d'une ressource défaillante (coeur de processeur ou page de
mémoire) au moment de l'exécution.
Identification des pièces pour la maintenance.
Désallocation permanente des erreurs d'exécution, si nécessaire, pour I-Cash, D-
cash, mémoire cache de niveau et 3.
Correction transparente des erreurs matérielles liées au microprocesseur (par
exemple, erreurs de la mémoire cache de niveau 2).
Arrêts de contrôle du microprocesseur (avec arrêt de contrôle sur les partitions).
Réinitialisation automatique du processeur de maintenance et reprise avec
rechargement en cas d'erreurs du processeur de maintenance.
Reprise automatique du serveur et redémarrage avec réamorçage automatique en cas
de blocage de l'amorçage ou d'arrêts de contrôle.
Redémarrage automatique du serveur (ASR).
Surveillance intégrée de la température, de la tension, des unités de disque dur et des
unités flash.
Appel du service d'assistance - client eCare.
Analyse des arrêts de contrôle.
Détection des arrêts de contrôle avec redémarrage automatique.

Publicité

Table des Matières
loading

Table des Matières