2.2.6
Les outils d'administration cluster
Les outils de contrôle et de monitoring
De façon générale, ce genre d'outil a pour but de surveiller l'activité du cluster et
son bon fonctionnement. Ils n'augmentent pas directement les possibilités des
machines mais en facilitent la gestion. Voici ce que peut indiquer un outil de
monitoring ou de contrôle :
Ces outils vont être utilisés par 2 types de personnes :
L'administrateur système dont le but est de :
-
-
L'utilisateur :
-
-
Ganglia :
Top :
2-18
Est-ce qu'un nœud du cluster ne fonctionne pas ?
Encombrement du réseau
Utilisation du cluster
...
Maintenir le cluster en état de fonctionnement
Diagnostiquer et, si possible, résoudre des comportements anormaux
Contrôler l'impact de l'exécution d'un programme dans un but
d'optimisation
Regarder si une application tourne bien, que tous les processus ont bien
été lancés
Ganglia est un outil de monitoring pour les clusters. Il dispose d'une
interface graphique au format Web, permettant de visualiser sous forme
graphique différents renseignements sur l'utilisation du cluster.
C'est également un outil de contrôle puisqu'il indique lorsqu'un nœud ne
fonctionne plus.
Cette commande Unix permet de connaître différentes informations en
temps réel sur l'exécution des processus et sur l'utilisation d'un nœud.
•
Voici un aperçu de ce que peut fournir la commande top :
•
Liste des processus lancés
•
Indique par ordre décroissant le temps machine des processus,
les plus gourmands en premier
•
Permet de déterminer les processus ayant besoin de beaucoup
de ressources
•
Permet d'observer la vie du système
•
Indique la mémoire utilisée, le pourcentage de swap utilisé ....
•
...
Guide d'installation des logiciels HPC