Les systèmes de fichiers distribués
Le calcul scientifique nécessite assez souvent d'avoir accès à des fichiers de
données importants. Dès lors, le temps moyen d'accès au fichier va beaucoup
influencer la vitesse d'exécution du programme. L'idéal serait d'avoir un
programme s'exécutant sur une machine unique doté d'un disque dur à haute
performance. Cependant le principe même des clusters est de répartir les calculs
sur l'ensemble des nœuds d'un réseau. L'accès à des systèmes de fichiers
distants devient incontournable. C'est à ce niveau qu'interviennent les systèmes
de répartition de fichiers distribué.
NFS - Network File System
Système fonctionnant sur le mode client/serveur autorisant les accès à un
répertoire à plusieurs clients distribués sur un réseau. Il permet donc le partage
des données entre les nœuds du cluster. Les limites sont celles du serveur en ce
qui concerne la taille du répertoire et des fichiers, et du réseau pour les vitesses
d'accès.
Les systèmes de fichiers parallèles
PVFS - Parallel Virtual File System
PVFS offre un système de fichiers réparti au dessus d'un système de fichiers
standard tel que ext2 ou ReiserFS. Le principe de PVFS est assez simple à
appréhender: au lieu de stocker un fichier sur un seul disque, forçant les
machines distantes à faire des requêtes séquentielles sur le réseau, on stocke
plutôt le fichier sur plusieurs disques du réseau.
Sur Linux, « The Parallel Virtual File System » est une implémentation du
standard PFS (Parallel File System).
Il fournit une haute performance et un système de fichiers parallèle pour des
machines en cluster avec:
un domaine des noms uniques
un accès transparent
Description de l'environnement logiciel Linux HPC
2-11