HPCC

Produits et services cluster de calcul chez Linbox FAS

1. Introduction

L’installation d’un cluster de calcul est un projet complexe. Pour que ce projet soit un succès, il faut aussi bien gérer les aspects matériels, que logiciels et service. Dans les aspects matériels nous incluons le fait d’avoir un cluster puissant et évolutif avec une maintenance matérielle efficace. La bonne gestion du logiciel permet d’avoir une bonne distribution, de bons logiciels, correctement configurés et intégrés. Enfin le service signifie que le projet est mené avec une démarche professionnelle, qu’une bonne intégration dans le réseau est faite, qu’une bonne formation est dispensée aux administrateurs comme aux utilisateurs et qu’une fois le cluster installé un support et une maintenance de qualité sont disponibles pour le client.

Linbox FAS, grâce à son partenariat avec DELL, à ses produits (LRS, LDS, …) et à la traditionnelle qualité de son service sous linux (support de logiciels libres pour le Technocentre de Guyancourt de Renault depuis 7 ans, travail avec des centres de recherche, des ministères, …) réunit l’ensemble des qualités nécessaires pour réussir ces projets. C’est pour cette raison que nous avons créé une cellule dédiée.

Cette cellule assure la gestion de projet, l’installation, le support et la formation autour des clusters de calcul sur base DELL.
Nous allons détailler dans la suite de ce document les différents aspects de cette offre.

2. Matériel

Linbox FAS est le partenaire officiel de Dell Professionnal Services pour les clusters de calcul en France. Ce partenariat nous permet de faire des offres globales englobant le matériel, le logiciel et le service, en permettant à l’acquéreur d’avoir un interlocuteur unique (ou Dell ou Linbox FAS), un coût extrèmement compétitif, et les garantie de qualité et de pérennité du numéro 1 mondial.

Les projets que nous avons mené jusqu’ici, nous ont permis de renforcer la confiance mutuelle que nous avons.

3. Logiciel

Nous avons choisi d’avoir un noeud maître serveur fournissant le système à tous les noeuds esclaves qui font un boot diskless. Les noeuds esclaves disposent d’un disque dur pour le swap et pour le stockage des données. Ceci permet d’avoir les caractéristiques suivantes :

  • Déploiement immédiat des noeuds,
  • Déploiement applicatif centralisé et unique pour les noeuds de calcul,
  • Grande facilité de maintenance des noeuds de calcul.

3.1. La Linbox HPCC Management Suite

Fort de cette expérience, Linbox a développé la Linbox HPCC Management Suite. LHMS se présente comme un ensemble intégré de logiciels dédié à l’optimisation des performances des clusters de calcul.  LHMS s’appuie sur plusieurs composants principaux qui ont pour objectif d’apporter une réponse éprouvée et standardisée, quel que soit le besoin :

  • le LRS (Linbox Rescue Server),
  • le LDS (Linbox Directory Server) (+ d’informations ici),
  • Torque ou un autre ordonnanceur de tâches,
  • LAM/MPI,
  • Ganglia pour la surveillance des noeuds,
  • un ensemble de compilateurs optimisés ou issus du Portland Group ou d’Intel,
  • une distibution Linux.

3.2. Le LRS

L’ensemble des informations concernant le LRS se trouve sur la zone du site dédié. Cependant, un module supplémentaire a été ajouté : le module IPMI. Ce module permet de gérer le démarrage, l’arrêt électrique et le reset physique des noeuds de calcul, depuis l’interface intégrée du LRS.
Les modules fournis dans le LRS sont les suivants :

  • contrôle du boot des noeuds (permet de choisir entre plusieurs boot diskless, ou un boot sur disque dur),
  • inventaire logiciel et matériel,
  • module de contrôle centralisé permettant l’exécution et le contrôle de programme sur plusieurs noeuds avec une interface web,
  • module IPMI.

3.3. Le LDS (Linbox Directory Server)

La gestion des utilisateurs est une fonction centrale dans un réseau et dans un cluster de calcul. Les différents noeuds doivent être capables de s’authentifier en un point unique. C’est la fonction offerte par un serveur d’annuaire tel le serveur open source OpenLDAP. Il n’existe malheureusement pas d’interface graphique ergonomique permettant la gestion du contenu d’un serveur LDAP. Les interfaces existantes pré-supposent une connaissance détaillée de la structure, du fonctionnement interne, et des connexions avec les différents services.
Linbox a décidé de prendre ces différents problèmes à bras le corps et de créer un outil permettant :

  • la gestion graphique simple des utilisateurs et des groupes,
  • la gestion fine des droits pour chaque module et chaque utilisateur (qui peut éditer quel champ, page par page, module par module),
  • une gestion des synchronisations avec des annuaires (en particulier avec Active Directory) ou des bases de données,
  • une gestion des actions systèmes (création de répertoires, ajout dans une base de données, …).

Les fonctions de ce système sont :

  • interface graphique web agréable et ergonomique. Afin de ne pas tomber dans les travers habituels des informaticiens concernant les interfaces web, la conception graphique des différentes pages a été confiée à un graphiste avant l’écriture de quelque ligne de code que ce soit.
  • fonction complète d’un PDC NT4 windows pour la gestion des utilisateurs et des ordinateurs d’un domaine,
  • module de gestion de samba (gestion des utilisateurs, des groupes et des partages),
  • synchronisation des utilisateurs et des mots de passe avec un serveur Active Directory.

D’autres modules existent mais qui ne sont pas installés sur un cluster de calcul (gestion des impressions, gestion d’un proxy web, gestion des utilisateurs pour OpenXchange, …). L’architecture modulaire permettant l’ajout simple et rapide de nouveaux modules.
Le LDS est la première interface graphique pour LDAP utilisant de manière massive l’ajax afin d’améliorer son ergonomie.

3.4. Ordonnanceur de tâches

Les clusters de calcul sont toujours accompagnés d’un ordonnanceur d’exécutions. Ce logiciel permet de contrôler le lancement de suite de calculs de manière centralisée, il est utile d’avoir un tel outil pour bien gérer les priorités d’exécution entre les tâches. Nous proposons pour ce travail le logiciel PBS Pro d’Altair ou Torque/MAUI (libre).

Nous fournissons une version packagée de Torque/Maui fonctionnelle et efficace. Cette version est accompagnée d’une documentation utilisateur en français ainsi que d’une documentation administrateur. Nous assurons support et formation sur ces outils.