Enseignement du calcul intensif : la France à la hauteur ?
By   |  February 12, 2014

Des formations courtes pour les industriels

Outre les filières académiques, il existe un certain nombre de formations courtes qui permettent aux chercheurs et aux utilisateurs en entreprises de remettre à niveau leurs connaissances en matière de calcul intensif. Cela va de la formation à la programmation CUDA chez Incube (Alyotech France) aux cours de Fortran, de calcul parallèle ou encore d’initiation à TORQUE, MAUI ou SLURM dispensés par CNRS Formation. Signalons que certains grands centres de calculs français sont également positionnés sur ces formations (Optimisation de codes à HPC@LR avec le CINES, Introduction à MPI et OpenMP au CALMIP…), et que la tendance pourrait très rapidement se renforcer.

Pour François-Xavier Roux, maître de recherche à l’ONERA et animateur de la formation Méthodes numériques modernes pour le calcul intensif parallèle au Collège de Polytechnique, “le public de ce type de cours est constitué d’ingénieurs de recherche, plutôt issus de grandes institutions ou de gros industriels tels qu’Areva, CEA ou EDF. Ce sont des gens qui font partie des équipes de développement de grands logiciels de simulation numérique orientés métier, généralement côté physique et mathématique“. Ils viennent se perfectionner et chercher des idées sur des méthodologies innovantes qu’ils ne maîtrisent pas encore et ne sont pas forcément très pointus sur le calcul intensif proprement dit. La formation dure trois jours, elle aborde les thématiques de la simulation multidomaine, le multiéchelle, le multiphysique…

“Les auteurs de codes de simulation viennent souvent de l’applicatif et ils ont appris les méthodes numériques appliquées à leur domaine”, explique François-Xavier Roux. “Nous, nous nous plaçons plutôt dans la partie solveur, d’autant que les personnes qui mettent au point un modèle de simulation se soucient rarement de la question de la performance. Quand ils confrontent leur modèle à la réalité du terrain, c’est généralement à des problèmes de performance qu’ils se heurtent.” Comme on le sait, derrière les problèmes de performances, se cachent souvent des problèmes de solveur. “Or, sur les solveurs, les gens connaissent principalement les grandes méthodes classiques… qui ne sont pas parallèles pour deux sous ! Ils ont tous entendus parler de méthodes itératives par gradients conjugués ou de méthodes directes par factorisation de matrices – ils les utilisent d’ailleurs en boîte noire – mais ça s’arrête là.” Sans équivalent à notre connaissance, cette formation de haut niveau accueille une quinzaine de participants chaque année. Et bien qu’elle se destine essentiellement aux industriels les plus avancés dans le développement de codes de simulation, de plus en plus d’éditeurs de logiciels viennent y piocher des idées…

Le calcul parallèle a fait son entrée dans les écoles d’informatique (ici l’EPITA). Le calcul en multicœur et sur GPU est privilégié, faute de moyens disponibles pour le déploiement de clusters MPI dédiés à l’enseignement.

Le manque de moyens de calcul reste criant

Le calcul intensif a certes besoin de cerveaux, mais il a également besoin de ressources matérielles. Or, malgré les budgets débloqués dans le cadre des Investissements d’Avenir, la demande en puissance s’accroît plus vite que la puissance installée disponible. “Le nombre d’heures de calcul explose et on n’arrive plus à fournir” déplore Olivier Pironneau. “Les calculateurs français sont aujourd’hui complètement saturés ; la demande atteint grosso-modo le triple de ce que l’on peut délivrer.” Qui plus est, certains nouveaux arrivants ont des besoins monstrueux, notamment en physique théorique. S’ajoute à cela une demande croissante en lien avec le Big Data – un domaine où les formations n’existent pratiquement pas. Les premiers Masters vont apparaitre cette année, notamment à Paris-VI mais, comme le dit Olivier Pironneau, “on a un peu de mal à suivre…

Le manque de ressources de calcul est tout aussi criant dans les écoles d’ingénieurs. Reda Dehak, enseignant à l’Epita et membre du LRDE (le laboratoire de recherche de l’école) regrette l’absence d’un cluster MPI dans sa filière : “Nous n’enseignons pas la programmation sur architecture MPI car nous n’avons pas l’équipement qui permettrait aux étudiants de pratiquer.” Le laboratoire dispose bien d’un cluster de calcul pour ses propres recherches mais les élèves n’y ont pour l’instant pas accès. L’équipe pédagogique privilégie donc les enseignements sur le multicœur et sur les GPU. “Quand j’ai pris la tête de cette majeure, voici presque 4 ans, j’ai considéré, en raison de l’évolution technologique (arrivée des GPU, nécessité de disperser les calculs, algorithmes d’apprentissage dont les traitements sont très répétitifs…) qu’il fallait accorder une large place à l’enseignement de la programmation parallèle“, explique Reda Dehak.

Sauf que les contraintes budgétaires se sont vite révélées insurmontables. “J’ai évidemment un budget matériel pour la filière“, poursuit Reda Dehak, “mais je suis obligé de faire des compromis. Par exemple, si j’achète des accélérateurs GPU, je ne pourrai acheter que quatre machines ! Sans compter que la durée de vie des GPU n’est pas très élevée et qu’il faut prévoir de les renouveler régulièrement.” Voilà pourquoi, de son point de vue, il est plus efficace de se concentrer d’abord sur la programmation multicœur avant d’envisager, à terme, le calcul distribué MPI.

Navigation

<1234567>

© HPC Today 2024 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index