Fin de route pour Roadrunner
By   |  September 14, 2013

Roadrunner nous avait fait rêver. Il est désormais hors service. Première machine à passer, dès 2008, la barre du Pétaflops (10^15), le voilà maintenant hors circuit, depuis le 31 mars dernier, prêt à livrer ses derniers secrets à travers ce qui s’apparente déjà à une autopsie technique complète.

Installé au laboratoire de Los Alamos, Roadrunner faisait partie du programme Advanced Simulation and Computing (ASC) de la National Nuclear Security Administration (NNSA) américaine. Pendant ses cinq années de service actif, il a été en charge des plus grosses simulations du programme Stockpile Stewardship (maintenance et test de fiabilité des armements nucléaires Outre-Atlantique), une mission qui a évité à la planète bien des essais réels. Véritable montre de puissance à l’époque, il a par ailleurs contribué à une certain nombre de projets scientifiques non classés Défense pendant sa phase de construction et de testing. 

Chris Deeney, Administrateur adjoint de la NNSA pour le programme en question, témoigne de ce que “Roadrunner était un exemple : une équipe de haut niveau intégrant des codes complexes dans des architectures de pointe afin d’assurer une force de dissuasion sécurisée et efficace sans recourir aux essais souterrains. Roadrunner et ses succès nous ont mis permis d’avancer de façon décisive dans le domaine du HPC. Il a été un formidable vecteur de modernisation technologique pour notre armée et, plus globalement, pour nos recherches scientifiques.

Si la conception de Roadrunner était unique, elle a aussi été controversée. La machine intégrait en effet deux types de processeurs, ce qui a longtemps fait d’elle le plus gros calculateur hybride au monde. On y dénombrait 6 563 CPU génériques (des AMD Opteron dual-core), chaque cœur étant par ailleurs relié à un GPU IBM PowerXCell 8i (qu’on a vite appelé tout simplement “Cell”). La presse s’est largement fait l’écho de ce choix technologique surprenant, le Cell étant une version améliorée (8 VPU, 100 Gflops par puce) d’un GPU conçu à l’origine pour la Playstation 3, de Sony. Cette spécificité, ajoutée à la roadmap pour le moins incertaine de PowerXCell, faisait douter beaucoup de spécialistes de sa pertinence technique. Mais peu importe. Pour le laboratoire de Los Alamos et pour IBM, Roadrunner était à la fois une vitrine et un porte-drapeau.

 

La vocation de Roadrunner était donc le calcul intensif dédié à la simulation. Il a ainsi permis de répondre à un certain nombre de questions relatives à la gestion du flux énergétique des armes atomiques et à la relation entre ce flux et le rendement desdites armes. Les progrès issus de son utilisation ont été décisifs dans ce domaine. Tout comme le furent, pendant sa période d’installation, les expériences qui lui ont été confiées sur le comportement des nanofils, la reconnexion magnétique, la rétrodiffusion laser, la phylogénétique du VIH – sans oublier une simulation de l’univers à une échelle de 70 milliards de particules. Des voix se sont élevées pour critiquer les coûts de portage applicatifs mais, là encore, les acquis technique en matière de stratégie de développement sont bel et bien là.

Roadrunner était vraiment une idée innovante” explique Gary Grider, du département HPC du laboratoire. “Il a transformé définitivement notre façon de penser, de construire et d’utiliser les calculateurs. Grâce à lui, l’intégration de processeurs spécialisés et d’accélérateurs dans les systèmes est maintenant monnaie courante, et leur utilisation fait partie du quotidien des chercheurs. En ce sens, Roadrunner était en quelque sorte une démonstration de faisabilité technologique. Mêmes les plus sceptiques a priori ont été obligés d’y prêter attention.

 

C’est en effet de son architecture hybride que provenait sa puissance, encore classée 22ème au TOP500 de novembre dernier après avoir été n° 1 deux ans durant. Les deux processeurs se partageaient le traitement des codes mais ce sont feu les Cell qui prenaient la main dès que les choses devenaient sérieuses, comme le font aujourd’hui les accélérateurs Tesla ou Xeon Phi. Cet équilibre CPU / GPU a également montré la voie en matière d’efficacité énergétique, Roadrunner délivrant son potentiel avec “seulement” 2,3 MW de consommation moyenne relevée. Dans ce domaine également, il y a eu un avant et un après Roadrunner.

Malgré ces états de service remarquables, c’est sans cérémonie qu’il a été débranché, comme un projet – ce qu’il était d’un point de vue politique – arrivé à terme. Avant qu’il ne soit complètement démonté, les spécialistes IT de Los Alamos ont eu un mois pour réaliser un certain nombre d’expériences, notamment de compression mémoire sur les OS et d’optimisation de routage des données. Autant de recherches techniques qui n’auraient pu être menées “de son vivant”.

Ensuite, Roadrunner a été examiné sous ses coutures les plus intimes, comme l’intégrité de ses composants (mémoire notamment), l’efficacité de son système de refroidissement après cinq ans ou encore le degré d’usage de son armature mécanique… Ces analyses sur l’état d’usage d’un système à haut rendement (informatique et thermique) n’ont officiellement pas filtré, mais il apparaît qu’une durée de vie de cinq ans sans gros incident est déjà un beau parcours. Roadrunner aurait-il pu tenir deux années de plus ? Probablement pas sans une maintenance lourde, semble-t-il.

Reste donc un espace vide de près de 600 m², soit environ 15 % de plus que la place au sol occupée par Titan. La nature en général et les laboratoires de calcul intensif en particulier ayant horreur du vide, il se pourrait que les lieux soient prochainement investis par une machine “commissionnée” pour dépasser les 100 Pflops. De quoi réjouir les exascale optimists, qui y voient un point d’inflexion temporel dans la course au prochain passage à l’échelle. En tous cas, s’il ne fallait qu’une mesure des progrès accomplis ces dernières années par la communauté HPC…

© HPC Today 2019 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index