Efficacité énergétique : où l’on rouvre la chasse au gaspi
By   |  October 14, 2013

D’un côté, les fondeurs améliorent les composants. De l’autre, les chercheurs travaillent à mieux en exploiter les ressources. Parmi les pistes envisagées, le DVFS (Dynamic Frequency and Voltage Scaling) est une des plus prometteuses. En résumé, le processeur offre différents modes de fonctionnement, notamment des modes dits “Performance” et des modes de sommeil.

Le principe, en soi n’est pas nouveau. Ce qui l’est, c’est son adaptation aux architecture multi- et manycores. En fonction de la charge de calcul, on réveille ou on endort les cœurs qui ne sont pas strictement nécessaires. Prenons un exemple concret avec l’Active Energy Manager (AEM) d’IBM, disponible notamment sur les serveurs Blade et les System Z, X et Power. AEM est capable de faire varier la fréquence des cœurs entre 70 et 45 % de la fréquence nominale en mode normal, et de l’abaisser à 0 % en mode sommeil. Le mode “Dynamic Power Saver” (DPS) autorise quant à lui une montée en fréquence de 45 à 100 % en mode Performance, sachant qu’un mode Turbo permet même un overclocking temporaire en fonction des besoins.

Voilà pour le silicium. Mais toute l’efficacité de telles fonctions réside dans la façon dont le calculateur va exploiter cette “boite de vitesse”. Pour cela, IBM suggère l’analyse des statistiques d’utilisation des machines afin de moduler la puissance des processeurs selon l’horaire et le jour de la semaine. Une modulation sans doute pertinente pour des serveurs IT classiques, mais qui l’est moins pour des grappes de calcul intensif.

Les architectures les plus récentes (ici le tout nouveau Power8 d’IBM) mettent en oeuvre des mécanismes de type DVFS et DCT qui adaptent la fréquences des processeurs à la charge de travail courante. C’est un premier pas, mais reste à en implémenter le principe au niveau cluster…

Benoit Pradelle, rattaché au laboratoire PRISM (UVSQ) et grand spécialiste du DVFS, travaille sur une alternative séduisante qui n’implique pas de modification du code applicatif. “Notre approche est très pragmatique” confie-t-il. “On utilise les sondes d’énergie posées sur les cœurs. On change la fréquence à la hausse ou à la baisse et on observe comment réagit l’application sur une période très courte“. Par exemple, lorsque l’application est en phase d’accès mémoires intensifs, la fréquence CPU peut baisser sans inconvénient. A l’inverse, pendant l’exécution d’un code de calcul très optimisé, la solution laisse tourner le processeur à pleine vitesse. Avec ces recettes simples à concevoir (beaucoup moins à implémenter), FoREST, le prototype mis au point par l’équipe Pradelle, est parvenu à atteindre jusqu’à 15 % de consommation en moins en contexte d’exécution typique sur un nœud de calcul. L’heure est aujourd’hui à l’application de cette approche en environnement multinœuds. “Notre algorithme pourrait facilement être intégré au processeur lui-même” précise Benoit Pradelle. “En revanche, pour un cluster, c’est au niveau système que les choses doivent être implémentées.

En complément à DVFS, l’algorithme Dynamic Concurrency Throttling (DCT) cherche à évaluer le nombre de threads optimal pour une application donnée. Si l’application mobilise beaucoup de nœuds de calcul mais s’avère peu véloce du fait de goulets d’étranglement mémoire ou stockage, DCT va réduire le nombre de threads. Les nœuds de calcul sous-utilisés peuvent ainsi être éteints  (partiellement ou totalement) de sorte que l’application ne consomme que les ressources qui lui sont réellement nécessaires. DCT n’est pas nouveau non plus – sa première présentation date de 2008 – mais sa combinaison avec DVFS, l’optimisation logicielle des boucles de calcul et l’amélioration de l’instrumentation disponible in silico constitue sans doute un facteur d’efficacité énergétique incontournable pour le passage à l’échelle.

[Cet article fait partie du dossier Efficacité énergétique : Le St Graal du calcul intensif]

© HPC Today 2024 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index