FirePro, le challenger
By   |  March 01, 2013

Si les lancements de Kepler et de Xeon Phi font beaucoup de bruit dans les médias, l’arrivée de la nouvelle génération FirePro, d’AMD, reste en revanche plus discrète. Pourtant, les séries S10000 ont des arguments à faire valoir…

A commencer par une puissance annoncée de 1,48 Tflops en double précision (5,91 Tflops SP), pour un TDP global de 375 Watts. 375 W, voilà qui peut sembler élevé face aux 225 W des cartes concurrentes. C’est d’ailleurs la raison pour laquelle les versions Workstation sont équipées de 3 ventilateurs en standard. L’explication, c’est que S10000 est bi-GPU. Il faut donc compter 187,5 W / GPU, soit environ 20 % d’efficacité énergétique en plus.

Et c’est là que réside tout l’intérêt du fleuron de la gamme AMD professionnelle. Basé sur une implémentation « full-options » de la nouvelle architecture Graphics Core Next, S10000 est conçu pour répondre à la fois aux besoins de calcul et de visualisation de l’utilisateur, à partir d’un seul et même module intégré.

Calcul et affichage multiple

Les possibilités d’affichage sont d’ailleurs assez larges. Elles s’étendent jusqu’à la gestion de six moniteurs simultanés, dans des résolutions atteignant 16K x 16K, l’ensemble étant perçu par l’OS et géré par le pilote EyeFinity comme un seul espace continu. Pour cela, un port DVI, quatre ports Mini DisplayPort et une adaptateur Mini DP vers DVI dual-link sont câblés directement sur la carte.

Une seule carte pour la gestion à la fois du calcul parallèle et de l’affichage, AMD ne manque pas d’insister sur son avantage concurrentiel par rapport à NVIDIA.

Dans beaucoup de contextes d’utilisation concrets, cet avantage est indéniable. Au quotidien, les activités de recherche sont toujours plus productives quand la console de contrôle d’une simulation ou d’un rendering reste à portée de main et que, pendant que la machine calcule, elle reste utilisable pour des tâches plus ancillaires. A cet aspect pratique s’ajoute une dimension financière non négligeable. Chez NVIDIA, par exemple, deux cartes sont nécessaires pour obtenir le même résultat – un accélérateur Kepler et une carte multi-affichage Quadro – soit un budget effectivement double.

La visualisation déportée est un autre point fort de S10000. Dans un contexte économique où de plus en plus d’implémentations HPC s’envisagent dans le cloud, les nouvelles FirePro supportent parfaitement toutes les utilisations en VDI (Virtual Desktop Infrastructure).

Pour les applications les plus exigeantes, le mode “direct GPU pass-through” de VMWare et de Citrix autorise l’accès à l’intégralité de la puissance des processeurs. Un S10000 étant bi-GPU, il expose naturellement deux accélérateurs virtuels pouvant être utilisés par deux utilisateurs différents. Pour les implémentations plus ordinaires, type RemoteFX, chaque GPU peut être sollicité par plusieurs utilisateurs distants en fonction du besoin en affichage des applications exécutées.

Le choix de la polyvalence

Gravé en technologie 28nm, S10000 se veut donc à la fois moins extrême dans sa spécialisation que ses concurrents directs GPU ou x86, et plus “vert” malgré sa robe rouge vif. Ses 6 Go de GDDR5 sont eux aussi partagés (3 Go par GPU), pour une bande passante atteignant de 480 Go/s (240 Go/s par GPU) lorsque la fonction ECC est désactivée. En fonction du niveau d’utilisation de l’accélérateur, la technologie PowerTune adapte finement l’alimentation à partir d’un algorithme interne d’évaluation des besoins. En calcul intensif, PowerTune peut aller jusqu’à overclocker les GPU lors d’un pic ponctuel (l’électronique a bel et bien été dimensionnée pour cela). Au repos, PowerTune pourra pratiquement arrêter les cœurs, d’où une consommation résiduelle d’environ 5 % du total soutenu. Une tendance qui prévaut également chez les deux autres grands.

Ces spécificités permettent sans doute de prédire à S10000 une belle carrière dans des déploiements de clusters HPC à usages multiples comme le calculateur SANAM (voir notre encadré), aujourd’hui n° 2 du Green500. En fonction des tâches qui lui sont confiées, son adaptativité est un atout indéniable.

De plus, le support natif d’OpenCL 1.2, une des solutions de développement HPC les plus ouvertes, ne crée a priori pas de contrainte pour l’ingénieur ou le développeur. Celui-ci dispose d’une API de bas niveau clairement documentée, permettant d’exploiter réellement toutes les ressources internes de la carte mais aussi d’exécuter directement ses applications sur d’autres plateformes locales ou distantes.
D’ici deux ans, AMD devrait intégrer un véritable accélérateur GPU (probablement un module de type S10000 complet) à ses CPU Opteron multi-cœurs. Là se concrétisera enfin la promesse d’une intégration électronique totale, avec une densité idéale pour de gros serveurs, une efficacité énergétique réellement optimisée, une énorme réduction des latences de bande passante et un coût total qui achèvera de démocratiser le HPC.

Lorsque ces APU seront disponibles, le choix sera plus cornélien que jamais entre une offre « multi-purpose » intégrée et des concurrents GPU ou x86 certes plus puissants mais également plus limités dans leurs usages.

[En détails]

Un cluster FirePro S10000 n°2 du Green500

Rien de tel, pour inaugurer une nouvelle génération d’accélérateurs HPC, que d’en démontrer l’efficacité dans un supercalculateur. Cette vitrine, AMD l’a conçue avec le Frankfurt’s Institute for Advanced Studies (FIAS) et le King Abdulaziz City for Science and Technology (KACST) de Riyadh, en Arabie Saoudite. Son nom : SANAM, qui signifie performance et efficacité.

 

SANAM se distingue en effet par un rendement énergétique qui le place d’emblée au second rang du Green500 (et, accessoirement, à la 52ème place du Top500). Embarquant 420 cartes FirePro S10000 (pour un total de 840 GPU), il délivre une puissance soutenue de 420 Tflops pour une consommation globale de 180 kW, soit environ 2,3 Gflops efficaces par Watt. Il n’y a pas si longtemps, ce chiffre aurait paru tout simplement inconcevable. SANAM est en effet basé sur l’architecture de LOEWE-CSC, le cluster massivement parallèle du Centre d’informatique scientifique de Francfort, mis en service fin 2010. Mais il offre environ 40 % de performance en plus pour une consommation électrique réduite des deux tiers.

Composé par ailleurs de 210 serveurs Asus ESC4000/FDR G2 dotés chacun de 2 Xeon E5-2650 octo-cœurs et de 128 Go de RAM Samsung verte de deuxième génération, SANAM sera consacré à un large éventail de recherches menées dans le royaume par des équipes composées de scientifiques Saoudiens et étrangers. Au programme : activités pétrolières et sismologie, aéronautique, biotechnologies, chimie des particules, météo…

© HPC Today 2020 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index