Records battus pour la nouvelle AMD FirePro W9100
By   |  April 10, 2014

AMD vient d’annoncer cette semaine le lancement d’une nouvelle carte graphique et de calcul sur la base de la nouvelle architecture au doux nom de code “Hawaii”. De quoi nous transporter un moment dans la chaleur des îles du pacifique, d’autant que, côté efficacité, ça chauffe pas mal aussi !

En effet, ce nouveau GPU surpasse à bien des égards ses concurrents et pourrait même s’avérer la puce la plus écologico-performante. Avec un TDP de 275 Watts, elle délivre jusqu’à 5,24 Tflops en simple précision et 2,62 Tflops en double précision, soit 1,5 fois la capacité des derniers accélérateurs K40 de NVIDIA et plus encore celle de Xeon Phi. Côté mémoire, AMD se repositionne en haut de tableau aux côtés de Xeon Phi (version 7100) en proposant 16 Go de mémoire GDDR5 avec une bande passante à 320 Go/s.

 

Selon les premiers résultats de performance fournis à la rédaction par AMD, la W9100 délivre 2,35 Tflops sur la DGEMM soit 90 % d’efficacité, un score impressionnant qui devra être confirmé lors des prochains classements officiels. Ces chiffres ont été obtenus sur une station de travail Intel Xeon E5-2620v2 équipée de deux FirePro W9100 pour une consommation totale de 650 W. Bien que la taille des matrices de test ne nous ait pas été précisée, la bibliothèque clBLAS utilisée est une version alpha toujours en cours d’optimisation par AMD notamment pour ce qui est des larges matrices (supérieures à 3000 éléments). Quoiqu’il en soit, ces résultats sont environ deux fois supérieurs à ceux fournis par NVIDIA. Avec un prix public à 3 999$, Jean-Christophe Baratault, Sr Business Development Manager chez AMD, estime que “la perception du marché sera que la W9100 délivre deux fois la performance DGEMM de la Tesla K40 pour moitié son tarif”. En version active, cette dernière est en effet aujourd’hui affichée à 8 975$, par exemple sur le site de HP.

Avec une estimation conservatrice à 65 % d’efficacité sur Linpack, le résultat serait de 3,40 Tflops soit plus de 5 Gflops/Watt. Rappelons que la machine TSUBAME au Tokyo Institute of Technology est actuellement numéro 1 au Green500 avec 4,5 Gflops/W. Mais pour pouvoir se classer au Green500, encore faut-il pouvoir être au niveau de la 500ème machine du Top500. Avec un ticket d’entrée se situant à 117 Tflops au dernier classement de novembre, un site client AMD n’aurait qu’à assembler 80 de ces cartes dans une configuration finalement facilement budgétisable pour y parvenir.

L’environnement de programmation repose aujourd’hui sur OpenCL 1.2 mais se veut d’ores et déjà compatible avec la version 2.0 qui inclue, entre autres, la mémoire virtuelle partagée avec un espace d’adressage générique ainsi que le parallélisme imbriqué et le support des atomiques.

Si la version Station de travail avec ventilateur (et jusqu’à 6 affichages 4K simultanés) est à présent disponible, son équivalent Serveur, à refroidissement passif, devrait arriver pour ISC14. On peut donc anticiper d’ici là de nouveaux ratios d’efficacité.

© HPC Today 2019 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index