DataScale : une initiative française pour faire face au Big Data
By   |  September 15, 2013

Démarré après Teratec, le projet DataScale a pour ambition d’apporter des réponses technologiques aux défis soulevés par l’explosion du Big Data. Indépendamment de l’aspect purement volumétrie, le terme recouvre en effet des problématiques liées aux types de données (homogènes ou non, structurées ou non, globales ou atomiques…) et aux algorithmes de traitement (archéologie de données, traitements à la volée, consolidation…). Face à cela, DataScale s’est donné pour mission de créer des briques technologiques ad hoc et de les démontrer à partir d’une palette d’applicatifs et de leur passage à l’échelle. En ligne de mire, la transition programmée vers le cloud, qui nécessite des middlewares adaptés et probablement de nouvelles avancées dans l’architecture des bases de données.

L’effort est à saluer. D’abord parce qu’il regroupe autour de Bull un éventail d’acteurs nationaux (dont le CEA, l’Inria, l’IPGP et ActiveEon…) constitués d’institutionnels, de grandes entreprises et de PME. Ensuite parce que priorité est données aux résultats. La durée de l’initiative est en effet fixée à 24 mois, avec une liste de livrables très précise. Enfin parce qu’il se focalisera sur trois grands domaines d’application Big Data à partir desquels il sera possible de dériver les progrès accomplis. Primo, un code sismique de type “e-science”, domaine où la multiplication des capteurs et l’apparition de nouveaux instruments expérimentaux aboutit à la création de nouvelles masses de données. Secundo, une application dédiée à la surveillance d’une grande infrastructure technique avec monitoring d’un calculateur HPC. Tertio, une plateforme e-commerce et multimédia incluant en particulier des analyses poussées d’opinions et d’avis.

Une fois abouti, le projet DataScale devrait engendrer des outils qui profiteront à bon nombre de piles logicielles. On en attend notamment l’intégration de fonctions de gestion hiérarchique dans Lustre (avec DLM – Data Lifecycle Management), une alternative à MapReduce avec interfaçage Lustre et une architecture de SGBD distribuée incluent des index ensemblistes. Bon courage, Messieurs (et Mesdames !)…

© HPC Today 2024 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index