HPC et médecine : des avancées décisives
By and   |  January 06, 2014

Le Big Data, clé des traitements personnalisés

Pour beaucoup de scientifiques, la puissance de calcul est d’abord utilisée dans le but d’obtenir plus rapidement des données statistiques exploitables. Le but est ici d’offrir à chaque patient non plus un traitement type correspondant à sa pathologie mais une cure personnalisée et adaptée aux paramètres de son métabolisme et au stade de son affection. L’analogie peut sembler discutable, mais on peut techniquement comparer cette approche à celle d’un site Web marchand qui analyse le profil de ses clients en fonction de leurs achats passés et en déduit les produits les plus susceptibles de générer de nouvelles dépenses. De façon un peu similaire, un médecin devrait à terme disposer d’algorithmes analytiques sur les données de son patient pour décider des traitements et des doses les plus appropriés.

Les fichiers issus de l’imagerie médicale représentent des masses de données colossales à stocker mais aussi une mine d’or en termes d’analyses Big Data.

Les thérapies géniques illustrent de façon encore plus évidente l’avènement très prochain de nouvelles pratiques médicales. Depuis quelques années, on sait que certaines maladies comme l’hémophilie ou le diabète sont directement liées au patrimoine génétique des patients. Aujourd’hui, grâce aux Genome Wide Association Studies (GWAS), on a déjà pu identifier 2 000 associations de gènes responsables de plus de 300 pathologies. L’intérêt de la méthode, clairement, est d’utiliser une “simple” analyse d’ADN pour administrer au patient un traitement capable de prévenir les maladies pour lesquelles il est programmé, avant même qu’elles ne se déclarent.

Très récemment, des chercheurs de l’université du Wisconsin et de l’hôpital Xavier Arnozan de Pessac en Gironde ont appliqué cette démarche pour guérir des chiens de l’hémophilie, maladie jusqu’ici considérée comme incurable. Les résultats sont probants mais la méthode a un coût – c’est même là son principal problème. Le séquençage d’un ADN humain, qui compte entre 20 000 et 25 000 gènes, revient aujourd’hui à environ 5 000 euros. Les espoirs d’arriver rapidement à moins de 1 000 euros – un niveau sociétalement supportable – sont cependant réels. Rappelons qu’en 2007, il fallait compter 350 000 euros pour un séquençage complet… Un X Prize (prix attribué par une association américaine qui récompense des ruptures technologiques et scientifiques) a même été annulé en raison de “progrès trop rapides” ! Lancé en 2006, il promettait 10 millions de dollars au premier laboratoire capable de séquencer l’ADN complet de 100 personnes à moins de 10 000 dollars par individu… Une première dans l’histoire de ce concours, toutes disciplines confondues (pour l’anecdote, la barre a été ramenée à 1 000 dollars pour relancer l’intérêt de la compétition). Il n’en reste pas moins qu’un génome numérisé représente 100 Go de données et qu’une généralisation du dépistage sur des populations de millions d’individus demeure un enjeu informatique et économique colossal.

Voilà pourquoi généticiens bioinformaticiens se sont rapidement approprié la plateforme emblématique du Big Data – le framework Hadoop – pour leurs propres besoins de stockage et de traitement. Dès 2009, Michael Schatz, de l’université du Maryland, proposait CloudBurst, une méthode de séquençage basée sur Map-Reduce. Selon son concepteur, la solution est 30 fois plus rapide que l’algorithme RMAP sur un cœur et, une fois déployée sur 96 cœurs sur Amazon EC2 par exemple, le temps de traitement passe de plusieurs heures à quelques minutes… Michael Schatz n’est pas le seul à avoir exploité Map-Reduce dans ce domaine : des alternatives telles que Crossbow ou Hadoop-BAM ont permis de très nettement simplifier l’implantation de ce type d’outil dans les laboratoires, et donc de démocratiser une pratique longtemps considérée comme académique.

Navigation

<1234567>

© HPC Today 2024 - All rights reserved.

Thank you for reading HPC Today.

Express poll

Do you use multi-screen
visualization technologies?

Industry news

Brands / Products index