La dernière IA AlphaFold de DeepMind, qui résout les protéines, résout à peu près l’énigme de 50 ans de biologie

par L'équipe de Comparaland · 1 décembre 2020

DeepMind affirme que son logiciel d’apprentissage automatique AlphaFold peut désormais prédire rapidement la structure des protéines avec une grande précision et pourrait un jour nous aider à développer des médicaments plus rapidement.

Dans son annonce de lundi, annoncée comme une percée scientifique par certains, le partenaire stable de Google affirme avoir résolu un problème de 50 ans en biologie: construire un système informatique capable de modéliser avec précision et rapidement la structure d’une protéine à partir de ses chaînes d’acides aminés. .

Pour les non-initiés, les protéines sont des molécules essentielles à la vie telle que nous la connaissons: elles transportent la matière dans les cellules et les corps, elles effectuent des réactions chimiques comme des enzymes, elles vous protègent comme des anticorps, etc. La manière dont chaque fonction est définie par sa forme Cependant, les protéines sont des arrangements 3D complexes de taille nanométrique, et il est donc difficile, mais pas toujours impossible, de comprendre leur structure à travers des observations.

Une approche alternative consiste à utiliser un logiciel pour relier les acides aminés détectés dans une protéine – chaque protéine est formée à partir de chaînes de ces acides – à la structure complexe de la protéine. Des programmes informatiques comme AlphaFold estiment la structure d’une protéine à partir de ses acides aminés. Connaître la forme des composants d’une protéine nous aide à comprendre comment ils fonctionnent, ce qui nous aide à faire des choses comme développer des médicaments et créer des protéines nouvelles ou copiées.

Le défi

Le concours d’évaluation critique de la prédiction de la structure des protéines, appelé CASP en abrégé, a été mis en place en 1994 pour comparer le code de prédiction du repliement des protéines et a lieu tous les deux ans. Cette fois-ci, l’AlphaFold de DeepMind a atteint le score le plus élevé jamais atteint de 87 GDT, juste en dessous de 90 GDT, un score considéré comme aussi bon que les résultats obtenus à partir d’observations physiques de protéines. Fondamentalement, le logiciel basé sur l’IA est capable de prédire avec précision la structure de protéines individuelles en quelques minutes ou quelques jours, alors que les expériences physiques peuvent prendre beaucoup plus de temps. Cela signifie que le travail de développement de médicaments peut être considérablement accéléré.

«Nous sommes bloqués sur ce seul problème – comment les protéines se replient-elles – depuis près de 50 ans», a déclaré John Moult, co-fondateur et président de CASP et professeur à l’Université du Maryland aux États-Unis. «Voir DeepMind produire une solution pour cela, avoir travaillé personnellement sur ce problème pendant si longtemps et après tant d’arrêts et de démarrages, se demander si nous y arriverions un jour, est un moment très spécial.»

GDT signifie Global Distance Test (GDT) et est classé sur une échelle de 0 à 100. Le score d’AlphaFold signifie qu’il est capable de prédire la structure d’une protéine avec une précision d’environ 87%: les positions estimées des acides aminés peuvent être erronées par une distance de 1,6 angströms ou 0,16 nm – environ la largeur d’un atome.

NHS England offre 15 millions de livres sterling aux entreprises d’IA pour un logiciel qui aide au traitement des victimes d’AVC alors que le COVID-19 étend son service

AlphaFold a saccagé ses concurrents, notons les résultats officiels. En 2018, AlphaFold était également en tête de liste avec un score inférieur à 60 GDT en utilisant un système composé de trois réseaux de neurones.

“Nous devons être beaucoup plus précis pour que cela soit utile aux biologistes”, a déclaré le PDG de DeepMind, Demis Hassibis. El Reg à l’époque. La dernière entrée de 2020 a une architecture différente, basée sur un «système de réseau neuronal basé sur l’attention».

«Une protéine pliée peut être considérée comme un« graphe spatial », où les résidus sont les nœuds et les bords relient les résidus à proximité», a expliqué l’équipe AlphaFold cette semaine. «Ce graphique est important pour comprendre les interactions physiques au sein des protéines, ainsi que leur histoire évolutive.»

AlphaFold a été formé sur environ 170 000 structures protéiques et a appris la représentation spatiale de tous les acides aminés constitutifs de chacune afin de prédire les structures présentées dans le concours CASP. «Il utilise environ 128 cœurs TPUv3 (environ l’équivalent d’environ 100 à 200 GPU) exécutés sur quelques semaines, ce qui représente une quantité de calcul relativement modeste dans le contexte de la plupart des grands modèles de pointe utilisés dans l’apprentissage automatique aujourd’hui. », A déclaré l’équipe.

«Être capable d’étudier la forme des protéines rapidement et avec précision a le potentiel de révolutionner les sciences de la vie», a déclaré Andriy Kryshtafovych, qui a aidé à organiser le concours CASP et un scientifique du projet à l’Université de Californie à Davis.

«Maintenant que le problème a été largement résolu pour les protéines uniques, la voie est ouverte pour le développement de nouvelles méthodes pour déterminer la forme des complexes protéiques – des collections de protéines qui travaillent ensemble pour former une grande partie de la machinerie de la vie, et pour d’autres applications. “

Bien que l’IA soit presque aussi performante que les scientifiques, elle ne remplacera pas complètement les expériences de laboratoire. Prédire la structure de protéines individuelles ne décrit pas comment elles pourraient interagir les unes avec les autres ou avec d’autres molécules comme l’ADN ou l’ARN.

“AlphaFold est l’une de nos avancées les plus significatives à ce jour, mais, comme pour toute recherche scientifique, il reste encore de nombreuses questions à répondre”, a conclu l’équipe DeepMind. “Toutes les structures que nous prévoyons ne seront pas parfaites … En collaboration avec d’autres, il y a aussi beaucoup à apprendre sur la meilleure façon d’utiliser ces découvertes scientifiques dans le développement de nouveaux médicaments, des moyens de gérer l’environnement, etc. “

Le laboratoire d’IA basé à Londres devrait révéler plus de détails dans un prochain article évalué par des pairs. Un porte-parole n’était pas disponible pour d’autres commentaires. ®

La dernière IA AlphaFold de DeepMind, qui résout les protéines, résout à peu près l’énigme de 50 ans de biologie

Le défi

NHS England offre 15 millions de livres sterling aux entreprises d’IA pour un logiciel qui aide au traitement des victimes d’AVC alors que le COVID-19 étend son service

Laisser un commentaire Annuler la réponse

Statistiques du site

Logiciels