3 000 chercheurs de 160 pays utilisent AlphaGenome avec 1 million de requêtes par jour. Cette adoption massive traduit une révolution : pour la première fois, l’IA peut évaluer l’impact d’une mutation génétique en une seconde. DeepMind vient de libérer le code source d’AlphaGenome, rendant accessible un outil qui transforme l’interprétation du génome humain et accélère la découverte de médicaments.

AlphaGenome analyse jusqu’à 1 million de bases d’ADN et prédit des milliers de paramètres génomiques fonctionnels, surpassant 25 modèles existants sur 26 évaluations. Cette performance technique ouvre la voie à une médecine personnalisée accessible à grande échelle, où chaque mutation peut être analysée instantanément.

L’IA unifie enfin l’analyse génomique

AlphaGenome prend en entrée jusqu’à 1 million de lettres d’ADN et prédit des milliers de propriétés moléculaires caractérisant son activité régulatrice, en comparant les séquences mutées avec les non-mutées. Cette capacité transforme la recherche médicale : auparavant, le domaine exigeait des modèles séparés pour des tâches séparées avec un compromis entre longueur de séquence et résolution ; AlphaGenome unifie tout sous un même toit.

Le modèle traite jusqu’à 1 million de paires de bases d’ADN simultanément et génère des prédictions haute résolution pour des milliers de modalités moléculaires, permettant aux chercheurs d’évaluer les effets de variants communs et rares dans les régions régulatrices non-codantes qui constituent 98% du génome humain.

L’architecture technique explique cette performance. Le système combine des réseaux de neurones convolutionnels pour détecter les motifs de séquence locaux avec des architectures transformateur qui modélisent les dépendances à travers des régions génomiques distantes, l’entraînement étant distribué sur des unités de traitement spécialisées permettant l’analyse de séquences massives à résolution de paire de bases unique.

L’impact immédiat sur la médecine des maladies rares

De nombreuses maladies génétiques rares comme l’atrophie musculaire spinale et certaines formes de mucoviscidose peuvent être causées par des erreurs d’épissage d’ARN ; pour la première fois, AlphaGenome peut modéliser explicitement la localisation et le niveau d’expression de ces jonctions directement à partir de la séquence.

Dans un cas test, AlphaGenome a reproduit avec succès le mécanisme connu derrière la leucémie aiguë lymphoblastique T en prédisant qu’une mutation non-codante pourrait activer le gène TAL1 via la création d’un motif MYB.

Cette précision révolutionne l’approche des maladies génétiques. Avec plus de 10 000 maladies rares identifiées dans le monde, dont 80% sont génétiques, seules 5% ont actuellement des traitements approuvés par la FDA. AlphaGenome accélère l’identification des causes moléculaires, réduisant le délai entre diagnostic génétique et développement thérapeutique.

Quand son laboratoire compare les génomes de cellules cancéreuses avec les cellules non-affectées de patients, des milliers de modifications individuelles émergent ; il est très difficile de déterminer si un changement particulier aura une conséquence fonctionnelle. AlphaGenome classe les variants les plus susceptibles d’être conséquentiels, permettant aux chercheurs de concentrer leurs études de suivi.

La libération du code source transforme la recherche mondiale

AlphaGenome est disponible pour usage non-commercial via une API en ligne, avec un kit de développement logiciel Python fourni pour interagir avec le modèle. Cette accessibilité explique l’adoption massive : depuis son lancement initial en juin dernier, environ 3 000 chercheurs de 160 pays ont expérimenté avec l’IA pour étudier une gamme de maladies incluant cancer, infections et troubles neurodégénératifs.

L’efficacité d’entraînement a été améliorée : un modèle AlphaGenome complet a été entraîné en seulement quatre heures sur TPU, utilisant la moitié du budget de calcul du modèle Enformer précédent de DeepMind, grâce à l’architecture et aux pipelines de données optimisés.

L’impact dépasse les laboratoires de pointe. Des adopteurs précoces d’AlphaGenome, des chercheurs en bioinformatique de l’Université Chuo au Japon ont utilisé l’outil IA comme validation croisée indépendante, confirmant que les gènes impliqués par la privation de sommeil étaient particulièrement actifs dans leurs neurones d’intérêt, publiant les résultats le 1er janvier dans la revue Genes.

L’écosystème de découverte médicale accélère

Cette année a vu le plus haut saut annuel de dépôts IND pour des molécules d’origine IA, menées par des entreprises comme Insilico Medicine, Recursion, BenevolentAI, Absci et Generate Biomedicines. La plupart des dépôts étaient de petites molécules concentrées en oncologie, fibrose, troubles auto-immuns et maladies rares.

AlphaGenome s’intègre dans cette dynamique d’accélération. Pour la biologie moléculaire, AlphaGenome peut servir de moteur pour l’expérimentation in silico, permettant la génération rapide d’hypothèses et la priorisation d’expériences coûteuses en laboratoire. Pour la recherche diagnostique de maladies rares, les prédictions d’effet de variant améliorées d’AlphaGenome pourraient fournir des preuves fonctionnelles supplémentaires aux pipelines d’annotation actuels.

La médecine génétique personnalisée franchit un seuil critique. Le mois dernier, le premier traitement CRISPR personnalisé a été administré à un patient. Une équipe de médecins et scientifiques a créé la thérapie CRISPR in vivo sur mesure pour un nourrisson, développée et livrée en seulement six mois. Ce cas historique ouvre la voie à un futur avec des thérapies d’édition génique à la demande.

Les limites actuelles et perspectives d’évolution

AlphaGenome n’est pas conçu pour la prédiction génomique personnelle. Il ne modélise pas les traits pathologiques impliquant des facteurs biologiques d’ordre supérieur, et les performances chutent pour les interactions régulatrices très distantes (>100 000 pb).

Comme d’autres modèles basés sur les séquences, capturer avec précision l’influence d’éléments régulateurs très distants, comme ceux situés à plus de 100 000 lettres d’ADN, reste un défi en cours.

Malgré ces limites, l’avenir s’annonce prometteur. Un rapport Precedence Research valorise le marché mondial de la génomique à 37,94 milliards de dollars en 2024 et projette qu’il atteindra 175,18 milliards de dollars d’ici 2034, avec une croissance annuelle de 16,53%.

AlphaGenome participe de cette révolution technologique qui transforme la médecine. L’IA ne remplace pas le raisonnement scientifique. Elle étend le domaine sur lequel le raisonnement scientifique peut opérer. En rendant l’interprétation génomique accessible à des milliers de chercheurs mondiaux, DeepMind accélère la transition vers une médecine véritablement personnalisée.

Sources

  1. Advancing regulatory variant effect prediction with AlphaGenome | Nature
  2. AlphaGenome: AI for better understanding the genome — Google DeepMind
  3. DeepMind opens AlphaGenome source code to widen DNA research | STAT
  4. Google’s AlphaGenome wants to do for DNA what AlphaFold did for proteins | Research | Chemistry World
  5. GitHub - google-deepmind/alphagenome