Approches informatiques rationalisant la découverte de médicaments

Nouvelles

MaisonMaison / Nouvelles / Approches informatiques rationalisant la découverte de médicaments

Oct 01, 2023

Approches informatiques rationalisant la découverte de médicaments

Nature tome 616, pages

Nature volume 616, pages 673–685 (2023)Citer cet article

28 000 accès

1 Citations

371 Altmétrique

Détails des métriques

La découverte de médicaments assistée par ordinateur existe depuis des décennies, bien que ces dernières années aient vu un changement tectonique vers l'adoption des technologies informatiques à la fois dans le milieu universitaire et pharmaceutique. Ce changement est largement défini par le flot de données sur les propriétés des ligands et la liaison aux cibles thérapeutiques et leurs structures 3D, les capacités de calcul abondantes et l'avènement de bibliothèques virtuelles à la demande de petites molécules médicamenteuses par milliards. Tirer pleinement parti de ces ressources nécessite des méthodes de calcul rapides pour un criblage efficace des ligands. Cela inclut le criblage virtuel basé sur la structure d'espaces chimiques à l'échelle du gigagramme, encore facilité par des approches de criblage itératives rapides. Les développements dans les prédictions d'apprentissage en profondeur des propriétés des ligands et des activités cibles au lieu de la structure des récepteurs sont hautement synergiques. Nous passons ici en revue les avancées récentes dans les technologies de découverte de ligands, leur potentiel pour remodeler l'ensemble du processus de découverte et de développement de médicaments, ainsi que les défis auxquels ils sont confrontés. Nous discutons également de la façon dont l'identification rapide de ligands hautement diversifiés, puissants, sélectifs et de type médicament aux cibles protéiques peut démocratiser le processus de découverte de médicaments, offrant de nouvelles opportunités pour le développement rentable de traitements à petites molécules plus sûrs et plus efficaces.

Malgré des progrès étonnants dans les sciences fondamentales de la vie et la biotechnologie, la découverte et le développement de médicaments (DDD) restent lents et coûteux, prenant en moyenne environ 15 ans et environ 2 milliards de dollars américains pour fabriquer un médicament à petite molécule1. Bien qu'il soit admis que les études cliniques sont la partie la plus coûteuse du développement de chaque médicament, la plupart des opportunités de gain de temps et d'économies résident dans les premières étapes de découverte et précliniques. Les efforts précliniques eux-mêmes représentent plus de 43 % des dépenses de la pharma, en plus d'importants financements publics1, entraînés par le taux d'attrition élevé à chaque étape, de la sélection de la cible à l'identification des résultats et à l'optimisation des prospects jusqu'à la sélection des candidats cliniques. De plus, le taux d'échec élevé dans les essais cliniques (actuellement 90%)2 s'explique en grande partie par des problèmes liés à la découverte précoce, tels qu'une validation de cible inadéquate ou des propriétés de ligand sous-optimales. Trouver des moyens rapides et accessibles de découvrir des pools plus diversifiés de sondes, de résultats et de pistes chimiques de meilleure qualité avec des profils optimaux d'absorption, de distribution, de métabolisme, d'excrétion et de toxicologie (ADMET) et de pharmacocinétique (PK) aux premiers stades de la DDD améliorerait les résultats des études précliniques et cliniques et faciliterait des médicaments plus efficaces, accessibles et plus sûrs.

Le concept de découverte de médicaments assistée par ordinateur3 a été développé dans les années 1970 et popularisé par le magazine Fortune en 1981, et a depuis traversé plusieurs cycles de battage médiatique et de désillusion4. Il y a eu des réussites en cours de route5 et, en général, les approches assistées par ordinateur sont devenues une partie intégrante, quoique modeste, du processus de découverte de médicaments6,7. Au cours des dernières années, cependant, plusieurs percées scientifiques et technologiques ont entraîné un changement tectonique vers l'adoption d'approches informatiques en tant que force motrice clé pour la découverte de médicaments dans les universités et l'industrie. Les entreprises pharmaceutiques et biotechnologiques étendent leurs efforts de découverte de médicaments informatiques ou embauchent leurs premiers chimistes informatiques. De nombreuses sociétés de découverte de médicaments nouvelles et établies ont levé des milliards au cours des dernières années avec des modèles commerciaux qui reposent fortement sur une combinaison de modélisation moléculaire avancée basée sur la physique avec l'apprentissage en profondeur (DL) et l'intelligence artificielle (IA)8. Bien qu'il soit encore trop tôt pour s'attendre à ce que des médicaments approuvés soient issus des efforts de découverte les plus récents basés sur le calcul, ils produisent un nombre croissant de candidats cliniques, certaines campagnes revendiquant spécifiquement des délais cible-à-livraison aussi bas que 1 à 2 mois9,10, ou un délai cible-clinique inférieur à 1 an11. S'agit-il des signes d'un changement majeur dans le rôle des approches informatiques dans la découverte de médicaments ou simplement d'un autre cycle du cycle de battage médiatique ?

Examinons les facteurs clés définissant les changements récents (Fig. 1). Premièrement, la révolution structurelle - de l'automatisation de la cristallographie12 à la microcristallographie13,14 et plus récemment la technologie de cryo-microscopie électronique15,16 - a permis de révéler des structures 3D pour la majorité des cibles cliniquement pertinentes, souvent dans un état ou un complexe moléculaire pertinent pour sa fonction biologique. Le récent revirement structurel des récepteurs couplés aux protéines G (GPCR)17 et d'autres protéines membranaires qui interviennent dans l'action de plus de 50 % des médicaments18, a été particulièrement impressionnant, fournissant des modèles 3D pour le criblage des ligands et l'optimisation des pistes. Le deuxième facteur est une expansion rapide et marquée de l'espace chimique de type drogue, facilement accessible pour la découverte de succès et de pistes. Il y a quelques années à peine, cet espace était limité à plusieurs millions de composés en rayon provenant de fournisseurs et de bibliothèques de criblage internes dans l'industrie pharmaceutique. Désormais, le criblage peut être effectué avec des bibliothèques virtuelles ultra-larges et des espaces chimiques de composés de type médicamenteux, qui peuvent être facilement fabriqués à la demande, dépassant rapidement des milliards de composés19, et des espaces génératifs encore plus grands avec une synthétisabilité théoriquement prédite (Encadré 1). Le troisième facteur implique des approches informatiques émergentes qui s'efforcent de tirer pleinement parti de l'abondance de structures 3D et de données de ligand, soutenues par la large disponibilité des ressources informatiques du cloud et de l'unité de traitement graphique (GPU) pour prendre en charge ces méthodes à grande échelle. Cela comprend le criblage virtuel basé sur la structure de très grandes bibliothèques20,21,22, en utilisant des approches de criblage accélérées23,24,25 et modulaires26, ainsi que la croissance récente des méthodes d'apprentissage automatique (ML) et DL basées sur les données pour prédire les propriétés et les activités ADMET et PK27.

a, Plus de 200 000 structures de protéines dans la PDB, ainsi que des collections privées, ont plus de 90% des familles de protéines couvertes de structures de microscopie à rayons X à haute résolution et plus récemment de cryo-microscopie électronique, souvent dans des états fonctionnels distincts, les lacunes restantes étant également comblées par des modèles d'homologie ou AlphaFold2. b, L'espace chimique disponible pour le criblage et la synthèse rapide est passé d'environ 107 composés sur étagère en 2015 à plus de 3 × 1010 composés à la demande en 2022, et peut être rapidement étendu au-delà de 1015 composés divers et nouveaux. c, Les méthodes de calcul pour VLS incluent des avancées dans l'amarrage flexible rapide, des algorithmes modulaires basés sur des fragments, des modèles DL et des approches hybrides. d, Les outils de calcul sont soutenus par la croissance rapide du cloud computing abordable, de l'accélération GPU et des puces spécialisées.

Bien que les impacts de la récente révolution structurelle17 et du matériel informatique dans la découverte de médicaments28 soient examinés en détail ailleurs, nous nous concentrons ici sur l'expansion continue des espaces chimiques accessibles de type médicament ainsi que sur les développements actuels des méthodes de calcul pour la découverte et l'optimisation de ligands. Nous détaillons comment les outils informatiques émergents appliqués dans le gigaspace peuvent faciliter la découverte rentable de centaines, voire de milliers de ligands très divers, puissants, sélectifs et de type médicamenteux pour une cible souhaitée, et les plaçons dans le contexte d'approches expérimentales (tableau 1). Bien que le plein impact des nouvelles technologies informatiques commence seulement à affecter le développement clinique, nous suggérons que leur combinaison synergique avec les tests expérimentaux et la validation dans l'écosystème de la découverte de médicaments peut améliorer considérablement son efficacité dans la production de meilleures thérapies.

Les sociétés pharmaceutiques accumulent des collections de composés pour le criblage en interne, tandis que les collections en stock des fournisseurs (voir la figure, partie a) permettent une livraison rapide (moins d'une semaine), contiennent des échafaudages chimiques uniques et avancés, sont facilement consultables et sont HTS compatible. Cependant, le coût élevé de la gestion des bibliothèques physiques, leur croissance linéaire lente, leur taille limitée et leur nouveauté limitent leurs applications.

Plus récemment, des bases de données chimiques virtuelles à la demande (entièrement énumérées) et des espaces (non énumérés) permettent une synthèse parallèle rapide à partir de blocs de construction disponibles, en utilisant des protocoles validés ou optimisés, avec un succès synthétique de plus de 80 % et une livraison en 2 à 3 semaines (voir la figure, partie b). Les espaces chimiques virtuels assurent une nouveauté chimique élevée et permettent une croissance polynomiale rapide avec l'ajout de nouveaux synthons et échafaudages de réaction, y compris des réactions à 4+ composants. Les exemples incluent Enamine REAL, Galaxy de WuXi, CHEMriya d'Otava et des bases de données et des espaces privés dans des sociétés pharmaceutiques.

Les espaces génératifs, contrairement aux espaces à la demande, comprennent des molécules théoriquement possibles et pourraient collectivement comprendre tout l'espace chimique (voir la figure, partie c). Ces espaces ne sont limités que par la plausibilité théorique, estimée à 1023-1060 de composés de type médicamenteux. Bien que permettant une couverture spatiale complète, le chemin de réaction et le taux de réussite des composés générés sont inconnus et nécessitent donc une prédiction informatique de leur capacité de synthèse pratique. Des exemples d'espaces génératifs et de leurs sous-ensembles incluent GDB-13, GDB-17, GDB-18 et GDBChEMBL.

La taille et la diversité limitées des bibliothèques de criblage ont longtemps été un goulot d'étranglement pour la détection de nouveaux ligands puissants et pour l'ensemble du processus de découverte de médicaments. Une campagne moyenne de criblage à haut débit (HTS) « abordable »29 utilise des bibliothèques de criblage d'environ 50 000 à 500 000 composés et ne devrait donner que quelques vrais résultats après validation secondaire. Ces résultats, le cas échéant, sont généralement plutôt faibles, non sélectifs, ont des propriétés ADMET et PK sous-optimales et un mode de liaison inconnu, de sorte que leur découverte implique des années d'efforts d'optimisation minutieux par essais et erreurs pour produire une molécule principale avec une puissance satisfaisante et toutes les autres exigences du développement préclinique. La mise à l'échelle du HTS à quelques millions de composés n'est possible que dans les grandes sociétés pharmaceutiques, et cela ne fait toujours pas beaucoup de différence en termes de qualité des résultats obtenus. De même, les bibliothèques virtuelles qui utilisent le criblage silico étaient traditionnellement limitées à une collection de composés disponibles en stock auprès des fournisseurs, comprenant généralement moins de 10 millions de composés uniques, donc l'avantage d'échelle par rapport au HTS était marginal.

Bien que la poursuite de la couverture complète de l'énorme espace chimique de type médicamenteux (estimé à plus de 1063 composés)30 soit une entreprise futile, étendre le criblage des bibliothèques à la demande de plusieurs ordres de grandeur à des milliards et plus de composés de type médicamenteux jusque-là inexplorés, physiques ou virtuels, devrait changer le modèle de découverte de médicaments de plusieurs manières. Premièrement, cela peut augmenter proportionnellement le nombre de résultats potentiels lors de la sélection initiale31 (Fig. 2). Cette abondance de ligands dans la bibliothèque augmente également les chances d'identification de ligands plus puissants ou sélectifs, ainsi que de ligands ayant de meilleures propriétés physicochimiques. Cela a été démontré dans des campagnes de criblage virtuel ultra-larges pour plusieurs cibles, révélant des ligands très puissants avec des affinités souvent dans la gamme nanomolaire moyenne à sub-nanomolaire20,21,22,23,26. Deuxièmement, l'accessibilité des analogues de succès dans les mêmes espaces à la demande rationalise une génération de relation structure-activité (SAR) significative par catalogue et d'autres étapes d'optimisation, réduisant ainsi la quantité de synthèses personnalisées élaborées. Enfin, bien que l'échelle de la bibliothèque soit importante, des bibliothèques gigascale correctement construites peuvent accroître la diversité chimique (même avec quelques réactions chimiques32), la nouveauté chimique et la brevetabilité des hits, car presque tous les composés à la demande n'ont jamais été synthétisés auparavant.

Les courbes rouges en échelle logarithmique illustrent la distribution des résultats de dépistage avec des scores de liaison supérieurs à X pour les bibliothèques de 10 milliards, 100 millions et 1 million de composés, comme estimé à partir des précédentes campagnes de dépistage VLS et V-SYNTHES. Les courbes bleues illustrent la dépendance approximative du taux de succès expérimental sur le score d'amarrage prédit pour les seuils de 10 µM, 1 µM et 100 nM20. Cette analyse (semi-quantitative, car elle varie d'une cible à l'autre) suggère que le criblage de plus de 100 millions de composés lève les limites des bibliothèques plus petites, étendant la queue de la distribution des coups vers de meilleurs scores de liaison avec des taux de coups élevés, et permettant l'identification de coups proportionnellement plus expérimentaux avec une affinité plus élevée. Notez également deux facteurs importants justifiant une croissance supplémentaire des bibliothèques de criblage à 10 milliards et plus : (1) les résultats candidats pour la synthèse et les tests expérimentaux sont généralement sélectionnés à la suite d'un post-traitement dépendant de la cible de plusieurs milliers de composés les plus performants, qui sélectionne la nouveauté, la diversité, la ressemblance aux médicaments et souvent les interactions avec des résidus de récepteurs spécifiques. Ainsi, plus il y a de bons composés identifiés, meilleure est la sélection globale. (2) La saturation des courbes de taux de réussite aux meilleurs scores n'est pas une règle universelle mais le résultat de la précision limitée des fonctions de notation rapide utilisées dans le dépistage. L'utilisation d'approches d'amarrage ou de notation plus précises (amarrage flexible, perturbation de la mécanique quantique et de l'énergie libre) dans l'étape de post-traitement peut étendre une corrélation significative du score de liaison avec l'affinité plus à gauche (courbes en pointillés gris), apportant potentiellement encore plus de résultats de haute affinité pour les espaces chimiques à grande échelle.

Plusieurs approches ont été développées récemment pour repousser les limites de taille de bibliothèque dans HTS, y compris la chimie combinatoire et la mise en commun à grande échelle des composés pour des essais parallèles. Par exemple, les techniques de spectrométrie de masse par sélection d'affinité peuvent être appliquées pour identifier les liants directement dans des pools de milliers de composés33 sans nécessiter de marquage. Des bibliothèques codées par ADN (DEL) et des approches rentables pour les générer et les cribler ont également été développées34, permettant de travailler avec jusqu'à environ 1010 composés dans un seul tube à essai35. Ces méthodes ont leurs propres limites ; comme les DEL sont créés en marquant des ligands avec des séquences d'ADN uniques via un lieur, la conjugaison d'ADN limite les chimies possibles pour l'assemblage combinatoire de la bibliothèque. Le criblage des DEL peut également produire un grand nombre de faux négatifs en bloquant des fragments importants pour la liaison et, plus important encore, des faux positifs par liaison non spécifique d'étiquettes d'ADN, de sorte qu'une resynthèse hors ADN coûteuse des composés touchés est nécessaire pour leur validation. Pour éviter cette resynthèse, il a été suggéré d'utiliser des modes ML entraînés sur les résultats DEL pour chaque cible afin de prédire les ligands de type médicament à partir d'espaces chimiques à la demande, comme décrit dans la réf. 36.

Le criblage in silico des bibliothèques virtuelles par des approches informatiques rapides a longtemps été présenté comme un moyen rentable de surmonter les limites des bibliothèques physiques. Ce n'est que récemment, cependant, que des approches de chimie synthétique et de chimioinformatique ont été développées pour dépasser ces limites et construire des bibliothèques virtuelles à la demande qui explorent un espace chimique beaucoup plus vaste, comme indiqué dans les références. 37,38. En 2017, la base de données facilement accessible (REAL) d'Enamine19,39 est devenue la première bibliothèque à la demande disponible dans le commerce basée sur le principe de réaction robuste40, tandis que les National Institutes of Health des États-Unis ont développé un inventaire virtuel synthétiquement accessible (SAVI)41, qui utilise également les blocs de construction d'Enamine. La base de données REAL utilise des protocoles de synthèse parallèle soigneusement sélectionnés et optimisés et une collection organisée de blocs de construction en stock, permettant de garantir la synthèse rapide (moins de 4 semaines), fiable (taux de réussite de 80 %) et abordable d'un ensemble de composés21. Poussée par de nouvelles réactions et divers éléments constitutifs, la base de données REAL entièrement énumérée est passée d'environ 170 millions de composés en 2017 à plus de 5,5 milliards de composés en 2022 et comprend l'essentiel de la populaire base de données de criblage virtuel ZINC2042. L'utilité pratique de la base de données REAL a été récemment démontrée dans plusieurs campagnes de criblage prospectives majeures20,21,23,24, certaines d'entre elles prenant d'autres étapes d'optimisation dans le même espace chimique, produisant des ligands sélectifs nanomolaires et même sous-nanomolaires sans aucune synthèse personnalisée20,21. Des bibliothèques virtuelles ultra-larges similaires (c'est-à-dire GalaXi (http://www.wuxiapptec.com) et CHEMriya (http://chemriya.com)) sont disponibles dans le commerce, bien que leurs taux de réussite synthétique n'aient pas encore été publiés.

La nature modulaire des bibliothèques virtuelles à la demande permet une croissance supplémentaire par l'ajout de réactions et de blocs de construction. Cependant, la construction, la maintenance et la recherche de bibliothèques chimiques entièrement énumérées comprenant plus de quelques milliards de composés deviennent lentes et peu pratiques. Ces bibliothèques virtuelles à grande échelle sont donc généralement maintenues sous forme d'espaces chimiques non énumérés, définis par un ensemble spécifique de blocs de construction et de réactions (ou transformations), comme examiné en détail dans la réf. 38. Dans le secteur pharmaceutique, l'un des premiers exemples publiés comprend PGVL de Pfizer37,43, dont la version la plus récente utilise un ensemble de 1 244 réactions et réactifs internes pour prendre en compte 1 014 composés. D'autres sociétés biopharmaceutiques ont leurs propres espaces chimiques virtuels38,44, bien que leurs détails ne soient souvent pas dans le domaine public. Parmi les espaces chimiques disponibles dans le commerce, GalaXi Space de WuXi (environ 8 milliards de composés), CHEMriya d'Otava (11,8 milliards de composés) et Enamine REAL Space (36 milliards de composés)45 sont parmi les plus importants et les mieux établis. En plus de leurs tailles énormes, ces espaces virtuels sont très nouveaux et diversifiés, et ont un chevauchement minimal (moins de 10 %) entre eux46. Actuellement, le plus grand espace commercial, Enamine REAL Space, est une extension de la base de données REAL qui maintient les mêmes garanties synthétiques de vitesse, de débit et de coût, couvrant plus de 170 réactions et plus de 137 000 blocs de construction (Encadré 1). La plupart de ces réactions sont à deux ou trois composants, mais davantage de réactions à quatre ou même à cinq composants sont explorées, permettant une combinatoire d'ordre supérieur. Cet espace peut être facilement étendu à 1015 composés en fonction des réactions disponibles et des ensembles de blocs de construction étendus, par exemple, 680 millions de blocs de construction fabriqués à la demande (MADE)47, bien que la synthèse de ces composés implique plus d'étapes et soit plus coûteuse. Pour représenter et naviguer dans les espaces chimiques combinatoires sans leur énumération complète, des outils de chimioinformatique spécialisés ont été développés, allant des recherches de similarité chimique basées sur des fragments48 à des méthodes de recherche de similarité moléculaire 3D plus élaborées basées sur des champs de propriétés atomiques tels que le moteur de découverte rapide d'isostères (RIDE)38.

Une approche alternative proposée pour construire des espaces chimiques génère des composés hypothétiquement synthétisables suivant des règles simples de faisabilité synthétique et de stabilité chimique. Ainsi, les bases de données générées (GDB) prédisent les composés pouvant être constitués d'un nombre spécifique d'atomes ; par exemple, GDB-17 contenait 166,4 milliards de molécules de jusqu'à 17 atomes de C, N, O, S et des halogènes49, tandis que GDB-18 composé de 18 atomes atteindrait environ 1013 composés38. D'autres approches génératives basées sur des définitions plus étroites des espaces chimiques sont maintenant utilisées dans la conception de ligand de novo avec une chimie générative basée sur DL (par exemple, réf. 50), comme discuté ci-dessous.

Bien que le taux de réussite synthétique de certains des espaces chimiques commerciaux à la demande (par exemple, Enamine REAL Space) ait été entièrement validé20,21,22,23,24,26,42, les accessibilités synthétiques et les taux de réussite d'autres espaces chimiques restent non publiés38. Ce sont des mesures importantes pour la durabilité pratique de la synthèse à la demande, car des taux de réussite réduits ou un temps et un coût déraisonnables diminueraient son avantage par rapport à la synthèse personnalisée.

Les espaces chimiques de gigascale et de terrascale, à condition qu'ils maintiennent une ressemblance et une diversité de médicaments élevées, devraient abriter des millions de succès potentiels et des milliers de séries de pistes potentielles pour n'importe quelle cible. De plus, leur synthèse robuste hautement traitable simplifie tous les efforts de chimie médicinale en aval vers les candidats-médicaments finaux.

Cependant, la gestion de ces bibliothèques virtuelles nécessite de nouvelles approches informatiques qui répondent à des exigences particulières en termes de vitesse et de précision. Ils doivent être suffisamment rapides pour gérer les bibliothèques gigascale. Si l'amarrage d'un composé prend 10 s par cœur de processeur, il faudrait plus de 3 000 ans pour filtrer 1010 composés sur un seul cœur de processeur, ou coûterait environ 1 million de dollars américains sur un cloud informatique aux taux de processeur les moins chers. Dans le même temps, le dépistage à l'échelle gigascale doit être extrêmement précis, protégeant contre les faux positifs qui trompent efficacement la fonction de notation en exploitant ses trous et ses approximations31. Même un taux d'un sur un million de faux positifs dans une bibliothèque de 1010 composés comprendrait 10 000 faux résultats, ce qui peut inonder toute sélection de candidats. Le taux et la nature des artefacts peuvent dépendre de la cible et des algorithmes de dépistage et doivent être soigneusement pris en compte lors du dépistage et du post-traitement. Bien qu'il n'y ait pas de solution simple pour de tels artefacts, certains remèdes pratiques et raisonnablement rentables incluent : (1) la sélection basée sur le consensus de deux fonctions de notation différentes, (2) la sélection de résultats très divers (de nombreux artefacts se regroupent en composés similaires), (3) la couverture des paris à partir de plusieurs plages de scores31 et (4) la conservation manuelle de la liste finale des composés pour toute interaction inhabituelle. En fin de compte, il est hautement souhaitable de corriger autant de «trous dans les fonctions de notation» que possible et de les réoptimiser pour une sélectivité élevée dans la plage de scores où se trouvent les meilleurs vrais hits du gigaspace. Manquer quelques résultats dans le dépistage (faux négatifs) serait bien toléré en raison du grand nombre de résultats potentiels dans l'espace 1010 (par exemple, perdre 50 % d'un million de résultats potentiels est parfaitement acceptable), donc un certain compromis dans la sensibilité du score est acceptable.

Les principaux types d'approches informatiques pour le criblage d'une cible protéique pour des ligands potentiels sont résumés dans le tableau 2. Ci-dessous, nous discutons de certaines technologies émergentes et de la manière dont elles peuvent s'intégrer au mieux dans le pipeline DDD global pour tirer pleinement parti de la croissance des espaces chimiques à la demande.

Le criblage in silico en ancrant les molécules de la bibliothèque virtuelle dans une structure réceptrice et en prédisant son « score de liaison » est une approche bien établie pour frapper et mener la découverte et a joué un rôle clé dans les récents succès de la découverte de médicaments11,17,51. La procédure d'amarrage elle-même peut utiliser la mécanique moléculaire, souvent en représentation de coordonnées internes, pour un échantillonnage conformationnel rapide de ligands entièrement flexibles52,53, en utilisant des approches empiriques d'appariement de forme 3D54,55, ou en les combinant dans un entonnoir d'amarrage hybride56,57. Une attention particulière est consacrée aux fonctions de notation des ligands, qui sont conçues pour éliminer de manière fiable les non-liants afin de minimiser les prédictions faussement positives, ce qui est particulièrement pertinent avec la croissance de la taille de la bibliothèque. Des évaluations à l'aveugle des performances des algorithmes basés sur la structure ont été régulièrement effectuées dans le cadre d'un effort communautaire du D3R Grand Challenge58,59, montrant des améliorations continues dans la pose des ligands et les prédictions d'énergie de liaison pour les meilleurs algorithmes.

Les résultats des nombreuses campagnes de dépistage prospectives basées sur la structure réussies ont été publiés au fil des ans, couvrant toutes les principales classes de cibles, plus récemment les GPCR, comme examiné dans les références. 17,51,60, alors que d'innombrables autres ont été utilisés dans l'industrie. Les ensembles de ligands candidats ciblés, prédits par un tel dépistage, affichent souvent des taux de succès utiles (10 à 40 %) dans les tests expérimentaux60, produisant de nouveaux résultats pour de nombreuses cibles avec des puissances comprises entre 0,1 et 10 μM (pour celles qui sont publiées, au moins). Cependant, d'autres étapes d'optimisation des résultats initiaux obtenus à partir de bibliothèques de criblage standard de moins de 10 millions de composés nécessitent généralement une synthèse personnalisée coûteuse d'analogues, qui n'a été offerte que dans quelques cas publiés20,61.

L'identification des hits directement dans des espaces chimiques beaucoup plus grands tels que REAL Space peut non seulement apporter des hits plus nombreux et meilleurs31, mais également soutenir leur optimisation, car tout hit résultant a des milliers d'analogues et de dérivés dans le même espace à la demande. Cet avantage a été particulièrement utile pour des cibles aussi difficiles que la protéase principale (Mpro) du SRAS-CoV-2, pour laquelle des centaines de tentatives standard de dépistage de ligands virtuels (VLS) se sont soldées par des échecs62 (voir la discussion sur les défis de Mpro dans « Approches hybrides in vitro – in silico » ci-dessous). Bien que les taux de succès initiaux aient été faibles, même sur les écrans ultra-larges, VirtualFlow24 de la base de données REAL avec 1,4 milliard de composés a encore identifié des résultats dans la plage de 10 à 100 µM, qui ont été optimisés via une synthèse à la demande63 pour produire des pistes de qualité avec le meilleur composé Z222979552 (concentration inhibitrice demi-maximale (IC50) = 1,0 μM). Un autre écran ultra-large de 235 millions de composés, basé sur une structure Mpro plus récente avec un inhibiteur non covalent (Protein Data Bank (PDB) ID : 6W63), a également produit des résultats viables, dont l'optimisation rapide a abouti à la découverte d'inhibiteurs Mpro nanomolaires en seulement 4 mois grâce à une combinaison de chimie à la demande et personnalisée simple64. Le meilleur composé de ce travail avait de bonnes propriétés ADMET in vitro, avec une affinité de 38 nM et une puissance antivirale cellulaire de 77 nM, qui sont comparables au PF-07321332 (nirmatrelvir)65 utilisé en clinique.

Avec l'augmentation de la taille des bibliothèques, le temps de calcul et le coût de l'amarrage lui-même deviennent le principal goulot d'étranglement du dépistage, même avec le cloud computing massivement parallèle60. Des approches itératives ont été récemment suggérées pour s'attaquer aux bibliothèques de cette taille ; par exemple, VirtualFlow a utilisé un filtrage pas à pas de l'ensemble de la bibliothèque avec des algorithmes d'amarrage de précision croissante pour cribler environ 1,4 milliard de composés Enamine REAL23,24. Bien qu'elle améliore plusieurs fois la vitesse, la méthode nécessite toujours une bibliothèque entièrement énumérée et son coût de calcul augmente de manière linéaire avec le nombre de composés, limitant son applicabilité dans des espaces chimiques en expansion rapide.

L'idée de concevoir des molécules à partir d'un ensemble limité de fragments pour remplir de manière optimale la poche de liaison au récepteur a été entretenue dès les premières années de la découverte de médicaments, mise en œuvre, par exemple, dans l'algorithme LUDI66. Cependant, la synthèse personnalisée des composés conçus est restée le principal goulot d'étranglement de ces approches. La technologie récemment développée de criblage d'énumération hiérarchique de synthon virtuel (V-SYNTHES)26 applique une conception basée sur des fragments à des espaces chimiques à la demande, évitant ainsi les défis de la synthèse personnalisée (Fig. 3). En commençant par le catalogue des réactions REAL Space et des blocs de construction (synthons), V-SYNTHES prépare d'abord une bibliothèque minimale de fragments chimiques représentatifs en énumérant entièrement les synthons à l'un des points d'attache, en coiffant l'autre position (ou positions) avec un groupe méthyle ou phényle. Le criblage basé sur l'amarrage permet ensuite de sélectionner les fragments les mieux notés (par exemple, les 0,1 % supérieurs) qui devraient bien se lier dans la poche cible. Ceci est répété pour une deuxième position (puis les troisième et quatrième positions, si disponibles), et les bibliothèques ciblées résultantes sont examinées à chaque itération par rapport à la poche cible. À l'étape finale, les quelque 50 000 meilleurs composés complets de REAL Space sont ancrés avec des paramètres ou des méthodes d'amarrage plus élaborés et précis, et les candidats les mieux classés sont filtrés pour la nouveauté, la diversité et la variété des propriétés de type médicament souhaitées. En post-traitement, les 50 à 500 meilleurs composés sont sélectionnés pour la synthèse et les tests. Notre évaluation suggère que combiner des synthons avec les échafaudages et les coiffer avec des groupes minimaux factices dans l'algorithme V-SYNTHES est une exigence essentielle pour des prédictions de fragments optimales, car les groupes réactifs de blocs de construction et d'échafaudages créent souvent des interactions fortes, mais fausses, qui ne sont pas présentes dans la molécule complète. Une autre partie importante de l'algorithme est l'évaluation de la pose de liaison de fragment dans la cible, qui donne la priorité aux coups avec des plafonds minimaux pointés dans une région de la poche où le fragment a de l'espace pour se développer.

Un aperçu de l'algorithme V-SYNTHES permettant un criblage efficace de plus de 31 milliards de composés dans REAL Space ou même dans des espaces chimiques plus grands, tout en effectuant l'énumération et l'amarrage de seulement de petites fractions de molécules. L'algorithme, illustré ici à l'aide d'une réaction à deux composants basée sur un échafaudage de sulfonamide avec des synthons R1 et R2, peut être appliqué à des centaines de réactions optimisées à deux composants, à trois composants ou à plusieurs composants en répétant de manière itérative les étapes 3 et 4 jusqu'à ce que des molécules entièrement énumérées correspondant de manière optimale à la poche cible soient obtenues. PAINS, composés d'interférence de dosage pan.

Initialement appliqué pour découvrir de nouveaux chémotypes pour les antagonistes des récepteurs cannabinoïdes CB2, V-SYNTHES a montré un taux de réussite de 23 % pour les ligands submicromolaires, qui a quintuplé le taux de réussite du VLS standard, tout en prenant environ 100 fois moins de ressources informatiques26. Un taux de succès similaire a été trouvé pour le criblage de la kinase ROCK1 dans la même étude, avec un succès dans la gamme nanomolaire inférieure26. V-SYNTHES est appliqué à d'autres cibles thérapeutiquement pertinentes avec des structures de poches bien définies.

Une approche similaire, l'amarrage spatial chimique, a été mise en œuvre par BioSolveIT, jusqu'à présent pour les réactions à deux composants67. Cette méthode est encore plus rapide, car elle ancre des fragments de blocs de construction individuels, puis les énumère avec des échafaudages et d'autres synthons. Cependant, il existe des compromis pour la vitesse supplémentaire : l'amarrage de fragments plus petits sans échafaudages est moins fiable, et leurs groupes réactifs ont souvent des propriétés différentes du produit de réaction. Cela peut introduire de fortes interactions avec les récepteurs qui ne sont pas pertinentes pour le composé final et peuvent égarer la sélection des fragments. Cela est particulièrement vrai pour les réactions de cycloaddiction et les échafaudages à trois composants, qui nécessitent une validation supplémentaire dans l'amarrage spatial chimique.

En plus de soutenir l'abondance, la diversité chimique et la qualité potentielle des hits, les approches modulaires basées sur la structure sont particulièrement efficaces pour identifier les hits avec une nouveauté chimique robuste, car elles (1) ne reposent pas sur des informations sur les ligands existants et (2) identifient des ligands qui n'ont jamais été synthétisés auparavant. Il s'agit d'un facteur important pour assurer la brevetabilité de la matière chimique pour les composés à succès et les séries de têtes de série issues du criblage à l'échelle giga. De plus, des milliers d'analogues facilement synthétisables assurent un vaste catalogue SAR pour les meilleurs hits, ce qui, par exemple, a permis une amélioration de la puissance et de la sélectivité d'environ 100 fois pour les hits CB2 V-SYNTHES26. La disponibilité des extensions d'espace chimique multicouches à la demande (par exemple, prises en charge par les blocs de construction MADE47) peut également considérablement rationaliser les prochaines étapes de l'optimisation des pistes grâce au « MedChem virtuel », réduisant ainsi la synthèse personnalisée extensive.

À l'ère de la reconnaissance faciale basée sur l'IA, ChatGPT et AlphaFold68, il existe un énorme intérêt pour les applications d'approches DL basées sur les données dans la découverte de médicaments, de l'identification des cibles à l'optimisation des pistes en passant par la médecine translationnelle (comme examiné dans les réf. 69, 70, 71).

Les approches basées sur les données ont une longue histoire dans la découverte de médicaments, dans laquelle les algorithmes ML tels que la machine à vecteurs de support, la forêt aléatoire et les réseaux de neurones ont été largement utilisés pour prédire les propriétés des ligands et les activités ciblées, bien qu'avec des résultats mitigés. Des modèles précis de relation quantitative structure-propriété (QSPR) peuvent prédire les propriétés physicochimiques (par exemple, la solubilité et la lipophilie) et pharmacocinétiques (par exemple, la biodisponibilité et la pénétration de la barrière hémato-encéphalique), dans lesquelles de vastes et vastes ensembles de données expérimentales pour la formation de modèles sont disponibles et continuent de croître72,73,74. Le ML est également implémenté dans de nombreux algorithmes SAR quantitatifs (QSAR)75, dans lesquels l'ensemble d'apprentissage et les modèles résultants sont axés sur une cible donnée et un échafaudage chimique, aidant à guider l'affinité et l'optimisation de la puissance du plomb. Des méthodes basées sur de vastes ensembles de données de liaison ligand-cible, le regroupement de similarités chimiques et des approches basées sur le réseau ont également été suggérées pour la réutilisation des médicaments76,77.

L'avènement du DL fait passer les modèles basés sur les données à un niveau supérieur, permettant l'analyse d'ensembles de données beaucoup plus vastes et diversifiés tout en dérivant des relations non linéaires plus complexes, avec une vaste littérature décrivant des méthodologies et des applications DL spécifiques à la découverte de médicaments27,70. De par sa nature « d'apprentissage à partir d'exemples », l'IA nécessite des ensembles de données complets sur les ligands pour entraîner les modèles prédictifs. Pour QSPR, de grandes bases de données publiques et privées ont été accumulées, avec diverses propriétés telles que la solubilité, la lipophilie ou des proxies in vitro pour la biodisponibilité orale et la perméabilité cérébrale mesurées expérimentalement pour plusieurs milliers de composés divers, permettant la prédiction de ces propriétés dans une large gamme de nouveaux composés.

La qualité des modèles QSAR diffère cependant pour différentes classes cibles en fonction de la disponibilité des données, les progrès les plus importants étant réalisés pour la superfamille des kinases et les GPCR aminergiques. Une référence impartiale des meilleurs modèles ML QSAR a été donnée par un récent IDG-DREAM Drug-Kinase Binding Prediction Challenge avec la participation de plus de 200 experts78. Les principaux modèles prédictifs de cette évaluation à l'aveugle comprenaient l'apprentissage du noyau, l'amplification de gradient et les algorithmes basés sur DL. Le modèle le plus performant (de l'équipe QED) a utilisé une régression du noyau, une similarité de séquence protéique et des valeurs d'affinité de plus de 60 000 paires composé-kinase entre 13 608 composés et 527 kinases des bases de données ChEMBL79 et Drug Target Commons80 comme données d'entraînement. Le meilleur modèle DL utilisait jusqu'à 900 000 points de données expérimentaux de liaison de ligand pour la formation, mais restait à la traîne du modèle de noyau beaucoup plus simple en termes de performances. Les meilleurs modèles ont atteint un coefficient de rang de Spearman de 0,53 avec une erreur quadratique moyenne de 0,95 pour les valeurs de pKd prédites par rapport aux valeurs expérimentales dans l'ensemble de défis. Une telle précision s'est avérée comparable à la précision et au rappel des tests expérimentaux en un seul point pour l'inhibition de la kinase, et peut être utile dans les criblages pour les résultats initiaux pour les kinases moins explorées et pour guider l'optimisation des pistes. Notez, cependant, que la famille des kinases est unique car il s'agit de la plus grande classe de plus de 500 cibles, toutes possédant des poches de liaison orthostériques similaires et partageant une sélectivité croisée élevée. La seconde famille distante à réactivité croisée systématique comprend environ 50 GPCR aminergiques, alors que les autres familles de GPCR et les autres familles de protéines à réactivité croisée sont beaucoup plus petites. La performance et la généralisabilité des méthodes ML et DL pour ces cibles et d'autres restent à tester.

Le développement de modèles largement généralisables ou même universels est l'aspiration clé de la découverte de médicaments basée sur l'IA. L'une des directions ici est d'extraire des modèles généraux d'affinités de liaison (fonctions de score de liaison) à partir de données sur les activités de ligand connues et les structures 3D protéine-ligand correspondantes, par exemple, collectées dans la base de données PDBbind81 ou obtenues à partir de l'amarrage. Ces modèles explorent diverses approches pour représenter les données et les architectures de réseau, y compris les modèles spatiaux de graphe convolutif82,83, les réseaux de neurones à convolution profonde 3D84,85 ou leurs combinaisons86. Une étude récente a cependant révélé que, quelle que soit l'architecture du réseau de neurones, une description explicite des interactions intermoléculaires non covalentes dans les complexes PDBbind ne fournit aucun avantage statistique par rapport à des approximations plus simples de ligand uniquement ou de récepteur uniquement qui omettent les interactions87. Par conséquent, les bonnes performances des modèles DL basés sur PDBbind reposent sur la mémorisation de ligands et de récepteurs similaires, plutôt que sur la capture d'informations générales sur leur liaison. Une explication possible de ce phénomène est que la base de données PDBbind n'a pas une présentation adéquate de «l'espace négatif», c'est-à-dire des ligands avec des modèles d'interaction sous-optimaux pour appliquer la formation.

Cet incident illustre la nécessité d'une meilleure compréhension du comportement des modèles DL et de leur dépendance vis-à-vis des données d'entraînement, ce qui est largement reconnu dans la communauté de l'IA. Il a été démontré que les modèles DL, en particulier basés sur des ensembles de données limités dépourvus de données négatives, sont sujets au surentraînement et à des performances erronées, conduisant parfois à des classes entières de modèles jugés "inutiles"88 ou gravement biaisés par des facteurs subjectifs définissant l'ensemble de données d'apprentissage89. Des outils statistiques sont en cours de développement pour définir la plage d'applicabilité et valider soigneusement les performances des modèles. L'un des concepts proposés est le cadre de prévisibilité, de calculabilité et de stabilité pour la « science des données véridiques »90. Une sélection adéquate de données de qualité a été spécifiquement identifiée par les dirigeants de la communauté de l'IA comme la principale exigence pour combler le "fossé de production", ou l'incapacité des modèles ML à réussir lorsqu'ils sont déployés dans le monde réel, appelant ainsi à une approche de l'IA centrée sur les données91,92. Il y a également eu des tentatives de développement d'outils pour rendre l'IA « explicable », c'est-à-dire capable de formuler certaines tendances générales dans les données, en particulier dans les applications de découverte de médicaments93.

Malgré ces défis et limitations, l'IA commence déjà à avoir un effet substantiel sur la découverte de médicaments, les premiers candidats-médicaments basés sur l'IA faisant leur entrée dans les études précliniques et cliniques. Pour les kinases, les composés induits par l'IA ont été signalés comme des inhibiteurs in vivo puissants et efficaces du récepteur tyrosine kinase DDR1, qui est impliqué dans la fibrose9. Des essais cliniques de phase I ont été annoncés pour ISM001-055 (également appelé INS018_055) pour le traitement de la fibrose pulmonaire idiopathique10, bien que l'identité du composé et sa cible n'aient pas été divulguées. Pour les RCPG, des composés pilotés par l'IA ciblant les récepteurs 5-HT1A, doubles 5-HT1A–5-HT2A et A2A sont récemment entrés dans les essais cliniques, apportant un soutien supplémentaire au concept de découverte de médicaments piloté par l'IA. Ces premières réussites proviennent de familles de kinases et de GPCR avec une pharmacologie déjà bien étudiée, et les composés présentent une similitude chimique étroite avec les échafaudages connus à haute affinité94. Il est important que la prochaine génération de candidats-médicaments DL s'améliore en termes de nouveauté et d'applicabilité.

Comme indiqué ci-dessus, les approches basées sur la physique et axées sur les données présentent des avantages et des limites distincts dans la prédiction de la puissance du ligand. Les prédictions d'amarrage basées sur la structure sont naturellement généralisables à toute cible avec des structures 3D et peuvent être plus précises, en particulier en éliminant les faux positifs comme principal défi du dépistage. À l'inverse, les méthodes basées sur les données peuvent fonctionner à la place des structures et peuvent être plus rapides, en particulier avec l'accélération GPU, bien qu'elles aient du mal à se généraliser au-delà des classes de cibles riches en données. Par conséquent, de nombreux efforts sont en cours pour combiner les approches basées sur la physique et les approches basées sur les données de manière synergique en général95, et dans la découverte de médicaments en particulier96.

Dans les approches de dépistage virtuel, une utilisation synergique de l'amarrage basé sur la physique avec des fonctions de notation basées sur les données peut être très bénéfique. De plus, si les fonctions de notation basées sur la physique et basées sur les données sont relativement indépendantes et génèrent toutes deux un enrichissement dans les bibliothèques ciblées sélectionnées, leur combinaison peut réduire les taux de faux positifs et améliorer la qualité des résultats. Cette synergie se reflète dans les derniers résultats du 3DR Grand Challenge 4 pour les prédictions ligand IC5059, dans lesquelles les meilleures méthodes qui utilisaient une combinaison de notation basée sur la physique et ML ont surpassé celles qui n'utilisaient pas ML. À l'avenir, une analyse comparative approfondie des approches basées sur la physique, ML et hybrides sera au cœur d'une nouvelle évaluation critique des expériences informatiques de recherche de coups (CACHE), qui évaluera cinq scénarios spécifiques pertinents pour la découverte et l'optimisation pratiques des coups et des pistes97.

À un niveau plus profond, les résultats d'un amarrage précis basé sur la physique (en plus des données expérimentales, par exemple, de PDBbind81) peuvent être utilisés pour former un graphique généralisé ou des modèles 3D DL prédisant l'affinité ligand-récepteur. Cela aiderait à élargir considérablement l'ensemble de données d'entraînement et à équilibrer les exemples positifs et négatifs (liaison sous-optimale), ce qui est important pour éviter les problèmes de surentraînement décrits dans la réf. 87. De telles fonctions de notation 3D basées sur DL pour prédire l'affinité de liaison moléculaire à partir d'un complexe protéine-ligand amarré sont en cours de développement et de référence, plus récemment RTCNN98, bien que leur utilité pratique reste à démontrer.

Pour étendre la gamme d'applicabilité de l'amarrage basé sur la structure aux cibles dépourvues de structures à haute résolution, il est également tentant d'utiliser des modèles 3D AlphaFold2 (réf. 99,100) ou RosettaFold101 dérivés de l'IA, qui s'avèrent déjà utiles dans de nombreuses applications, y compris l'amarrage protéine-protéine et protéine-peptide102. Les modèles d'homologie traditionnels basés sur une similarité étroite des protéines, en particulier lorsqu'ils sont raffinés avec des ligands connus103, ont été utilisés dans l'amarrage de petites molécules et le criblage virtuel104. Par conséquent, AlphaFold2 devrait élargir davantage la portée de la modélisation structurelle et sa précision. Dans un rapport récent, les modèles AlphaFold2, complétés par d'autres approches d'IA, ont permis d'identifier une petite molécule inhibitrice de la kinase 20 dépendante de la cycline (CDK20), bien qu'à une affinité modeste de 8,9 μM (réf. 105). Une analyse comparative plus générale des performances des modèles AlphaFold2 dans le criblage virtuel donne cependant des résultats mitigés. Dans un benchmark axé sur des cibles avec des structures cristallines existantes, la plupart des modèles AlphaFold2 ont dû être nettoyés des boucles bloquant la poche de liaison et/ou augmentés avec des ions connus ou d'autres cofacteurs pour obtenir un enrichissement raisonnable des hits106. Pour les cas plus pratiques de cibles dépourvues de structures expérimentales, en particulier pour les classes de cibles présentant des homologies structurelles moins évidentes dans la poche de liaison au ligand, les performances des modèles AlphaFold2 dans l'amarrage de petites molécules ont montré des résultats décevants lors d'évaluations récentes pour les GPCR et les cibles antibactériennes107,108. L'approche AphaFill109 récemment développée pour «transplanter» des cofacteurs et des ligands de petites molécules à partir de structures PDB vers des modèles AlphaFold2 homologues peut potentiellement aider à valider et à optimiser ces modèles, bien qu'une évaluation plus approfondie de leur utilité pour l'amarrage et le criblage virtuel soit en cours.

Pour accélérer le criblage virtuel des bibliothèques chimiques ultra-larges, plusieurs groupes ont suggéré des approches itératives hybrides, dans lesquelles les résultats de l'amarrage basé sur la structure d'un sous-ensemble de bibliothèque clairsemé sont utilisés pour former des modèles ML, qui sont ensuite utilisés pour filtrer l'ensemble de la bibliothèque afin de réduire davantage sa taille. Ces méthodes, y compris MolPal25, Active Learning110 et DeepDocking111, rapportent une réduction allant jusqu'à 14 à 100 du coût de calcul pour les bibliothèques de 1,4 milliard de composés, bien qu'il ne soit pas clair comment elles s'adapteraient à des espaces chimiques en croissance rapide.

Nous devons souligner ici que les fonctions de notation dans les algorithmes d'amarrage rapide et les modèles ML sont principalement conçues et formées pour séparer efficacement les liants cibles potentiels des non-liants, bien qu'elles ne soient pas très précises dans les prédictions des affinités ou des puissances de liaison. Pour des prédictions de puissance plus précises, la plus petite bibliothèque ciblée de liants candidats sélectionnés par l'IA initiale ou le dépistage basé sur l'amarrage peut être analysée et classée plus en détail à l'aide d'outils basés sur la physique plus élaborés, y compris des méthodes de perturbation de l'énergie libre pour l'énergie libre relative112 et absolue113,114,115 de la liaison du ligand. Bien que ces méthodes soient beaucoup plus lentes, l'utilisation de calculs accélérés par GPU28 offre le potentiel d'une application plus large dans le post-traitement des campagnes de sélection virtuelles pour enrichir davantage les taux de réussite des candidats à haute affinité (Fig. 2), ainsi que dans les étapes d'optimisation des leads.

L'avènement de méthodes rapides et pratiques de criblage d'espaces chimiques à grande échelle pour la découverte de médicaments stimule la croissance de ces espaces à la demande, favorisant une meilleure diversité et la qualité globale des résultats et des pistes identifiés. Spécifiquement développée pour le criblage V-SYNTHES, l'extension xREAL d'Enamine REAL Space comprend désormais 173 milliards de composés116, et peut être étendue à 1015 composés et au-delà en puisant dans un ensemble de blocs de construction encore plus grand (par exemple, à 680 millions de blocs de construction MADE47), en incluant des échafaudages à quatre ou cinq composants et en utilisant de nouvelles chimies de type clic au fur et à mesure de leur découverte. Les tests dans le monde réel de REAL Space amélioré par MADE et d'autres espaces chimiques commerciaux et exclusifs permettront une évaluation plus large de leur synthétisabilité et de leur utilité globale38,117,118. En parallèle, des bibliothèques ultra-larges spécialisées peuvent être construites pour d'importants échafaudages sous-représentés dans les espaces à la demande à usage général, par exemple, le criblage d'une bibliothèque virtuelle de 75 millions de tétrahydropyridines facilement synthétisables a récemment produit de puissants agonistes du récepteur 5-HT2A119.

La poursuite de la croissance de la taille et de la diversité de l'espace chimique à la demande est également soutenue par le développement récent de nouvelles réactions robustes pour l'assemblage en clic de blocs de construction. En plus de la chimie de clic de cycloaddition azoture-alcyne « classique »120, reconnue par le prix Nobel de chimie 2022121, et des réactions de type clic optimisées, y compris SuFEx122, des développements plus récents tels que le couplage croisé doublement décarboxylatif électrocatalysé au Ni123 sont prometteurs. D'autres réactions de formation de carbone-carbone utilisent des boronates d'acide méthyliminodiacétique pour les couplages Csp2-Csp2124, et plus récemment des boronates d'acide tétraméthyl N-méthyliminodiacétique125 pour la formation de liaisons stéréospécifiques Csp3-C. Chacune de ces réactions appliquées de manière itérative peut générer de nouveaux espaces chimiques à la demande de milliards de composés divers fonctionnant avec un nombre limité de blocs de construction. Semblable à l'assemblage automatique d'acides aminés couramment utilisé dans la synthèse des peptides, des processus entièrement automatisés pourraient être réalisés avec des robots capables de produire une bibliothèque de composés de type médicament à la demande en utilisant des combinaisons de quelques milliers de blocs de construction divers126,127,128. Ces machines fonctionnent déjà, bien que l'augmentation de la production de milliers de blocs de construction spécialisés reste le goulot d'étranglement.

Le développement d'espaces chimiques génératifs plus robustes peut également être soutenu par de nouvelles approches informatiques en chimie de synthèse, par exemple, des prédictions de nouvelles séquences de réactions itératives129 ou des voies de synthèse et la faisabilité à partir d'une analyse rétrosynthétique basée sur DL130. Dans les modèles génératifs, les prédictions de synthétisabilité peuvent être couplées à des prédictions de puissance et d'autres propriétés vers des niveaux plus élevés de conception chimique automatisée131. Ainsi, les réseaux antagonistes génératifs combinés à l'apprentissage par renforcement (GAN-RL) ont été récemment utilisés pour prédire la faisabilité synthétique, la nouveauté et l'activité biologique des composés, permettant le cycle itératif d'optimisation in silico, de synthèse et de test des ligands in vitro50,132. Lorsqu'elles sont appliquées dans un ensemble de réactions bien établies et de classes de cibles explorées sur le plan pharmacologique, ces approches donnent déjà des résultats et des pistes utiles, menant à des candidats cliniques50,132. Cependant, le potentiel plus large des concepts de conception chimique automatisés et de la synthèse robotique dans la découverte de médicaments reste à voir.

Bien que l'analyse comparative à l'aveugle et les récentes réussites de dépistage prospectif pour le nombre croissant de cibles soutiennent l'utilité des outils informatiques modernes, il existe des classes entières de cibles difficiles, dans lesquelles les approches de dépistage in silico existantes ne devraient pas très bien fonctionner par elles-mêmes. Certains des cas les plus difficiles sont des cibles avec des poches cryptiques ou peu profondes qui doivent s'ouvrir ou subir un ajustement induit substantiel pour engager le ligand, comme on le trouve souvent lors du ciblage de sites allostériques, par exemple, dans les kinases ou les GPCR, ou des interactions protéine-protéine dans les voies de signalisation.

Bien que les approches de bioinformatique et de dynamique moléculaire puissent aider à détecter et à analyser les poches allostériques et cryptiques133, les outils informatiques seuls sont souvent insuffisants pour soutenir la découverte de ligands pour des sites aussi difficiles. Les poches cryptiques et peu profondes, cependant, ont été gérées avec succès par des approches de découverte de médicaments basées sur des fragments, qui commencent par un criblage expérimental pour la liaison de petits fragments. Les résultats initiaux sont trouvés par des méthodes très sensibles, telles que BIACORE, RMN, rayons X134,135 et potentiellement cryo-microscopie électronique136, pour détecter de manière fiable une liaison faible, généralement dans la gamme 10-100-μM. Le criblage initial de la cible peut également être réalisé avec des fragments décorés par une ogive chimique permettant la fixation covalente de proximité d'un ligand de faible affinité137. Dans les deux cas, l'élaboration de fragments initiaux en ligands de haute affinité est le principal goulot d'étranglement de la découverte de médicaments à base de fragments, qui nécessite un effort majeur impliquant la « croissance » du fragment ou la liaison de deux ou plusieurs fragments ensemble. Il s'agit généralement d'un processus itératif impliquant la conception et la synthèse de ligands personnalisés qui peut prendre de nombreuses années134,138. Dans le même temps, le criblage virtuel basé sur la structure peut aider à élaborer par ordinateur les fragments pour correspondre à la conformation identifiée expérimentalement de la poche de liaison cible. Plus rentable, cette approche peut être appliquée lorsque les occurrences de fragments sont identifiées à partir des blocs de construction de l'espace à la demande ou de leurs analogues proches pour une élaboration facile dans le même espace à la demande139.

Les exemples récents d'approches de conception informatique basées sur des fragments hybrides ciblant les inhibiteurs du SRAS-CoV-2 mettent en évidence les défis présentés par de telles cibles et permettent des comparaisons directes avec des VLS ultra-larges. L'une des études visait l'enzyme de macrodomaine conservée par le SRAS-CoV-2 NSP3 (Mac1), qui est une cible essentielle pour la pathogenèse et la létalité du virus. S'appuyant sur la détection cristallographique des fragments de faible affinité (180 μM) se liant faiblement à Mac1 (réf. 139), la fusion des fragments a identifié un hit de 1 μM, rapidement optimisé par synthèse de catalogue vers un plomb de 0,4 μM140. Dans la même étude, un criblage à très grande échelle de 400 millions de bases de données REAL a identifié plus de 100 nouveaux chémotypes divers de ligands de type médicament, avec une optimisation de suivi SAR par catalogue donnant une avance de 1,7 μM140. Pour la protéase principale Mpro du SRAS-CoV-2, l'initiative COVID Moonshot a publié les résultats du criblage cristallographique de 1 500 petits fragments avec 71 hits liés dans différentes sous-poches du site actif peu profond, bien qu'aucun d'entre eux ne montre d'inhibition in vitro de la protéase même à 100 μM (réf. 141). De nombreux groupes collaborant à la conception informatique de suivi et au criblage de fragments fusionnés et en croissance ont permis de découvrir plusieurs séries SAR, y compris un inhibiteur Mpro non covalent avec une IC50 enzymatique de 21 μM. Une optimisation supplémentaire par des approches informatiques basées sur la structure et sur l'IA, qui utilisaient plus de 10 millions de blocs de construction MADE Enamine, a conduit à la découverte de candidats précliniques avec une IC50 basée sur les cellules dans la plage d'environ 100 nM, approchant la puissance du nirmatrelvir65. L'ampleur, l'urgence et la complexité énormes de cet effort Moonshot avec plus de 2 400 composés synthétisés à la demande et mesurés dans plus de 10 000 tests sont sans précédent et cela met en évidence les défis de la conception de novo d'inhibiteurs non covalents de Mpro.

Au-delà de l'initiative Moonshot, un flot d'efforts de dépistage virtuel a donné des résultats pour la plupart décevants62, par exemple, le médicament antipaludique ebselen, qui a été proposé dans un premier dépistage virtuel142, a échoué dans les essais cliniques. Cependant, la plupart de ces études ont examiné des ensembles de petits ligands axés sur la réutilisation de médicaments existants, manquaient de support expérimental et utilisaient la première structure de Mpro résolue dans un complexe de ligand covalent (PDB ID : 6LU7) qui était sous-optimal pour l'amarrage de molécules non covalentes142.

En comparaison, plusieurs études criblant des bibliothèques ultra-larges ont pu identifier des inhibiteurs de Mpro non covalents de novo dans la plage de 10 à 100 μM24, 62, 63, 143, tout en testant expérimentalement seulement quelques centaines de composés synthétisés à la demande. L'une de ces études a approfondi ces faibles succès VLS en testant leurs analogues à la demande d'Enamine, en révélant une piste avec IC50 = 1 μM dans des tests cellulaires et en validant cristallographiquement sa liaison non covalente63. Une autre étude basée sur une structure co-cristalline non covalente ultérieure et plus appropriée de Mpro (PDB ID : 6W63) a utilisé une stratégie d'amarrage et d'optimisation ultra-large pour découvrir des composés de plomb de 38 nM encore plus puissants64. Notez que, bien que les résultats des projections initiales ultra-larges pour Mpro aient été modestes, ils étaient à égalité avec les efforts beaucoup plus élaborés et coûteux de l'approche hybride Moonshot, avec une simple optimisation à la demande conduisant à des candidats précliniques de qualité similaire. Ces exemples suggèrent que même pour les poches peu profondes difficiles, le criblage virtuel basé sur la structure peut souvent fournir une alternative viable lorsqu'il est effectué à grande échelle et soutenu par des structures précises, des tests suffisants et un effort d'optimisation.

Avec tous les défis et mises en garde, la capacité émergente des outils in silico à exploiter efficacement l'énorme abondance et la diversité des espaces chimiques à la demande de type médicamenteux aux étapes clés de la cible à atteindre à conduire à la clinique rend tentant d'appeler à la transformation de l'écosystème DDD d'assisté par ordinateur à piloté par ordinateur144 (Fig. 4). Au stade précoce de l'identification des résultats, les approches de dépistage virtuel à très grande échelle, à la fois basées sur la structure et basées sur l'IA, se généralisent pour fournir des points d'entrée rapides et rentables dans les campagnes de découverte de médicaments. Au stade du hit-to-lead, les outils de prédiction de puissance plus élaborés tels que la perturbation de l'énergie libre et le QSAR basé sur l'IA guident souvent l'optimisation rationnelle de la puissance du ligand. Au-delà de la puissance et de la sélectivité ciblées, divers outils de calcul basés sur les données sont couramment utilisés dans l'optimisation multiparamètre de la série de pistes qui inclut les propriétés ADMET et PK. Il convient de noter que les espaces chimiques de plus de 1010 composés divers sont susceptibles de contenir des millions de résultats initiaux pour chaque cible20 (Encadré 1), des milliers de pistes puissantes et sélectives et, avec une chimie médicinale limitée dans le même espace chimique hautement traitable, des candidats-médicaments prêts pour les études précliniques. Pour exploiter ce potentiel, les outils informatiques doivent devenir plus robustes et mieux intégrés dans le pipeline global de découvertes pour assurer leur impact dans la traduction des succès initiaux en développement préclinique et clinique.

Comparaison schématique du pipeline de découverte basé sur la synthèse HTS standard et personnalisé par rapport au pipeline piloté par le calcul. Ce dernier est basé sur des espaces chimiques virtuels à la demande ou génératifs facilement accessibles, ainsi que sur des outils de calcul basés sur la structure et sur l'IA qui rationalisent chaque étape du processus de découverte de médicaments.

Il ne faut pas oublier ici que tout modèle informatique, aussi utile ou précis soit-il, ne peut jamais garantir que toutes les prédictions sont correctes. En pratique, les meilleures campagnes de criblage virtuel aboutissent à 10 à 40% de succès candidats confirmés en validation expérimentale, alors que les meilleures prédictions d'affinité utilisées dans l'optimisation ont rarement une précision meilleure que 1 kcal mol-1 erreur quadratique moyenne. Des limitations similaires s'appliquent aux modèles de calcul actuels prédisant les propriétés ADMET et PK. Par conséquent, les prédictions informatiques nécessitent toujours une validation expérimentale dans des essais in vitro et in vivo robustes à chaque étape du pipeline. Dans le même temps, les tests expérimentaux des prédictions fournissent également des données qui peuvent contribuer à améliorer la qualité des modèles en élargissant leurs ensembles de données de formation, en particulier pour les prédictions des propriétés du ligand. Ainsi, les modèles QSPR basés sur DL bénéficieront grandement de l'accumulation de données supplémentaires dans les tests de perméabilité cellulaire tels que CACO-2 et MDCK, ainsi que de nouvelles technologies avancées telles que les organes sur puce ou les organoïdes fonctionnels pour fournir de meilleures estimations des propriétés ADMET et PK sans expériences in vivo fastidieuses. La capacité de former des modèles ADMET et PK avec des données de test in vitro représentant les espèces les plus pertinentes pour le développement de médicaments (généralement souris, rat et humain) aiderait également à aborder la variabilité des espèces comme un défi majeur pour des études translationnelles réussies. Tout cela crée un cercle vertueux pour améliorer les modèles informatiques au point où ils peuvent piloter la sélection composée pour la plupart des points finaux DDD. Combiné à des tests in vitro plus précis, cela peut réduire et éventuellement éliminer les exigences en matière de tests sur les animaux (comme l'a récemment indiqué la FDA)145.

La construction de pipelines hybrides in silico-in vitro avec un accès facile à l'énorme espace chimique à la demande à toutes les étapes du processus gène-à-tête peut aider à générer des pools abondants de divers composés principaux avec une puissance, une sélectivité et des propriétés ADMET et PK optimales, ce qui entraîne moins de compromis dans l'optimisation multiparamètre pour les candidats cliniques. L'exécution de tels pipelines basés sur des calculs riches en données nécessite des outils de gestion de données globaux pour la découverte de médicaments, dont beaucoup sont mis en œuvre dans des centres DDD pharmaceutiques et universitaires146,147. La construction de pipelines pilotés par calcul aidera également à révéler les liens faibles ou manquants, dans lesquels de nouvelles approches et des données supplémentaires peuvent être nécessaires pour générer des modèles améliorés, aidant ainsi à combler les lacunes de calcul restantes dans le pipeline DDD. Pourvu que cette intégration systématique se poursuive, la découverte de ligands pilotée par ordinateur a un grand potentiel pour réduire les barrières à l'entrée pour générer des molécules pour de nombreuses pistes de recherche, qu'il s'agisse de sondes in vivo pour des cibles nouvelles et sous-étudiées148, de polypharmacologie et de signalisation pluridimensionnelle, ou de médicaments candidats pour les maladies rares et la médecine personnalisée.

Austin, D. & Hayford, T. Recherche et développement dans l'industrie pharmaceutique. CBO https://www.cbo.gov/publication/57126 (2021).

Sun, D., Gao, W., Hu, H. & Zhou, S. Pourquoi 90 % du développement clinique de médicaments échoue et comment l'améliorer ? Acta Pharma. Péché. B 12, 3049–3062 (2022).

Article CAS PubMed PubMed Central Google Scholar

Bajorath, J. Découverte de médicaments assistée par ordinateur. F1000Rés. 4, F1000 Faculté Rev-1630 (2015).

Article Google Scholar

Van Drie, JH Conception de médicaments assistée par ordinateur : les 20 prochaines années. J. Comput. Aidé Mol. Dés. 21, 591–601 (2007).

Article ADS CAS PubMed Google Scholar

Talele, TT, Khedkar, SA & Rigby, AC Applications réussies de la découverte de médicaments assistée par ordinateur : faire passer les médicaments du concept à la clinique. Courant. Haut. Méd. Chim. 10, 127-141 (2010).

Article CAS PubMed Google Scholar

Macalino, SJY, Gosu, V., Hong, S. & Choi, S. Rôle de la conception de médicaments assistée par ordinateur dans la découverte de médicaments modernes. Cambre. Pharmacienne. Rés. 38, 1686-1701 (2015).

Article CAS Google Scholar

Sabe, VT et al. Tendances actuelles de la conception de médicaments assistée par ordinateur et point culminant des médicaments découverts via des techniques informatiques : une revue. EUR. J. Med. Chim. 224, 113705 (2021).

Article CAS PubMed Google Scholar

Jayatunga, MK, Xie, W., Ruder, L., Schulze, U. & Meier, C. AI dans la découverte de médicaments à petites molécules : une vague à venir. Nat. Rev. Drug Discov. 21, 175-176 (2022).

Article CAS PubMed Google Scholar

Zhavoronkov, A. et al. L'apprentissage en profondeur permet une identification rapide des puissants inhibiteurs de la kinase DDR1. Nat. Biotechnol. 37, 1038-1040 (2019). Cette étude revendique la découverte d'un candidat principal en seulement 21 jours, en utilisant l'IA générative, la synthèse et les tests in vitro et in vivo des composés.

Article CAS PubMed Google Scholar

Bibliothèque nationale de médecine des États-Unis. ClinicalTrials.gov https://clinicaltrials.gov/ct2/show/NCT05154240#contactlocation (2022).

Schrödinger. Schrödinger annonce l'approbation par la FDA d'une demande de nouveau médicament expérimental pour le SGR-1505, un inhibiteur de MALT1. Schrodinger https://ir.schrodinger.com/node/8621/pdf (2022). Ce communiqué de presse indique que les méthodes combinées basées sur la physique et ML ont permis un criblage informatique de 8,2 milliards de composés et la sélection d'un candidat clinique après 10 mois et seulement 78 molécules synthétisées.

Jones, N. Cristallographie : secrets atomiques. Nature 505, 602–603 (2014).

Article ADS CAS PubMed Google Scholar

Liu, W. et al. Cristallographie femtoseconde en série des récepteurs couplés aux protéines G. Sciences 342, 1521-1524 (2013).

Article ADS CAS PubMed PubMed Central Google Scholar

Nannenga, BL & Gonen, T. La diffraction d'électrons microcristallins de la méthode cryo-EM (MicroED). Nat. Méthodes 16, 369–379 (2019).

Article CAS PubMed PubMed Central Google Scholar

Fernandez-Leiro, R. & Scheres, SH Démêler les macromolécules biologiques avec la cryo-microscopie électronique. Nature 537, 339-346 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Renaud, J.-P. et coll. Cryo-EM dans la découverte de médicaments : acquis, limites et perspectives. Nat. Rev. Drug Discov. 17, 471–492 (2018).

Article CAS PubMed Google Scholar

Congreve, M., de Graaf, C., Swain, NA & Tate, CG Impact des structures GPCR sur la découverte de médicaments. Cellule 181, 81–91 (2020).

Article CAS PubMed Google Scholar

Santos, R. et al. Une carte complète des cibles moléculaires des médicaments. Nat. Rev. Drug Discov. 16, 19–34 (2017).

Article CAS PubMed Google Scholar

Grygorenko, OO et al. Génération d'un espace chimique de plusieurs milliards de composés de criblage facilement accessibles. iScience 23, 101681 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Lyu, J. et al. Station d'accueil de bibliothèque ultra-large pour découvrir de nouveaux chémotypes. Nature 566, 224-229 (2019). Cette étude d'amarrage ultra-large a également soigneusement évalué les avantages et les pièges potentiels de l'expansion de l'espace chimique.

Article ADS CAS PubMed PubMed Central Google Scholar

Stein, RM et al. Découverte virtuelle de ligands des récepteurs de la mélatonine pour moduler les rythmes circadiens. Nature 579, 609–614 (2020). Cette étude montre un amarrage ultra-large qui a entraîné des résultats sous-nanomolaires pour un GPCR.

Article ADS CAS PubMed PubMed Central Google Scholar

Alon, A. et al. Les structures du récepteur sigma2 permettent l'amarrage pour la découverte de ligands bioactifs. Nature 600, 759–764 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Une plate-forme de découverte de médicaments open source permet des écrans virtuels ultra-larges. Nature 580, 663–668 (2020). Cette étude montre un filtrage de bibliothèque itératif comme première approche pour accélérer le criblage virtuel ultra-large.

Article ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Une approche à plusieurs volets ciblant les protéines du SRAS-CoV-2 à l'aide d'un criblage virtuel ultra-large. iScience 24, 102021 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Graff, DE, Shakhnovich, EI & Coley, CW Accélération du criblage virtuel à haut débit grâce à l'apprentissage actif basé sur un pool moléculaire. Chim. Sci. 12, 7866–7881 (2021). Cette étude introduit l'accélération du dépistage ultra-large en combinant de manière itérative DL et docking.

Article CAS PubMed PubMed Central Google Scholar

Sadybekov, AA et al. Découverte de ligands basés sur Synthon dans des bibliothèques virtuelles de plus de 11 milliards de composés. Nature 601, 452–459 (2022). Cette étude introduit le concept modulaire de criblage d'espaces gigascales, V-SYNTHES, et valide ses performances sur les cibles GPCR et kinases.

Article ADS CAS PubMed Google Scholar

Yang, X., Wang, Y., Byrne, R., Schneider, G. & Yang, S. Concepts d'intelligence artificielle pour la découverte de médicaments assistée par ordinateur. Chim. Rév. 119, 10520–10594 (2019).

Article CAS PubMed Google Scholar

Pandey, M. et al. Le rôle transformationnel de l'informatique GPU et de l'apprentissage en profondeur dans la découverte de médicaments. Nat. Mach. Renseignement. 4, 211-221 (2022).

Article Google Scholar

Blay, V., Tolani, B., Ho, SP & Arkin, MR Criblage à haut débit : approches biochimiques et cellulaires d'aujourd'hui. Découverte de drogue. Aujourd'hui 25, 1807–1821 (2020).

Article CAS PubMed Google Scholar

Bohacek, RS, McMartin, C. & Guida, WC L'art et la pratique de la conception de médicaments basée sur la structure : une perspective de modélisation moléculaire. Méd. Rés. Rév. 16, 3–50 (1996).

3.0.CO;2-6" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291098-1128%28199601%2916%3A1%3C3%3A%3AAID-MED1%3E3.0.CO%3B2-6" aria-label="Article reference 30" data-doi="10.1002/(SICI)1098-1128(199601)16:13.0.CO;2-6">Article CAS PubMed Google Scholar

Lyu, J., Irwin, JJ & Shoichet, BK Modélisation de l'expansion des bibliothèques de criblage virtuelles. Nat. Chim. Biol. https://doi.org/10.1038/s41589-022-01234-w (2023).

Article PubMed Google Scholar

Tomberg, A. & Boström, J. La chimie simple peut-elle produire des molécules complexes, diverses et nouvelles ? Découverte de drogue. Aujourd'hui 25, 2174-2181 (2020).

Article CAS PubMed Google Scholar

Muchiri, RN & van Breemen, RB Sélection d'affinité – spectrométrie de masse pour la découverte de composés pharmacologiquement actifs à partir de bibliothèques combinatoires et de produits naturels. J. Spectre de masse. 56, e4647 (2021).

Article ADS CAS PubMed Google Scholar

Fitzgerald, PR & Paegel, BM Chimie codée par l'ADN : découverte de médicaments à partir de quelques bonnes réactions. Chim. Rév.121, 7155–7177 (2021).

Article CAS PubMed Google Scholar

Neri, D. & Lerner, RA Bibliothèques chimiques codées par l'ADN : un système de sélection basé sur la dotation de composés organiques avec des informations amplifiables. Annu. Rév. Biochem. 87, 479-502 (2018).

Article CAS PubMed PubMed Central Google Scholar

McCloskey, K. et al. Apprentissage automatique sur les bibliothèques codées par ADN : un nouveau paradigme pour la recherche de résultats. J. Med. Chim. 63, 8857–8866 (2020).

Article CAS PubMed Google Scholar

Walters, WP Bibliothèques chimiques virtuelles. J. Med. Chim. 62, 1116-1124 (2019).

Article CAS PubMed Google Scholar

Warr, WA, Nicklaus, MC, Nicolaou, CA et Rarey, M. Exploration de collections de composés ultralarges pour la découverte de médicaments. J. Chem. Inf. Modèle. 62, 2021-2034 (2022). Il s'agit d'un examen complet de l'histoire et des développements récents des espaces chimiques à la demande et génératifs.

Article CAS PubMed Google Scholar

Enamine. Base de données REAL. Enamine https://enamine.net/compound-collections/real-compounds/real-database (2020).

Hartenfeller, M. et al. Une collection de réactions de synthèse organique robustes pour la conception de molécules in silico. J. Chem. Inf. Modèle. 51, 3093–3098 (2011).

Article CAS PubMed Google Scholar

Patel, H. et al. SAVI, génération in silico de milliards de composés facilement synthétisables grâce à des règles de type système expert. Sci. Données 7, 384 (2020).

Article PubMed PubMed Central Google Scholar

Irwin, JJ et al. ZINC20-Une base de données chimiques gratuite à très grande échelle pour la découverte de ligands. J. Chem. Inf. Modèle. 60, 6065–6073 (2020).

Article CAS PubMed PubMed Central Google Scholar

Hu, Q. et al. Pfizer Global Virtual Library (PGVL) : un outil de conception de produits chimiques alimenté par des informations de synthèse parallèle validées expérimentalement. ACS Comb. Sci. 14, 579-589 (2012).

Article CAS PubMed Google Scholar

Nicolaou, CA, Watson, IA, Hu, H. & Wang, J. The Proximal Lilly Collection: cartographie, exploration et exploitation de l'espace chimique réalisable. J. Chem. Inf. Modèle. 56, 1253-1266 (2016).

Article CAS PubMed Google Scholar

Enamine. VRAI Espace. Enamine https://enamine.net/library-synthesis/real-compounds/real-space-navigator (2022).

Bellmann, L., Penner, P., Gastreich, M. & Rarey, M. Comparaison des espaces de fragments combinatoires et son application aux catalogues composés ultralarges fabriqués à la demande. J. Chem. Inf. Modèle. 62, 553–566 (2022).

Article CAS PubMed Google Scholar

Enamine. Créez des blocs de construction à la demande (MADE). Enamine https://enamine.net/building-blocks/made-building-blocks (2022).

Hoffmann, T. & Gastreich, M. Le prochain niveau dans la navigation spatiale chimique : aller bien au-delà des bibliothèques de composés énumérables. Découverte de drogue. Aujourd'hui 24, 1148-1156 (2019).

Article CAS PubMed Google Scholar

Ruddigkeit, L., van Deursen, R., Blum, LC et Reymond, J.-L. Dénombrement de 166 milliards de petites molécules organiques dans la base de données de l'univers chimique GDB-17. J. Chem. Inf. Modèle. 52, 2864–2875 (2012).

Article CAS PubMed Google Scholar

Vanhaelen, Q., Lin, Y.-C. & Zhavoronkov, A. L'avènement de la chimie générative. ACS Méd. Chim. Lett. 11, 1496-1505 (2020).

Article CAS PubMed PubMed Central Google Scholar

Ballante, F., Kooistra, AJ, Kampen, S., de Graaf, C. & Carlsson, J. Criblage virtuel basé sur la structure pour les ligands des récepteurs couplés aux protéines G : que peut faire l'amarrage moléculaire pour vous ? Pharmacol. Rév.73, 527–565 (2021).

Article PubMed Google Scholar

Neves, MA, Totrov, M. & Abagyan, R. Amarrage et notation avec l'ICM : les résultats de l'analyse comparative et les stratégies d'amélioration. J. Comput. Aidé Mol. Dés. 26, 675–686 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Meiler, J. & Baker, D. ROSETTALIGAND : amarrage protéine-petite molécule avec une flexibilité totale de la chaîne latérale. Protéines 65, 538–548 (2006).

Article CAS PubMed Google Scholar

Lorber, DM & Shoichet, BK Amarrage de ligand flexible utilisant des ensembles conformationnels. Protéine Sci. 7, 938–950 (1998).

Article CAS PubMed PubMed Central Google Scholar

Trott, O. & Olson, AJ AutoDock Vina : amélioration de la vitesse et de la précision de l'amarrage avec une nouvelle fonction de notation, une optimisation efficace et le multithreading. J. Comput. Chim. 31, 455–461 (2010).

CAS PubMed PubMed Central Google Scholar

Halgren, TA et al. Glide : une nouvelle approche pour un amarrage et un scoring rapides et précis. 2. Facteurs d'enrichissement dans le filtrage des bases de données. J. Med. Chim. 47, 1750–1759 (2004).

Article CAS PubMed Google Scholar

Friesner, RA et al. Glide : une nouvelle approche pour un amarrage et un scoring rapides et précis. 1. Méthode et évaluation de la précision d'amarrage. J. Med. Chim. 47, 1739-1749 (2004).

Article CAS PubMed Google Scholar

Gaieb, Z. et al. D3R grand challenge 3 : prédiction à l'aveugle des poses protéine-ligand et classements d'affinité. J. Comput. Aidé Mol. Dés. 33, 1–18 (2019).

Article ADS CAS PubMed PubMed Central Google Scholar

Parcs, CD et al. D3R grand défi 4 : prédiction à l'aveugle des poses protéine-ligand, classements d'affinité et énergies libres de liaison relatives. J. Comput. Aidé Mol. Dés. 34, 99-119 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Bender, BJ et al. Un guide pratique de l'amarrage à grande échelle. Nat. Protocole 16, 4799–4832 (2021).

Article CAS PubMed PubMed Central Google Scholar

Manglik, A. et al. Découverte basée sur la structure d'analgésiques opioïdes avec des effets secondaires réduits. Nature 537, 185-190 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Cerón-Carrasco, JP Quand le dépistage virtuel donne des drogues inactives : traiter avec de faux amis théoriques. ChemMedChem 17, e202200278 (2022).

PubMed PubMed Central Google Scholar

Rossetti, GG et al. Inhibiteurs non covalents du SRAS-CoV-2 Mpro développés à partir de résultats de dépistage in silico. Sci. Rep. 12, 2505 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Lutens, A. et al. Le dépistage virtuel ultralarge identifie les principaux inhibiteurs de la protéase du SRAS-CoV-2 avec une activité à large spectre contre les coronavirus. Confiture. Chim. Soc. 144, 2905-2920 (2022). Cette étude compare la découverte basée sur les fragments et la découverte basée sur le criblage ultra-large de candidats principaux pour la cible difficile.

Article CAS PubMed PubMed Central Google Scholar

Owen, DR et al. Un candidat clinique inhibiteur oral du SARS-CoV-2 Mpro pour le traitement du COVID-19. Sciences 374, 1586-1593 (2021).

Article ADS CAS PubMed Google Scholar

Bohm, H.-J. Le programme informatique LUDI : une nouvelle méthode pour la conception de novo d'inhibiteurs d'enzymes. J. Comput. Aidé Mol. Dés. 6, 61–78 (1992).

Article ADS PubMed Google Scholar

Beroza, P. et al. L'amarrage spatial chimique permet un criblage virtuel à grande échelle basé sur la structure pour découvrir les inhibiteurs de la kinase ROCK1. Nat. Commun. 13, 6447 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Jumper, J. et al. Application et amélioration d'AlphaFold au CASP14. Protéines 89, 1711–1721 (2021).

Article CAS PubMed PubMed Central Google Scholar

Vamathevan, J. et al. Applications de l'apprentissage automatique dans la découverte et le développement de médicaments. Nat. Rev. Drug Discov. 18, 463–477 (2019).

Article CAS PubMed PubMed Central Google Scholar

Schneider, P. et al. Repenser la conception des médicaments à l'ère de l'intelligence artificielle. Nat. Rev. Drug Discov. 19, 353–364 (2020). Cet article fournit une introduction complète aux approches DL dans la découverte de médicaments.

Article CAS PubMed Google Scholar

Elbadawi, M., Gaisford, S. & Basit, AW Techniques avancées d'apprentissage automatique dans la découverte de médicaments. Découverte de drogue. Aujourd'hui 26, 769–777 (2021).

Article CAS PubMed Google Scholar

Bender, A. & Cortés-Ciriano, I. L'intelligence artificielle dans la découverte de médicaments : qu'est-ce qui est réaliste, qu'est-ce que les illusions ? Partie 1 : comment avoir un impact, et pourquoi nous n'en sommes pas encore là. Découverte de drogue. Aujourd'hui 26, 511–524 (2021).

Article CAS PubMed Google Scholar

Davies, M. et al. Améliorer la précision de la pharmacocinétique humaine prédite : leçons tirées du pipeline de médicaments d'AstraZeneca sur deux décennies. Tendances Pharmacol. Sci. 41, 390–408 (2020).

Article CAS PubMed Google Scholar

Schneckener, S. et al. Prédiction de la biodisponibilité orale chez le rat : transfert des informations issues des corrélations in vitro vers des modèles d'apprentissage automatique (profond) en utilisant les sorties de modèles in silico et les paramètres de structure chimique. J. Chem. Inf. Modèle. 59, 4893–4905 (2019).

Article CAS PubMed Google Scholar

Cherkasov, A. et al. Modélisation QSAR : où en êtes-vous ? Où vas-tu? J. Med. Chim. 57, 4977–5010 (2014).

Article CAS PubMed PubMed Central Google Scholar

Keiser, MJ et al. Prédire de nouvelles cibles moléculaires pour des médicaments connus. Nature 462, 175–181 (2009).

Article ADS CAS PubMed PubMed Central Google Scholar

Guney, E., Menche, J., Vidal, M. & Barábasi, A.-L. Dépistage in silico de l'efficacité des médicaments en réseau. Nat. Commun. 7, 10331 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Cichonska, A. et al. Cartographie participative de l'espace cible inexploré des inhibiteurs de kinase. Nat. Commun. 12, 3307 (2021).

Article PubMed PubMed Central Google Scholar

Gaulton, A. et al. ChEMBL : une base de données de bioactivité à grande échelle pour la découverte de médicaments. Nucleic Acids Res. 40, D1100–D1107 (2012).

Article CAS PubMed Google Scholar

Tang, J. et al. Drug Target Commons : un effort communautaire visant à créer une base de connaissances consensuelle sur les interactions médicament-cible. Chimie cellulaire. Biol. 25, 224–229.e222 (2018).

Article CAS PubMed PubMed Central Google Scholar

Liu, Z. et al. Collecte de données de liaison à l'échelle de PDB : état actuel de la base de données PDBbind. Bioinformatique 31, 405–412 (2015).

Article CAS PubMed Google Scholar

Gaudelet, T. et al. Utilisation de l'apprentissage automatique des graphes dans la découverte et le développement de médicaments. Bref. Bioinformer. 22, bbab159 (2021).

Article PubMed PubMed Central Google Scholar

Son, J. & Kim, D. Développement d'un modèle de réseau de neurones à convolution graphique pour une prédiction efficace des affinités de liaison protéine-ligand. PLoS ONE 16, e0249404 (2021).

Article CAS PubMed PubMed Central Google Scholar

Stepniewska-Dziubinska, MM, Zielenkiewicz, P. & Siedlecki, P. Amélioration de la détection des sites de liaison protéine-ligand avec segmentation 3D. Sci. Rep. 10, 5035 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Jiménez, J., Škalič, M., Martínez-Rosell, G. & De Fabritiis, G. KDEEP : prédiction de l'affinité de liaison absolue protéine-ligand via des réseaux de neurones à convolution 3D. J. Chem. Inf. Modèle. 58, 287-296 (2018).

Article PubMed Google Scholar

Jones, D. et al. Prédiction améliorée de l'affinité de liaison protéine-ligand avec inférence de fusion profonde basée sur la structure. J. Chem. Inf. Modèle. 61, 1583-1592 (2021).

Article CAS PubMed Google Scholar

Volkov, M. et al. Sur la frustration de prédire les affinités de liaison des structures protéine-ligand avec les réseaux de neurones profonds. J. Med. Chim. 65, 7946–7958 (2022).

Article CAS PubMed Google Scholar

Roberts, M. et al. Pièges courants et recommandations pour l'utilisation de l'apprentissage automatique pour détecter et pronostiquer le COVID-19 à l'aide de radiographies thoraciques et de tomodensitogrammes. Nat. Mach. Renseignement. 3, 199-217 (2021).

Article Google Scholar

Beker, W. et al. L'apprentissage automatique peut parfois simplement capturer les tendances de popularité de la littérature : une étude de cas du couplage hétérocyclique Suzuki-Miyaura. Confiture. Chim. Soc. 144, 4819–4827 (2022).

Article CAS PubMed PubMed Central Google Scholar

Yu, B. & Kumbier, K. Science des données véridiques. Proc. Natl Acad. Sci. États-Unis 117, 3920–3929 (2020). Cet article de perspective jette les bases de l'IA véridique.

Article ADS MathSciNet CAS PubMed PubMed Central MATH Google Scholar

Ng , A. , Laird , D. & He , L. Concurrence IA centrée sur les données . DeepLearning AI https://https-deep-learning-ai.github.io/data-centric-comp/ (2021).

Miranda, LJ Vers un apprentissage automatique centré sur les données : un bref examen. LJ Miranda https://ljvmiranda921.github.io/notebook/2021/07/30/data-centric-ml/ (2021).

Jiménez-Luna, J., Grisoni, F. & Schneider, G. Découverte de médicaments avec intelligence artificielle explicable. Nat. Mach. Renseignement. 2, 573–584 (2020).

Article Google Scholar

Wills, T. Découverte de médicaments par l'IA : évaluation des premiers candidats-médicaments conçus par l'IA à faire l'objet d'essais cliniques sur l'homme. CAS https://www.cas.org/resources/cas-insights/drug-discovery/ai-designed-drug-candidates (2022).

Meng, C., Seo, S., Cao, D., Griesemer, S. & Liu, Y. Quand la physique rencontre l'apprentissage automatique : une enquête sur l'apprentissage automatique basé sur la physique. Préimpression sur https://doi.org/10.48550/arXiv.2203.16797 (2022).

Thomas, M., Bender, A. & de Graaf, C. Intégration d'approches basées sur la structure dans la conception moléculaire générative. Courant. Avis. Structure. Biol. 79, 102559 (2023).

Article CAS PubMed Google Scholar

Ackloo, S. et al. CACHE (Critical Assessment of Computational Hit-finding Experiments): une initiative d'analyse comparative en partenariat public-privé pour permettre le développement de méthodes informatiques pour la recherche de coups. Nat. Rév. Chem. 6, 287-295 (2022). Il s'agit d'une initiative communautaire importante pour l'évaluation complète des performances des méthodes informatiques de découverte de médicaments.

Article PubMed PubMed Central Google Scholar

MolSoft. Moteur de découverte rapide d'isostères (RIDE). MolSoft http://molsoft.com/RIDE.html (2022).

Jumper, J. et al. Prédiction très précise de la structure des protéines avec AlphaFold. Nature 596, 583–589 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Tunyasuvunakool, K. et al. Prédiction très précise de la structure des protéines pour le protéome humain. Nature 596, 590–596 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Baek, M. et al. Prédiction précise des structures et des interactions des protéines à l'aide d'un réseau de neurones à trois voies. Sciences 373, 871–876 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Akdel, M. Une évaluation de la communauté de biologie structurale des applications AlphaFold2. Nat. Structure. Mol. Biol. 29, 1056-1067 (2022).

Article CAS PubMed PubMed Central Google Scholar

Katritch, V., Rueda, M. & Abagyan, R. Optimisation des récepteurs guidés par le ligand. Méthodes Mol. Biol. 857, 189-205 (2012).

Article CAS PubMed Google Scholar

Carlsson, J. et al. Découverte de ligands à partir d'un modèle d'homologie du récepteur de la dopamine D3 et de la structure cristalline. Nat. Chim. Biol. 7, 769–778 (2011).

Article CAS PubMed PubMed Central Google Scholar

Ren, F. et al. AlphaFold accélère la découverte de médicaments basée sur l'intelligence artificielle : découverte efficace d'un nouvel inhibiteur à petite molécule de la kinase 20 dépendante de la cycline (CDK20). Chim. Sci. 14, 1443–1452 (2023).

Zhang, Y. et al. Analyse comparative des structures AlphaFold2 raffinées et non raffinées pour la découverte de hits. J. Chem. Inf. Modèle. 63, 1656-1667 (2023).

Lui, X.-h. et coll. AlphaFold2 versus structures expérimentales : évaluation sur les récepteurs couplés aux protéines G. Acta Pharmacol. Péché. 44, 1–7 (2022).

Article PubMed Google Scholar

Wong, F. et al. Analyse comparative des prédictions d'amarrage moléculaire activées par AlphaFold pour la découverte d'antibiotiques. Mol. Syst. Biol. 18, e11081 (2022).

Article CAS PubMed PubMed Central Google Scholar

Heckelman, ML, de Vries, I., Joosten, RP & Perrakis, A. AlphaFill : enrichissement des modèles AlphaFold avec des ligands et des cofacteurs. Nat. Méthodes 20, 205–213 (2023).

Article CAS PubMed Google Scholar

Yang, Y. et al. Exploration efficace de l'espace chimique avec amarrage et apprentissage en profondeur. J. Chem. Calcul théorique. 17, 7106–7119 (2021).

Article CAS PubMed Google Scholar

Gentile, F. et al. Criblage virtuel activé par l'intelligence artificielle de bibliothèques chimiques ultra-larges avec amarrage profond. Nat. Protocole 17, 672–697 (2022).

Article CAS PubMed Google Scholar

Schindler, CEM et al. Évaluation à grande échelle des calculs d'énergie libre de liaison dans des projets actifs de découverte de médicaments. J. Chem. Inf. Modèle. 60, 5457–5474 (2020).

Article CAS PubMed Google Scholar

Chen, W., Cui, D., Abel, R., Friesner, RA et Wang, L. Calcul précis des énergies libres absolues de liaison protéine-ligand. Préimpression sur https://doi.org/10.26434/chemrxiv-2022-2t0dq-v2 (2022).

Khalak, Y. et al. Énergies libres alchimiques absolues de liaison protéine-ligand pour la conception de médicaments. Chim. Sci. 12, 13958–13971 (2021).

Article CAS PubMed PubMed Central Google Scholar

Cournia, Z. et al. Simulations d'énergie libre rigoureuses en criblage virtuel. J. Chem. Inf. Modèle. 60, 4153–4169 (2020).

Article CAS PubMed Google Scholar

xREAL Chemical Space, Chemspace, https://chem-space.com/services#v-synthes (2023).

Rarey, M., Nicklaus, MC & Warr, W. Numéro spécial sur l'informatique de réaction et l'espace chimique. J. Chem. Inf. Modèle. 62, 2009-2010 (2022).

Article CAS PubMed Google Scholar

Zabolotna, Y. et al. Un regard rapproché sur l'espace chimique des blocs de construction disponibles dans le commerce pour la chimie médicinale. J. Chem. Inf. Modèle. 62, 2171-2185 (2022).

Article CAS PubMed Google Scholar

Kaplan, AL et al. Amarrage de bibliothèque sur mesure pour les agonistes des récepteurs 5-HT2A à activité antidépressive. Nature 610, 582–591 (2022).

Article ADS CAS PubMed Google Scholar

Krasiński, A., Fokin, VV & Sharpless, KB Synthèse directe de 1,5-disubstitué-4-magnesio-1,2,3-triazoles, revisité. Org. Lett. 6, 1237-1240 (2004).

Article PubMed Google Scholar

Le prix Nobel de chimie. nobelprize.org, https://www.nobelprize.org/prizes/chemistry/2022/summary/ (2022)

Dong, J., Sharpless, KB, Kwisnek, L., Oakdale, JS & Fokin, VV Synthèse de polysulfates à base de SuFEx. Angew. Chim. Int. Éd. angl. 53, 9466–9470 (2014).

Article CAS PubMed PubMed Central Google Scholar

Zhang, B. et al. Couplage Ni-électrocatalytique Csp3-Csp3 doublement décarboxylatif. Nature 606, 313–318 (2022).

Article ADS CAS PubMed Google Scholar

Gillis, EP & Burke, MD Couplage croisé itératif avec les boronates MIDA : vers une plate-forme générale pour la synthèse de petites molécules. Aldrichimica Acta 42, 17–27 (2009).

CAS PubMed PubMed Central Google Scholar

Blair, DJ et al. Formation itérative automatisée de liaisons Csp3–C. Nature 604, 92–97 (2022). Cette étude fournit une approche chimique pour l'automatisation de la formation de liaisons C–C dans la synthèse de petites molécules.

Article ADS CAS PubMed Google Scholar

Li, J. et al. Synthèse de nombreux types différents de petites molécules organiques à l'aide d'un processus automatisé. Sciences 347, 1221-1226 (2015).

Article ADS CAS PubMed PubMed Central Google Scholar

Trobe, M. & Burke, MD La révolution industrielle moléculaire : synthèse automatisée de petites molécules. Angew. Chim. Int. Éd. 57, 4192–4214 (2018).

Article CAS Google Scholar

Bubliauskas, A. et al. Numérisation de la synthèse chimique dans des réactifs imprimés en 3D. Angew. Chim. Int. Éd. 61, e202116108 (2022).

Article CAS Google Scholar

Molga, K. et al. Un algorithme informatique pour découvrir des séquences itératives de réactions organiques. Nat. Synthé. 1, 49-58 (2022).

Annonces d'article Google Scholar

Segler, MHS, Preuss, M. & Waller, MP Planification de synthèses chimiques avec des réseaux de neurones profonds et une IA symbolique. Nature 555, 604–610 (2018).

Article ADS CAS PubMed Google Scholar

Goldman, B., Kearnes, S., Kramer, T., Riley, P. & Walters, WP Définition des niveaux de conception chimique automatisée. J. Med. Chim. 65, 7073–7087 (2022).

Article CAS PubMed PubMed Central Google Scholar

Grisoni, F. et al. Combiner l'intelligence artificielle générative et la synthèse sur puce pour la conception de médicaments de novo. Sci. Adv. 7, eabg3338 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Wagner, JR et al. Méthodes informatiques émergentes pour la découverte rationnelle de médicaments allostériques. Chim. Rév. 116, 6370–6390 (2016).

Article CAS PubMed PubMed Central Google Scholar

Davis, BJ & Hubbard, RE en biologie structurale dans la découverte de médicaments (éd. Renaud, J.-P.) 79–98 (2020).

de Souza Neto, LR et al. Stratégies in silico pour soutenir l'optimisation fragment-to-lead dans la découverte de médicaments. Devant. Chim. 8, 93 (2020).

Article ADS PubMed PubMed Central Google Scholar

Saur, M. et al. Découverte de médicaments basée sur des fragments à l'aide de cryo-EM. Découverte de drogue. Aujourd'hui 25, 485-490 (2020).

Article CAS PubMed Google Scholar

Kuljanin, M. et al. Réinventer le profilage à haut débit des cystéines réactives pour le criblage cellulaire de grandes bibliothèques électrophiles. Nat. Biotechnol. 39, 630–641 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Muegge, I., Martin, YC, Hajduk, PJ & Fesik, SW Évaluation de la notation PMF dans l'amarrage des ligands faibles à la protéine de liaison FK506. J. Med. Chim. 42, 2498-2503 (1999).

Article CAS PubMed Google Scholar

Schuller, M. et al. Fragment se liant au macrodomaine Nsp3 du SRAS-CoV-2 identifié par criblage cristallographique et amarrage informatique. Sci. Adv. 7, eabf8711 (2021).

Article ADS PubMed PubMed Central Google Scholar

Gahbauer, S. et al. La conception informatique itérative et le criblage cristallographique identifient de puissants inhibiteurs ciblant le macrodomaine Nsp3 du SRAS-CoV-2. Proc. Natl Acad. Sci. États-Unis 120, e2212931120 (2023). Cet article démontre l'application à la fois de la conception de criblage et de fusion de fragments hybrides et du criblage de bibliothèque ultra-large à une cible virale difficile.

Article CAS PubMed PubMed Central Google Scholar

Achdout, H. et al. Découverte scientifique ouverte d'un traitement oral non covalent par inhibiteur de la protéase principale du SRAS-CoV-2. Préimpression sur https://doi.org/10.1101/2020.10.29.339317 (2022).

Jin, Z. et al. Structure de Mpro du SARS-CoV-2 et découverte de ses inhibiteurs. Nature 582, 289–293 (2020).

Article ADS CAS PubMed Google Scholar

Ton, AT, Gentile, F., Hsing, M., Ban, F. & Cherkasov, A. Identification rapide d'inhibiteurs potentiels de la protéase principale du SRAS-CoV-2 par amarrage profond de 1,3 milliard de composés. Mol. Informer. 39, e2000028 (2020).

Article PubMed Google Scholar

Frye, L., Bhat, S., Akinsanya, K. & Abel, R. De la découverte de médicaments assistée par ordinateur à la découverte de médicaments pilotée par ordinateur. Découverte de drogue. Aujourd'hui Technol. 39, 111-117 (2021).

Article CAS PubMed Google Scholar

Wadman, M. La FDA n'a plus besoin d'exiger des tests sur les animaux avant les essais de médicaments humains. Sciences, https://doi.org/10.1126/science.adg6264 (2023).

Stiefl, N. et al. FOCUS—développement d'une plateforme mondiale de communication et de modélisation pour les chimistes médicinaux appliqués et computationnels. J. Chem. Inf. Modèle. 55, 896–908 (2015).

Article CAS PubMed Google Scholar

Schrödinger. Conception en direct. Schrodinger https://www.schrodinger.com/sites/default/files/general_ld_rgb_080119_forweb.pdf. (consulté le 5 avril 2023)

Muller, S. et al. Objectif 2035 - mise à jour sur la recherche d'une sonde pour chaque protéine. RSC Méd. Chim. 13, 13–21 (2022).

Article PubMed Google Scholar

Verdonk, ML, Cole, JC, Hartshorn, MJ, Murray, CW et Taylor, RD Amélioration de l'amarrage protéine-ligand à l'aide de GOLD. Protéines 52, 609–623 (2003).

Article CAS PubMed Google Scholar

Miller, EB et al. Solution fiable et précise au problème d'amarrage d'ajustement induit pour la liaison protéine-ligand. J. Chem. Calcul théorique. 17, 2630-2639 (2021).

Article CAS PubMed Google Scholar

Amarrage spatial chimique. BioSolveIT https://www.biosolveit.de/application-academy/chemical-space-docking/ (2022).

Cavasotto, CN dans Quantum Mechanics in Drug Discovery (éd. Heifetz, A.) 257–268 (Springer, 2020).

Dixon, SL et al. AutoQSAR : un outil d'apprentissage automatique automatisé pour la modélisation des relations quantitatives structure-activité selon les meilleures pratiques. Future Med. Chim. 8, 1825–1839 (2016).

Article ADS CAS PubMed Google Scholar

Totrov, M. Champs de propriétés atomiques : potentiel pharmacophorique 3D généralisé pour la superposition automatisée de ligands, l'élucidation de pharmacophores et le QSAR 3D. Chim. Biol. Drogues Dés. 71, 15–27 (2008).

Article CAS PubMed Google Scholar

Schaller, D. et al. Modélisation pharmacophore 3D de nouvelle génération. WIRE Comput. Mol. Sci. 10, e1468 (2020).

Article CAS Google Scholar

Chakravarti, SK & Alla, SRM Modélisation QSAR sans descripteur utilisant l'apprentissage en profondeur avec des réseaux de neurones à mémoire à court terme. Devant. Artef. Renseignement. 2, 17 (2019).

Article PubMed PubMed Central Google Scholar

Deng, Z., Chuaqui, C. & Singh, J. Empreinte d'interaction structurelle (SIFt): une nouvelle méthode pour analyser les interactions de liaison protéine-ligand tridimensionnelles. J. Med. Chim. 47, 337–344 (2004).

Article CAS PubMed Google Scholar

Télécharger les références

Nous remercions A. Brooun, AA Sadybekov, S. Majumdar, MM Babu, Y. Moroz et V. Cherezov pour leurs discussions utiles.

Département de biologie quantitative et computationnelle, Université de Californie du Sud, Los Angeles, Californie, États-Unis

Anastasiia V. Sadybekov & Vsevolod Katritch

Center for New Technologies in Drug Discovery and Development, Bridge Institute, Michelson Center for Convergent Biosciences, University of Southern California, Los Angeles, Californie, États-Unis

Anastasiia V. Sadybekov & Vsevolod Katritch

Département de chimie, Université de Californie du Sud, Los Angeles, Californie, États-Unis

Vsevolod Katritch

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Tous les auteurs ont contribué à la rédaction du manuscrit.

Correspondance à Vsevolod Katritch.

L'Université de Californie du Sud est en train de déposer une demande de brevet (n° 63159888) couvrant la méthode V-SYNTHES qui répertorie VK comme co-inventeur.

Nature remercie Alexander Tropsha et les autres évaluateurs anonymes pour leur contribution à l'évaluation par les pairs de ce travail.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Springer Nature ou son concédant (par exemple une société ou un autre partenaire) détient les droits exclusifs sur cet article en vertu d'un accord de publication avec le ou les auteurs ou autre(s) titulaire(s) des droits ; l'auto-archivage par l'auteur de la version manuscrite acceptée de cet article est uniquement régi par les termes de cet accord de publication et la loi applicable.

Réimpressions et autorisations

Sadybekov, AV, Katritch, V. Approches informatiques rationalisant la découverte de médicaments. Nature 616, 673–685 (2023). https://doi.org/10.1038/s41586-023-05905-z

Télécharger la citation

Reçu : 21 avril 2022

Accepté : 01 mars 2023

Publié: 26 avril 2023

Date d'émission : 27 avril 2023

DOI : https://doi.org/10.1038/s41586-023-05905-z

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.