L'apprentissage automatique rencontre la chimie : le nouveau modèle du MIT prédit les états de transition à
Les chimistes du MIT ont développé un modèle informatique capable de prédire rapidement la structure de l’état de transition d’une réaction (structure de gauche), si l’on lui donne la structure d’un réactif (au milieu) et d’un produit (à droite). Crédit : David W. Kastner
Grâce à l’intelligence artificielle générative, des chimistes du MIT ont développé un modèle capable de prédire les structures formées lorsqu’une réaction chimique atteint son point de non-retour.
Au cours d’une réaction chimique, les molécules gagnent de l’énergie jusqu’à ce qu’elles atteignent ce que l’on appelle l’état de transition, un point de non-retour à partir duquel la réaction doit se dérouler. Cet état est si éphémère qu’il est presque impossible de l’observer expérimentalement.
Les structures de ces états de transition peuvent être calculées à l’aide de techniques basées sur la chimie quantique, mais ce processus prend énormément de temps. Une équipe de chercheurs du MIT a développé une approche alternative, basée sur apprentissage automatiquequi permet de calculer ces structures beaucoup plus rapidement, en quelques secondes.
Leur nouveau modèle pourrait être utilisé pour aider les chimistes à concevoir de nouvelles réactions et catalyseurs pour générer des produits utiles tels que des carburants ou des médicaments, ou pour modéliser des réactions chimiques naturelles telles que celles qui auraient pu contribuer à l’évolution de la vie sur Terre.
« Savoir que la structure des états de transition est vraiment important comme point de départ pour réfléchir à la conception de catalyseurs ou pour comprendre comment les systèmes naturels mettent en œuvre certaines transformations », explique Heather Kulik, professeure agrégée de chimie et de génie chimique à l’Université d’Ottawa. MITet l’auteur principal de l’étude.
Chenru Duan PhD ’22 est l’auteur principal d’un article décrivant le travail, qui paraît aujourd’hui dans Science informatique de la nature. Yuanqi Du, étudiant diplômé de l’Université Cornell, et Haojun Jia, étudiant diplômé du MIT, sont également les auteurs de l’article.
Transitions éphémères
Pour qu’une réaction chimique donnée se produise, elle doit passer par un état de transition, qui a lieu lorsqu’elle atteint le seuil d’énergie nécessaire au déroulement de la réaction. La probabilité qu’une réaction chimique se produise est en partie déterminée par la probabilité que l’état de transition se forme.
« L’état de transition aide à déterminer la probabilité qu’une transformation chimique se produise. Si nous avons beaucoup de choses dont nous ne voulons pas, comme le dioxyde de carbone, et que nous aimerions le convertir en un carburant utile comme le méthanol, l’état de transition et son caractère favorable déterminent la probabilité que nous obtenions du réactif au produit », explique Kulik.
Les chimistes peuvent calculer les états de transition à l’aide d’une méthode de chimie quantique connue sous le nom de théorie fonctionnelle de la densité. Cependant, cette méthode nécessite une énorme puissance de calcul et peut prendre plusieurs heures, voire plusieurs jours, pour calculer un seul état de transition.
Récemment, certains chercheurs ont tenté d’utiliser des modèles d’apprentissage automatique pour découvrir les structures des états de transition. Cependant, les modèles développés jusqu’à présent nécessitent de considérer deux réactifs comme une seule entité dans laquelle les réactifs conservent la même orientation l’un par rapport à l’autre. Toutes les autres orientations possibles doivent être modélisées sous forme de réactions distinctes, ce qui augmente le temps de calcul.
« Si les molécules réactives sont mises en rotation, alors en principe, avant et après cette rotation, elles peuvent toujours subir la même réaction chimique. Mais dans l’approche traditionnelle d’apprentissage automatique, le modèle considérera ces deux réactions différentes. Cela rend la formation au machine learning beaucoup plus difficile et moins précise », explique Duan.
L’équipe du MIT a développé une nouvelle approche informatique qui leur a permis de représenter deux réactifs dans n’importe quelle orientation arbitraire l’un par rapport à l’autre, en utilisant un type de modèle connu sous le nom de modèle de diffusion, qui peut apprendre quels types de processus sont les plus susceptibles de générer un effet particulier. résultat. Comme données de formation pour leur modèle, les chercheurs ont utilisé des structures de réactifs, de produits et d’états de transition calculées à l’aide de méthodes de calcul quantique pour 9 000 réactions chimiques différentes.
« Une fois que le modèle aura appris la distribution sous-jacente de la façon dont ces trois structures coexistent, nous pouvons lui donner de nouveaux réactifs et produits, et il essaiera de générer une structure d’état de transition qui s’associe à ces réactifs et produits », explique Duan.
Les chercheurs ont testé leur modèle sur environ 1 000 réactions inédites, en leur demandant de générer 40 solutions possibles pour chaque état de transition. Ils ont ensuite utilisé un « modèle de confiance » pour prédire quels états étaient les plus susceptibles de se produire. Ces solutions étaient précises à 0,08 angström (un cent millionième de centimètre) par rapport aux structures d’état de transition générées à l’aide de techniques quantiques. L’ensemble du processus informatique ne prend que quelques secondes pour chaque réaction.
« Vous pouvez imaginer que cela revient vraiment à penser à générer des milliers d’états de transition dans le temps qu’il vous faudrait normalement pour en générer seulement une poignée avec la méthode conventionnelle », explique Kulik.
Modélisation des réactions
Bien que les chercheurs aient formé leur modèle principalement sur des réactions impliquant des composés comportant un nombre relativement faible d’atomes – jusqu’à 23 atomes pour l’ensemble du système – ils ont découvert qu’il pouvait également faire des prédictions précises pour des réactions impliquant des molécules plus grosses.
« Même si vous regardez des systèmes plus grands ou des systèmes catalysés par des enzymes, vous obtenez une assez bonne couverture des différents types de façons dont les atomes sont les plus susceptibles de se réorganiser », explique Kulik.
Les chercheurs prévoient désormais d’élargir leur modèle pour incorporer d’autres composants tels que des catalyseurs, ce qui pourrait les aider à étudier dans quelle mesure un catalyseur particulier accélérerait une réaction. Cela pourrait être utile pour développer de nouveaux procédés de génération de produits pharmaceutiques, de carburants ou d’autres composés utiles, en particulier lorsque la synthèse implique de nombreuses étapes chimiques.
« Traditionnellement, tous ces calculs sont effectués avec la chimie quantique, et nous sommes désormais en mesure de remplacer la partie chimie quantique par ce modèle génératif rapide », explique Duan.
Une autre application potentielle de ce type de modèle consiste à explorer les interactions qui pourraient se produire entre des gaz trouvés sur d’autres planètes, ou à modéliser les réactions simples qui auraient pu se produire au cours de l’évolution précoce de la vie sur Terre, selon les chercheurs.
La recherche a été financée par l’Office of Naval Research des États-Unis et la National Science Foundation.