Maintenant, les machines apprennent à sentir

Blog

MaisonMaison / Blog / Maintenant, les machines apprennent à sentir

Dec 08, 2023

Maintenant, les machines apprennent à sentir

Sara Harrison Application Prediction Company Alphabet Google End User Research

Sarah Harrison

Application

Prédiction

Entreprise

Alphabet

Google

Utilisateur final

Recherche

Secteur

Recherche

Technologie

Apprentissage automatique

Réseau neuronal

Google a son propre parfum, ou du moins une équipe de chercheurs de l'entreprise en a. Fabriqué sous la direction d'experts parfumeurs français, le mélange a des notes de vanille, de jasmin, de melon et de fraises. "Ce n'était pas si mal", dit Alex Wiltschko, qui garde un flacon de parfum dans sa cuisine.

Google ne commercialisera pas ce parfum de sitôt, mais il met son nez dans un autre aspect de nos vies : l'odorat. Jeudi, des chercheurs de Google Brain ont publié un article sur le site de préimpression Arxiv montrant comment ils ont formé un ensemble d'algorithmes d'apprentissage automatique pour prédire l'odeur des molécules en fonction de leurs structures. Est-ce aussi utile que de fournir des cartes pour la majeure partie du monde ? Peut être pas. Mais pour le domaine de l'olfaction, cela pourrait aider à résoudre certaines grandes questions de longue date.

La science de l'odorat est en retard sur de nombreux autres domaines. La lumière, par exemple, est comprise depuis des siècles. Au 17ème siècle, Isaac Newton a utilisé des prismes pour diviser la lumière blanche du soleil en notre désormais familier arc-en-ciel rouge, orange, jaune, vert, bleu, indigo et violet. Des recherches ultérieures ont révélé que ce que nous percevons comme des couleurs différentes sont en fait des longueurs d'onde différentes. Jetez un coup d'œil à une roue chromatique et vous obtenez une représentation simple de la façon dont ces longueurs d'onde se comparent, les rouges et les jaunes plus longs passant aux bleus et aux violets plus courts. Mais l'odorat n'a pas un tel guide.

Si les longueurs d'onde sont les composants de base de la lumière, les molécules sont les éléments constitutifs des parfums. Lorsqu'elles pénètrent dans notre nez, ces molécules interagissent avec des récepteurs qui envoient des signaux à une petite partie de notre cerveau appelée bulbe olfactif. Soudain, nous pensons "mmm, pop-corn!" Les scientifiques peuvent regarder une longueur d'onde et savoir à quelle couleur elle ressemblera, mais ils ne peuvent pas faire la même chose pour les molécules et l'odeur.

En fait, il s'est avéré extrêmement difficile de déterminer l'odeur d'une molécule à partir de sa structure chimique. Changez ou supprimez un atome ou une liaison, "et vous pouvez passer des roses aux œufs pourris", explique Wiltschko, qui a dirigé l'équipe de recherche de Google pour le projet.

Il y a eu des tentatives précédentes d'utiliser l'apprentissage automatique pour détecter des modèles qui font qu'une molécule sent l'ail et une autre comme le jasmin. Les chercheurs ont créé un DREAM Olfaction Prediction Challenge en 2015. Le projet a rassemblé des descriptions d'odeurs de centaines de personnes, et les chercheurs ont testé différents algorithmes d'apprentissage automatique pour voir s'ils pouvaient les entraîner à prédire l'odeur des molécules.

Plusieurs autres équipes ont appliqué l'IA à ces données et ont fait des prédictions réussies. Mais l'équipe de Wiltschko a adopté une approche différente. Ils ont utilisé quelque chose appelé un réseau de neurones graphiques, ou GNN. La plupart des algorithmes d'apprentissage automatique exigent que les informations soient présentées dans une grille rectangulaire. Mais toutes les informations ne correspondent pas à ce format. Les GNN peuvent consulter des graphiques, comme des réseaux d'amis sur des sites de médias sociaux ou des réseaux de citations académiques de revues. Ils pourraient être utilisés pour prédire qui pourraient être vos prochains amis sur les réseaux sociaux. Dans ce cas, le GNN pourrait traiter la structure de chaque molécule et comprendre que dans une molécule, un atome de carbone était à cinq atomes d'un atome d'azote, par exemple.

Lauren Goode

Lauren Goode

Julien Chokkattu

Chevalier

L'équipe de Google a utilisé un ensemble de près de 5 000 molécules provenant de parfumeurs au nez expert et a soigneusement associé chaque molécule à des descriptions telles que "boisé", "jasmin" ou "doux". Les chercheurs ont utilisé environ les deux tiers de l'ensemble de données pour former le réseau, puis ont testé s'il pouvait prédire les odeurs des molécules restantes. Ça a marché.

En fait, lors de sa première itération, le GNN a fonctionné aussi bien que les modèles que d'autres groupes avaient créés. Wiltschko dit qu'au fur et à mesure que l'équipe affine le modèle, il pourrait encore s'améliorer : "Nous avons fait avancer le domaine, je pense."

Comme tout outil d'apprentissage automatique, le GNN de Google est limité par la qualité des données. Néanmoins, Alexei Koulakov, chercheur au Cold Spring Harbor Laboratory, affirme que le projet est précieux pour introduire des milliers de nouvelles molécules dans les ensembles de données sur les odeurs, qui sont souvent relativement petits, et que ces données "pourraient constituer la base d'améliorations de cet algorithme et d'autres à l'avenir". Koulakov souligne qu'il n'est pas clair si nous pouvons apprendre quoi que ce soit sur l'olfaction humaine à partir d'un modèle d'apprentissage automatique, car la conception du réseau neuronal n'est pas la même que celle d'un système olfactif humain.

Comment l'IA comprend l'odeur et comment nous la percevons pourraient être deux choses très différentes. Deux molécules peuvent avoir une odeur différente, mais même les nez exercés les étiquetteront toutes les deux comme « boisées » ou « terreuses ». "C'est une grosse mise en garde", déclare Wiltschko.

Il admet également que le GNN tombe dans un domaine clé : les paires dites chirales, qui ont les mêmes atomes et liaisons, mais disposées comme des images miroir les unes des autres. Les différentes orientations signifient qu'ils sentent radicalement différents. Le carvi et la menthe verte en sont un exemple. Mais le GNN les classera de la même manière. "Nous savons que nous avons des paires chirales dans notre ensemble de données, et nous savons que nous ne pouvons pas les prédire correctement", déclare Wiltschko. Une prochaine étape sera de comprendre comment gérer cela.

De plus, cette recherche ne nous dit pas grand-chose sur les mélanges ou les combinaisons de parfums, qui peuvent radicalement modifier la façon dont nous percevons les molécules individuelles. Mais déterminer quelles propriétés ou quels modèles conduisent les molécules à sentir d'une certaine manière serait une énorme avancée pour le domaine. "Si nous étions capables de faire cela, je pense que ce serait un exploit incroyable", déclare Johannes Reisert, chercheur en odeurs au Monell Chemical Senses Center. Finalement, nous pourrions créer une sorte de roue chromatique pour l'odorat, en cartographiant les molécules les plus proches les unes des autres et celles qui sont liées. Reisert reconnaît que le projet Google est toujours en cours, mais qu'il s'agit "d'un pas dans la bonne direction".