“Nous n’avons pas de robots aussi doués pour comprendre le monde physique que les souris”, déclare Yann LeCun, l’une des figures marquantes du monde de l’intelligence artificielle.
Il a travaillé pendant une décennie chez Meta, propriétaire de Facebook, où il était le scientifique en chef de l’IA, mais a quitté l’entreprise en 2025 et a fondé Advanced Machine Intelligence Labs (AMI Labs).
L’objectif est de faire évoluer l’IA au-delà des systèmes actuels comme ChatGPT, Claude et Gemini. Ils ont leur utilité, dit-il, mais ne seront jamais capables de gérer des situations complexes dans le monde réel, comme demander à un robot d’effectuer des tâches ménagères.
publicité
publicité
“Ils ne permettent pas d’accéder à une intelligence humaine ou humaine, ni même à une intelligence animale, car ils ne peuvent pas gérer les données du monde réel, ils ne sont pas construits pour cela”, m’a-t-il déclaré en marge de VivaTech, la principale conférence technologique française.
Ainsi, AMI Labs, basé à Paris, est en train de développer un nouveau type d’intelligence artificielle qui ne repose pas sur la technologie de ChatGPT et de ses concurrents.
Les investisseurs y voient un potentiel. Plus tôt cette année, AMI Labs a annoncé avoir levé plus d’un milliard de dollars (760 millions de livres sterling), auprès d’investisseurs dont le géant américain des puces informatiques Nvidia et le fonds qui gère la fortune personnelle du fondateur d’Amazon, Jeff Bezos.
Le cycle de financement dit d’amorçage – le premier cycle de levée de fonds de démarrage – est l’un des plus importants d’Europe.
publicité
publicité
Les grands modèles linguistiques (LLM) comme ChatGPT sont très efficaces dans des domaines tels que le codage, les problèmes mathématiques et la génération de texte, explique LeCun.
Mais il estime que ce problème est bien défini et prévisible.
“Ils (les LLM) se contentent d’acquérir des connaissances… Ils peuvent régurgiter des choses, vous les entraînez à régurgiter, mais ils ne sont pas particulièrement intelligents. Ils n’ont pas une compréhension de la situation”, a-t-il déclaré.
Dans le monde réel, toute action entraîne une variété terrifiante de résultats, ce qui nécessite un type d’intelligence artificielle plus flexible.
LeCun tenait le stylo à la verticale sur sa pointe. Que se passe-t-il lorsque vous lâchez prise, demande-t-il ? Même un petit enfant saura que le stylo va s’effondrer. Mais aucun être humain ne prenait la peine de deviner dans quelle direction le stylo allait tomber, il n’y avait aucun moyen de le savoir.
publicité
publicité
Mais un LLM peut essayer de produire une prédiction unique sur le prochain mouvement de notre stylo, basée sur le modèle statistique des données d’entraînement.
Ces prédictions sont presque certainement fausses, car le système ne raisonne pas sur la réalité physique de la situation – il génère ce qui semble statistiquement plausible.
LeCun a déclaré que le système que son entreprise développe, appelé Joint Embedding Predictive Architecture (JEPA), est destiné à résoudre ces problèmes.
Cela crée une abstraction du monde réel qui permet d’évaluer les résultats des actions.
La création de ces abstractions implique des mathématiques difficiles, mais elles filtrent essentiellement les informations inutiles, ne laissant à l’IA que des images utiles au monde.
publicité
publicité
Dans le cas du stylo, l’IA saura qu’il ne sert à rien de prédire dans quel sens il tombera.
Les robots humanoïdes ont besoin d’une intelligence artificielle capable de naviguer dans le monde réel (Bloomberg via Getty Images)
Construire une intelligence artificielle plus flexible est une priorité pour l’industrie de la robotique.
Des milliards de dollars ont été investis dans la construction de robots humanoïdes et leurs réalisations sont chaque année plus impressionnantes.
Mais les former à effectuer en toute sécurité des tâches ménagères telles que repasser ou empiler le lave-vaisselle s’est avéré difficile et coûteux.
Et, selon LeCun, les modèles d’IA actuels ne fonctionneront probablement pas bien dans cet environnement.
“Les LLM représentent en grande partie l’espoir de la robotique”, dit-il.
“Il prétend que d’une manière ou d’une autre, en augmentant simplement le LLM, nous parviendrons à une intelligence super humaine, cela n’arrivera tout simplement pas.”
publicité
publicité
De nombreux acteurs de l’industrie de l’IA sont d’accord avec LeCun.
Ingmar Posner en fait partie. Il est professeur d’intelligence artificielle appliquée à l’Université d’Oxford et dirige son laboratoire d’IA appliquée. Il est également boursier Amazon.
“Mon point de vue est que la prochaine décennie sera vraiment axée sur des systèmes capables d’expliquer… Vous avez besoin d’un modèle capable de répondre à des questions telles que : Qu’est-ce qui cause quoi ? Que se passe-t-il si je fais autre chose – comme si j’agis différemment ?”
Posner et son équipe d’une dizaine de chercheurs travaillent depuis quatre ans sur des formes alternatives d’IA, qui entrent dans une catégorie vague appelée modèles mondiaux.
publicité
publicité
Bien que le modèle mondial existe depuis des décennies, l’une des inspirations de ce travail a été un article influent publié en 2018 par David Ha et Jurgen Schmidhuber.
Leur vision est que, grâce aux progrès de l’apprentissage automatique et de la puissance de calcul, l’IA peut apprendre à faire quelque chose uniquement à partir d’une simulation « mentale » apprise de ce à quoi ressemble le monde.
Depuis 2018, l’idée a catalysé un nombre important de recherches sur les modèles mondiaux, notamment le Dreamer World Model de Google. L’année dernière, la variante Dreamer a étudié comment collecter des diamants dans le jeu vidéo Minecraft, en imaginant des scénarios futurs pour aider à la prise de décision.
Posner espère que le système d’IA utilisé par son équipe constituera un autre pas en avant. Il appelle cela un « modèle mondial mécanique », qui permettra d’acquérir des connaissances de manière à ce que l’IA puisse fonctionner efficacement.
publicité
publicité
“Vous avez besoin d’un système capable de partager et d’organiser les connaissances de manière à pouvoir les mémoriser, les combiner et les modifier lorsque cela est important”, explique Posner.
Il est très difficile de dire combien de temps il faudra pour développer ce nouveau modèle, a-t-il ajouté.
“Si vous demandez à quelqu’un en 2017 ou 2018 combien de temps il faudra avant que vous puissiez avoir quelque chose comme ChatGPT, il vous dira : ‘Des décennies, des décennies de travail’.”
La version originale de ChatGPT a été lancée en novembre 2022.
D’autres travaux dans le modèle mondial sont effectués par DeepMind (qui fait partie du propriétaire de Google, Alphabet) avec le modèle Genie et Wayve, basé à Londres, dispose d’un système appelé Gaia.
publicité
publicité
Pendant ce temps, le pionnier de l’IA, Fei-Fei Li, a créé World Labs à San Francisco en 2023 pour développer de nouveaux modèles d’IA.
LeCun a déclaré qu’AMI Labs passerait le reste de cette année à affiner son modèle d’IA et s’attend à ce qu’il soit utilisé l’année prochaine, initialement dans des environnements industriels.
Si cela réussit, il est temps de voir grand.
“À terme, nous aurons une sorte de système de renseignement générique qui peut être appliqué à presque tout dans le monde avec un minimum de formation ou de réglage précis”.
Qu’arrivera-t-il aux humains dans un monde où les robots pourront fonctionner de manière indépendante ?
“Nous avons encore besoin que les humains sachent quelles questions poser, quoi créer, quoi créer, ce qui est vraiment l’aspect humain”, a-t-il déclaré.
publicité
publicité
L’IA fonctionnera pour nous, a-t-il ajouté.
“Notre interaction avec les futurs systèmes d’IA – même s’ils sont plus intelligents que nous – sera comme l’interaction entre un capitaine d’industrie ou un leader politique et son équipe d’assistants – beaucoup sont plus intelligents qu’eux.”