#2/10 - Série

Qu'appelle-t-on IA ?

Voir, prédire, générer, agir : comprendre enfin ce qu’on met derrière le mot IA.

Écouter sur :

Publié le16/06/2026

Enregistré le14/06/2026

Que met-on vraiment derrière le mot “IA” ?

ChatGPT, algorithmes, robots, voitures autonomes, superintelligence : le même terme désigne aujourd’hui des réalités très différentes. Pour avancer dans l’enquête, il faut donc commencer par clarifier.

Dans cet épisode, on revient au piège du mot “intelligence”, aux origines du terme, puis aux grandes capacités de l’IA : voir, prédire, générer, agir. On explore aussi la mécanique des modèles actuels, des patterns au machine learning, des LLM aux agents.

Une cartographie simple pour comprendre ce qu’est l’IA aujourd’hui, ce qu’elle sait vraiment faire, et pourquoi elle nous fascine autant qu’elle nous échappe.

Au programme dans cette série :

1. La machine qui parle, comment cette technologie a basculé dans nos vies.

2. Qu'appelle-t-on IA ? Ce que c'est, et ce que ce n'est pas.

3. AGI, le rêve et la peur, cette super-intelligence qu'on nous promet.

4. La course et ses bâtisseurs, l'argent, le récit, ceux qui tiennent la barre.

5. La mégamachine, le corps physique de l'IA, ce qu'elle consomme, ce qu'elle rejette.

6. L'humain sous assistance, ce que ça nous fait, à nous, individuellement.

7. Le monde commun, ce que l'IA fait à la vérité partagée et au lien entre nous.

8. La société sous influence, le pouvoir, la surveillance, et ceux qui l'assument.

9. Qu'est-ce que l'intelligence ? le pas de côté philosophique.

10. Que peut-on encore choisir ? ce qui reste possible.

Une série pour les curieux, les inquiets, les enthousiastes lucides, et tous ceux qui sentent que cette histoire les concerne, sans toujours savoir par où la prendre.

Le mot “IA” embrouille plus qu’il ne clarifie

Le terme “intelligence artificielle” désigne aujourd’hui des réalités très différentes : chatbot, algorithme de recommandation, voiture autonome, robots tueurs ou superintelligence.
Cette confusion rend le débat difficile : on croit parler du même objet, mais on parle souvent d’une dizaine de choses à la fois.
Le mot “intelligence” ajoute un malentendu : il pousse à attendre d’une machine une intelligence humaine, complète et unifiée, alors qu’elle peut être très performante sur des tâches précises.

Déplacer la question : moins “est-ce intelligent ?”, plus “que sait faire la machine ?”

Le test de Turing ne règle pas la question de l’intelligence ; il la déplace vers les effets produits par la machine.
Plutôt que de se demander si une IA “pense”, il est plus utile de regarder ce que ces systèmes savent faire concrètement.
Cette approche permet de sortir du débat abstrait pour construire une carte plus lisible des capacités actuelles.

Quatre grandes capacités : voir, prédire, générer, agir

Voir : reconnaître, classer, percevoir, transcrire, traduire, repérer des formes ou des anomalies.
Prédire : anticiper la suite à partir de ce qui a été observé, qu’il s’agisse d’une vidéo recommandée, d’une panne, d’une fraude ou du mot suivant dans une phrase.
Générer : produire du texte, des images, du code, des voix ou des vidéos à partir de régularités apprises.
Agir : passer de la réponse à l’exécution, en confiant à une machine un but, des étapes et des outils pour le réaliser.

Le cœur du mécanisme : repérer des régularités

La notion centrale est celle de régularité, ou pattern : des motifs qui reviennent dans la langue, les images, la musique, les marchés, le vivant ou les règles de la physique.
Apprendre, dans ce cadre, consiste à repérer ce qui se répète, ce qui va ensemble, ce qui est probable.
L’IA actuelle repose largement sur cette capacité à extraire des régularités à partir de masses d’exemples.

De la règle écrite à l’apprentissage par exemples

Dans la programmation classique, on écrivait des règles à la main : “si ceci, alors cela”.
Cette approche fonctionne pour des cas simples, mais se heurte vite à la complexité du monde réel.
Le machine learning inverse la logique : on fournit des exemples, un cadre, des objectifs, puis la machine ajuste ses paramètres pour détecter les motifs pertinents.

Une machine entraînée, pas entièrement autonome

L’IA n’apprend pas “toute seule” : des humains choisissent les données, définissent les objectifs, corrigent, évaluent et annotent parfois.
Mais elle n’est plus programmée au sens classique : on ne lui écrit pas toutes les règles du monde.
Cette zone intermédiaire explique une partie du trouble : on construit un cadre d’apprentissage, puis le système développe des capacités qu’on ne maîtrise pas toujours finement.

Entraînement et inférence : deux moments à distinguer

L’entraînement correspond à la phase où la machine ingère des exemples et ajuste ses paramètres internes.
L’inférence correspond à l’usage du modèle : quand on lui pose une question, on utilise un système déjà entraîné.
La progression récente repose sur un levier simple dans son principe : plus de données, plus de calcul, de meilleures méthodes, puis des modèles plus capables.

Les LLM : prédire la suite, à une échelle colossale

Les grands modèles de langage fonctionnent à partir d’un mécanisme déroutant : prédire le mot suivant, puis recommencer.
Pris isolément, cela ressemble à une simple machine à compléter les phrases.
Poussé à très grande échelle, ce mécanisme finit pourtant par produire des conversations, des résumés, du code, des poèmes ou des explications complexes.

Puissance sans compréhension claire

Une IA peut produire des résultats impressionnants sans comprendre le monde comme un humain, avec un corps, une expérience et une intention.
Elle prolonge des motifs de manière plausible, à partir de ce qu’elle a appris dans les données.
Cette puissance sans compréhension pleinement établie explique à la fois la fascination et la méfiance.

Émergence, hallucinations et biais

Certaines capacités semblent apparaître sans avoir été explicitement programmées : code, traduction, résolution de problèmes.
La même machine peut résoudre des problèmes complexes et se tromper sur des choses très simples.
Parce qu’elle apprend à partir de textes humains, elle hérite aussi de nos erreurs, de nos biais et de nos angles morts.

Rupture ou continuité sous stéroïdes ?

Les interprétations divergent : certains voient dans l’IA récente une révolution comparable à l’ordinateur personnel, d’autres une continuité de l’apprentissage automatique poussé à très grande échelle.
La question reste ouverte : apprendre des régularités à très grande échelle produit-il une forme inédite d’esprit, ou seulement une imitation très convaincante ?
Le point prudent consiste à refuser les deux simplifications : traiter ces machines comme des sujets, ou les réduire à de simples outils ordinaires.

Le tournant agentique : quand l’IA commence à agir

Avec les agents, la machine ne se contente plus de répondre : on lui confie un but, et elle tente de l’atteindre en plusieurs étapes.
Elle peut utiliser des outils, chercher des informations, écrire du code, corriger ses erreurs et poursuivre une tâche sans surveillance constante.
Le changement est important : demander un avis et déléguer un geste ne posent pas les mêmes questions.

De la parole vers le monde physique

L’IA s’est déplacée de la coulisse vers la parole, puis de la parole vers l’action.
Le branchement possible de ces capacités sur des robots, des voitures, des drones ou des machines industrielles ouvre des implications concrètes pour les corps, les métiers, les déplacements et la sécurité.
La carte proposée tient donc en quatre verbes : voir, prédire, générer, agir.

Concepts et repères techniques

IA, un mot-valise
Le terme recouvre des réalités très différentes : ChatGPT, algorithmes de recommandation, voiture autonome, robots, superintelligence. C’est l’un des points de départ de la confusion.
Voir, prédire, générer, agir
La carte proposée pour s’y retrouver : reconnaître et classer, anticiper la suite, produire du contenu, puis exécuter des tâches.
Régularités / patterns
Idée centrale : les systèmes actuels apprennent en repérant des motifs qui se répètent dans les données.
Apprentissage automatique / machine learning
Approche qui consiste à fournir des exemples à la machine plutôt qu’à lui écrire toutes les règles à la main.
Entraînement / inférence
L’entraînement correspond à la phase où le modèle apprend à partir d’exemples. L’inférence correspond à son usage concret, quand il produit une réponse.
LLM, large language model
Les grands modèles de langage, famille à laquelle appartiennent ChatGPT, Claude, Gemini, Grok ou Mistral Vibe.
GPT, generative pre-trained transformer
Acronyme derrière ChatGPT, présenté comme un type de grand modèle de langage devenu presque synonyme d’IA conversationnelle.
Hallucinations
Terme utilisé pour désigner les réponses inventées ou fausses produites avec assurance par ces systèmes.
Agents
Systèmes auxquels on confie un but, et qui peuvent découper une tâche, utiliser des outils, chercher des informations, écrire du code ou recommencer après un échec.

Personnes citées

John McCarthy
Chercheur américain présenté comme celui qui a choisi le terme “intelligence artificielle” au milieu des années 1950.
Alan Turing
Mathématicien cité pour sa question “les machines peuvent-elles penser ?” et pour le test qui déplace la question vers l’imitation dans une conversation écrite.
Bill Gates
Cité parmi ceux qui voient dans ChatGPT une révolution comparable à l’arrivée de l’ordinateur personnel.
Yann LeCun
Présenté comme l’un des pères de ces techniques, plus sceptique sur l’idée d’une rupture fondamentale.
Gilbert Simondon
Philosophe cité pour l’idée qu’on oscille souvent entre deux erreurs face aux machines : les prendre pour des sujets, ou les mépriser comme de simples outils.

Outils, modèles et entreprises évoqués

ChatGPT, Claude, Gemini, Grok, Mistral Vibe
Exemples de grands modèles de langage ou d’IA conversationnelles mentionnés pour situer la famille des LLM.
GPT-3, GPT-4, GPT-5.5, Claude 3, Claude 4
Exemples de générations successives de modèles, associés à des paris différents en puissance, fiabilité, vitesse, autonomie ou garde-fous.
Anthropic / Claude Code
Claude Code est cité comme un outil utilisé par les développeurs pour écrire et corriger du code de manière de plus en plus autonome.
OpenClaw, Manus, Hermes
Exemples d’agents mentionnés pour illustrer la vitesse du tournant agentique et l’apparition d’outils capables d’enchaîner des tâches.
Google / Gemini, Microsoft / Copilot, Alibaba / Qwen, Apple
Exemples d’acteurs qui intègrent désormais des agents dans des outils utilisés à grande échelle.

Repères historiques et culturels

Dartmouth, années 1950
Séminaire fondateur où le terme “intelligence artificielle” est associé à un nouveau programme de recherche.
Test de Turing
Jeu d’imitation : si l’on ne distingue plus une machine d’un humain dans une conversation écrite, la question se déplace vers ce que la machine produit comme effet.
Siri et Skynet
Deux références utilisées pour montrer l’écart entre les usages ordinaires et les imaginaires extrêmes associés au même mot “IA”.
Fin 2022
Moment où la famille générative explose dans le débat public, avec l’arrivée de machines capables de produire des réponses en langage courant.
Depuis 2025
Repère utilisé pour situer la bascule vers les agents, c’est-à-dire des systèmes qui ne se contentent plus de répondre mais commencent à agir.

Concepts à creuser

Le « perroquet stochastique » (stochastic parrot). Forgé en 2021 par la linguiste Emily Bender et l'informaticienne Timnit Gebru, le terme désigne un système capable d'assembler des séquences de langage très plausibles sans aucun accès au sens, exactement la « machine à compléter les phrases » de l'épisode. C'est la formulation la plus nette de la thèse « ça imite sans comprendre ». À lire en sachant qu'elle est contestée, ce qui la rend d'autant plus stimulante. → Article fondateur : https://dl.acm.org/doi/10.1145/3442188.3445922

La « chambre chinoise » (John Searle, 1980). Une expérience de pensée de quarante ans antérieure aux LLM, mais qui pose exactement leur problème : un homme qui manipule des symboles chinois selon des règles, sans comprendre un mot de chinois, produit-il de la pensée ? Le socle philosophique de la distinction « manipuler des signes » contre « comprendre », au centre de l'épisode. → https://plato.stanford.edu/entries/chinese-room/

Les capacités émergentes (emergent abilities). L'épisode dit qu'« en augmentant la dose, ça bascule » et que des capacités « apparaissent toutes seules ». Le concept à creuser porte ce nom précis : des aptitudes qui ne surgissent qu'au-delà d'une certaine taille, et que personne n'a programmées. Sujet fascinant et vivement débattu, certains chercheurs y voyant un mirage de mesure plutôt qu'un vrai seuil.

Symbolique contre apprentissage : la longue querelle. L'épisode raconte que le machine learning « a fini par tout rafler ». Derrière, il y a un demi-siècle de bataille entre deux écoles : l'IA symbolique (donner des règles explicites) et l'IA par apprentissage (laisser émerger des régularités). Comprendre cette opposition, c'est comprendre pourquoi l'approche par patterns a gagné, et ce qu'elle a peut-être perdu en route.

Livres

Melanie Mitchell, Artificial Intelligence: A Guide for Thinking Humans (2019). Sans doute le meilleur livre pour prolonger exactement le 2. Informaticienne au Santa Fe Institute, ancienne élève de Douglas Hofstadter, Mitchell explique comment ces systèmes marchent, comment ils échouent, et surtout pointe « le profond décalage entre la reconnaissance de motifs et la compréhension véritable ». Sobre, drôle, sans sensationnalisme : le ton même de l'épisode. → Éditeur : https://us.macmillan.com/books/9780374257835

Douglas Hofstadter, Gödel, Escher, Bach (1979 ; traduit en français sous le titre Gödel, Escher, Bach : les Brins d'une Guirlande Éternelle). Un classique inclassable, lauréat du prix Pulitzer, sur ce que pourraient être la pensée, le sens et l'auto-référence. Antérieur de loin aux LLM, mais c'est la matrice intellectuelle de toute une génération de chercheurs, et il pose en profondeur la question que l'épisode effleure : à partir de quoi un système de symboles peut-il « signifier » quelque chose ? (Vérifier la disponibilité de l'édition française courante chez votre libraire.)

Penseuses et penseurs

Douglas Hofstadter. Le théoricien de l'analogie comme « cœur de la cognition ». Sa question hante le 2 : si l'intelligence humaine repose sur notre capacité à faire des analogies et à saisir l'essence d'une situation, une machine qui calcule des probabilités de mots fait-elle quelque chose de comparable, ou de tout autre ?

Gary Marcus. Psychologue et chercheur, voix critique persistante de l'approche « tout par apprentissage ». Il défend l'idée que prédire des régularités ne suffira pas à produire un raisonnement fiable, et plaide pour un retour de la dimension symbolique. Le contradicteur utile du récit dominant de l'épisode.

Yoshua Bengio. L'un des pionniers de l'apprentissage profond (la technique même que décrit l'épisode), aujourd'hui l'une des voix les plus mesurées sur ses limites et ses risques. Le lire, c'est entendre un bâtisseur de la méthode en interroger lui-même les frontières.

Articles et ressources

« You Are Not a Parrot » (Elizabeth Weil, New York Magazine, 2023). Portrait d'Emily Bender et synthèse accessible du débat « comprendre contre imiter », pour un public non spécialiste. Une bonne porte d'entrée avant l'article académique. → https://nymag.com/intelligencer/article/ai-artificial-intelligence-chatbots-emily-m-bender.html

L'expérience « Quick, Draw! » (Google). Pour sentir concrètement ce qu'est l'apprentissage par régularités : un jeu où l'on dessine et où une IA devine, entraînée sur des millions de croquis. La notion de « pattern » de l'épisode rendue tangible en deux minutes. → https://quickdraw.withgoogle.com/

Yann Lecun 23:20 : https://www.youtube.com/watch?v=Z208NMP7_-0

Série #IA, épisode 2.

Qu'appelle-t-on IA ?

GENERIQUE*

Un truc que j'aime bien faire quand je parle d'un sujet, c'est de commencer par essayer de le définir.

C'est quoi l'Intelligence artificielle, de quoi on parle au juste ?

Parce que ces deux mots qu'on entend cinquante fois par jour, en fait presque personne ne les emploie pour désigner tout à fait la même chose.

Faites le test autour de vous.

Pour votre voisin, l'IA, c'est ChatGPT, l'appli à qui on parle.

Pour votre tante un peu geek, c'est l'algorithme qui choisit ses vidéos le soir, ou le filtre qui trie ses mails.

Pour votre garagiste accroc à Tik Tok, c'est la voiture qui se gare toute seule.

Et votre neveu, lui imagine des robots tueurs ou cette superintelligence à venir dont on nous promet qu'elle va soit nous sauver, soit nous remplacer, parfois les deux avant le déjeuner ou avant 2040 selon son humeur.

Même mots, même acronyme. Et, à chaque fois, une version différente.

C'est pour ça qu'on a tant de mal à parler d'IA de manière claire : on croit parler de la même chose, et on parle en réalité d'une dizaine de choses à la fois. C'est un mot valise. Une bonne grosse malle de voyage dans laquelle on fourre tout : le correcteur orthographique et le successeur possible de l'humanité, Siri et Skynet. Et donc forcément les débats partent dans tous les sens.

Un terme piégé donc.

D'autant plus piégé que le mot "intelligence" est déjà lui-même assez douteux, en tout cas à contour variable et par ailleurs plutôt chargé.

L'intelligence ça désigne pêle-mêle la mémoire, la logique, le la

Romeo https://www.youtube.com/watch?v=nCh8sNyeI3Y

02:01

Donc, sans le vouloir, quand on accole cette étiquette d'intelligence à une machine, on lui prête beaucoup de choses. On attend d'elle qu'elle soit « intelligente » au sens plein, unifié, humain du terme, alors qu'elle est peut-être seulement très douée pour une chose très précise. En fait le mot nous fait espérer le mauvais objet. Et, du coup, il nous empêche de voir ce qu'elle est vraiment.

Pour l'anecdote il faut savoir que ce terme "IA" n'est pas tombé du ciel. Il a été choisi, par un homme : l'Américain John McCarthy.

Au milieu des années 1950, McCarthy et quelques autres préparent un séminaire qui restera fondateur, à Dartmouth, aux États-Unis. Il leur faut un nom pour ce nouveau programme de recherche. C'est John qui tranche : ce sera « intelligence artificielle ». Le terme est ambitieux, un peu provocateur, et il a tout de suite fait débat. Mais il sonne bien, il fait rêver, il attire l'attention, et plus important encore les financements.

70 ans plus tard, on traîne toujours ce baptême, avec sa promesse et son malentendu attachés l'un à l'autre.

Quelques années plus tôt, le mathématicien Alan Turing avait déjà posé une question qui nous obsède encore : « les machines peuvent-elles penser ? »

Mais, malin qu'il était, il l'avait aussitôt contournée. Plutôt que de se perdre dans une définition du mot « penser », ce qui, avouons-le, est un cauchemar philosophique sans fond, il propose ce qu'on appellera plus tard le test de Turing : une sorte de jeu d'imitation.

Concrètement, si, dans une conversation écrite, vous n'arrivez plus à distinguer la machine d'un humain, alors la machine passe le test et peut-être faut-il alors cesser, au moins provisoirement, de chicaner sur les mots, et regarder ce que la machine est capable de produire comme effet.

Ce test ne règle donc pas la question de l'intelligence, il la déplace. Et c'est exactement ce déplacement qui m'intéresse ici. On reviendra beaucoup plus tard dans cette série sur ce que « penser » ou « comprendre » pourrait vouloir dire pour une machine. Pour l'instant, je vous propose de faire comme Turing : reposer la valise, oublier un moment le mot « intelligence », et poser une question plus terre à terre. Pas : « est-ce que c'est intelligent ? », mais donc : qu'est-ce que ces systèmes savent faire, concrètement ?

Et là, bonne nouvelle, ça se range dans des cases bien nettes, comme on les aime. Derrière le fouillis du mot, il y a en réalité quelques grandes familles de choses que l'IA sait faire.

On peut en retenir quatre.

La première, c'est voir.

Percevoir, reconnaître, classer. Distinguer un visage sur une photo, une tumeur sur une radio, une pièce défectueuse au bout d'une chaîne de montage. Transcrire une voix en texte, reconnaître une chanson en trois secondes, traduire d'une langue à l'autre.

Souvenez-vous des systèmes discrets dont je parlais au premier épisode, ceux qui travaillaient déjà dans nos coulisses depuis des années : pour beaucoup, c'est ça qu'ils font. Ils voient et ils trient.

La deuxième famille, c'est prédire.

À partir de ce qu'elle a vu, la machine devine la suite. Elle vous recommande la prochaine vidéo, anticipe la panne d'une machine-outil avant qu'elle ne tombe, estime le risque d'un crédit, repère une fraude dans un torrent de transactions. Et puis il y a une forme de prédiction, en apparence anodine, qui s'est révélée étonnamment être le cœur du réacteur : prédire le mot suivant dans une phrase. C'est, pour l'essentiel, le mécanisme de base derrière ChatGPT. Mot après mot, ils calculent ce qui a le plus de chances de venir ensuite. On y revient dans un instant, parce que c'est plus vertigineux qu'il n'y paraît.

La troisième famille, c'est générer.

Là, on voit le résultat de cette prédiction poussée à très grande échelle : la machine produit du neuf, un texte, une image, du code, une voix, une vidéo. C'est cette famille générative qui a explosé dans le débat public fin 2022, notamment parce qu'elle nous fascine. Pour la première fois, des millions de gens ont eu sous les yeux une machine capable de produire des réponses en langage courant — une machine qui, par moments, brouille pour de bon le vieux test de Turing.

La quatrième, la plus récente, c'est agir. Et comme c'est elle qui change tout en ce moment, je la garde pour la fin.

Le point important, c'est que ce ne sont pas quatre machines différentes posées sur une étagère. C'est une même logique de fond qui irrigue ces quatre familles.

Et prenons juste un instant pour mesurer ce que ça veut dire. Une même famille de méthodes qui sait reconnaître un visage, deviner le mot suivant, écrire une page, et déjà mener une tâche à votre place.

Aucun outil, dans toute l'histoire humaine, n'avait couvert un éventail pareil ; le marteau enfonce des clous, le téléphone transporte la voix, chaque machine faisait sa chose. Là, on a une seule famille de systèmes qui déborde sur presque tout ce qu'on croyait réservé à l'esprit et qui déborde déjà, via les robots, sur ce qu'on croyait réserver à nos corps. Qu'on trouve ça emballant ou inquiétant, et ce sera sans doute les deux, il faut commencer par le reconnaître : c'est, en soi, assez dingue.

Alors comment une même approche peut-elle faire des choses aussi différentes ?* Voir une tumeur, écrire un poème, conduire une voiture, des choses qui n'ont, a priori, rien à voir.

La réponse tient en un mot et c'est sans doute l'idée la plus importante de tout cet épisode : les régularités. Ce qu'on appelle aussi des motifs, ou, en anglais, des patterns.

C'est quoi des régularités ? On va essayer de faire simple et clair, parce que ça éclaire vraiment tout le reste.

Il y a une évidence qu'on ne remarque même plus : il y a des régularités partout.

Dans la langue ce sont des mots qui reviennent ensemble, des tournures, une grammaire.

Dans les images : un visage par exemple c'est presque toujours la même chose. C'est deux yeux, un nez, une bouche, dans un certain agencement.

Dans la musique : un nombre limité d'instruments, de notes, des structures de chanson couplet/refrain, etc…

Dans les marchés, dans le vivant, dans les règles de la physique, jusque dans notre ADN. Le monde est cousu de motifs qui se répètent.

Et les repérer, c'est une grande partie de ce qu'on appelle apprendre : un enfant à qui personne n'a expliqué la grammaire se met pourtant à parler juste, parce qu'il a entendu des milliers de phrases et en a extrait, tout seul, les régularités. Il comprend sans qu'on lui explique comment marche la gravité, à force de faire tomber sa cuillère, à force de tomber lui-même.

La science, au fond, ne fait pas autre chose que de traquer les régularités de la nature pour en tirer des lois de plus en plus précises.

L'intelligence artificielle d'aujourd'hui, c'est exactement ça, ça repose sur ce principe de recherche de patterns.

Et ça porte un nom : l'apprentissage automatique ; en anglais, le machine learning.

En gros, au lieu de donner des règles à la machine, de lui donner des instructions précises, une séquence à exécuter, on s'est mis à la laisser trouver les régularités toute seule, en la laissant s'amuser avec des montagnes d'exemples, des tonnes de données.

Pour mesurer la bascule, rappelez-vous comment on programmait avant. Pendant des décennies, programmer, c'était écrire des règles, une à une, à la main. Un filtre anti-spam ? « Si le message contient le mot gagnant, ou trois points d'exclamation, ou une promesse d'héritage lointain, alors c'est un indésirable. »

If… then…

Ça marche pour les cas simples, mais ça s'effondre dès que le monde se complique : il y a une infinité de façons d'écrire un mail douteux, comme il y a une infinité de façons de dessiner un chat. Aucun humain ne peut toutes les prévoir, et donc les coder.

Le machine learning prend le problème par l'autre bout. On ne donne plus seulement les règles : on donne des exemples, parfois des millions, parfois beaucoup plus, et on laisse la machine en extraire les régularités. Alors attention, ça ne veut pas dire qu'elle apprend toute seule dans son coin, comme un enfant sauvage du numérique. Des humains choisissent les données, définissent les objectifs, corrigent, évaluent, annotent parfois. Pour apprendre à reconnaître un chat, par exemple, il faut souvent des images déjà classées : ça, c'est un chat ; ça, ce n'en est pas un.

Donc la machine n'apprend pas exactement "toute seule". Mais elle n'est plus programmée au sens classique non plus. On ne lui écrit pas toutes les règles du monde. On construit plutôt un cadre d'apprentissage, on lui fournit des exemples, on fixe des objectifs, puis elle ajuste elle-même ses paramètres pour repérer ce qui revient, ce qui va ensemble, ce qui est probable. Et comme nous le verrons, il y a une course pour savoir qui parvient à donner le plus de données, à ces IA. Mais mettons ça de côté pour l'instant.

Il y a là une ironie que j'aime beaucoup. John McCarthy, celui qui a forgé le mot. Vers la fin de sa vie, il expliquait que les machines, justement, n'arrivaient pas à apprendre en lisant ce qui était écrit, qu'il leur manquait pour ça une forme de compréhension.

John McCarthy https://www.youtube.com/watch?v=Ozipf13jRr4

03:50

Or c'est devenu, presque mot pour mot, la recette d'aujourd'hui : on les fait apprendre en leur faisant avaler tout ce qui a été écrit. Ce qu'il jugeait impossible, du moins sous cette forme, est devenu l'un des paris centraux de l'IA d'aujourd'hui. Gardez quand même sa réserve dans un coin — « faute de compréhension ».

Tout cela se joue en deux temps,

D'abord l'entraînement : la machine ingère les exemples et ajuste, par essais et erreurs, des milliards de minuscules réglages internes, ce qu'on appelle ses « poids ».

C'est long, coûteux, et ça se fait en gros une fois.

Ensuite vient l'inférence : chaque fois que vous vous servez du modèle. Quand vous tapez une question, quand vous demandez un résumé, quand vous faites générer une image, vous ne réentraînez pas toute la machine. Vous utilisez un modèle déjà entraîné, qui produit une réponse à partir de ce qu'il a appris.

Et voici la découverte qui a tout fait basculer : on s'est aperçu qu'en augmentant la dose, plus d'exemples, plus de puissance de calcul, de meilleures méthodes d'entraînement, un système qui bafouillait pouvait se mettre à rédiger, à coder, à résoudre des problèmes, parfois à réussir des examens.

C'est LE levier central de l'IA récente qui nous a fait rentrer dans une nouvelle approche dont on n'a pas encore bien appréhender les conséquences : plus de données, plus de calcul, puis des modèles plus capables. La course est déjà lancée.

C'est aussi ce qui explique la succession permanente des modèles. GPT-3, GPT-4, 5.5, Claude 3, Claude 4, …

Ces noms et ces numéros ne sont pas seulement du marketing, même s'il y en a, évidemment. Ils désignent des générations de systèmes entraînés, ajustés, testés, parfois spécialisés, avec plus ou moins de données, de calcul, de garde-fous, de capacités multimodales. Une nouvelle version, dans ce monde-là, ce n'est pas seulement un bouton déplacé ou une interface un peu plus jolie. C'est souvent un nouveau pari : plus de puissance, plus de fiabilité, plus de vitesse, plus d'autonomie, ou un meilleur compromis entre tout cela. Et pour chaque nouveau modèle, la promesse est de dépasser le concurrent évidemment.

GPT 5 https://www.youtube.com/watch?v=4H9pIAXkELw Claude Fable https://www.youtube.com/watch?v=Y9Wz2PV404E

Alors, pour récapituler un peu tout ça imaginez trois cercles emboîtés : le plus grand, c'est l'« intelligence artificielle », l'ambition générale ; à l'intérieur, on trouve l'apprentissage automatique, l'approche qui a fini par tout rafler, du moins pour le moment ; et à l'intérieur de ce sous-groupe on trouve, le génératif, qui génère, qui est très bon pour créer des choses, qui écrit qui dessine, etc…. Quand on vous parle de ChatGPT, vous êtes tout au fond, dans le plus petit cercle à l'intérieur du cercle des IA génératives.

Et cette famille particulière, celle qui manie le langage, porte un nom qu'on entend partout : LLM, pour large language models — les grands modèles de langage, en bon français. ChatGPT, Claude, Gemini, Grok, Mistral Vibe : ce sont des LLM.

C'est d'ailleurs l'acronyme derrière le « GPT » de ChatGPT : generative pre-trained transformer. C'est un type de grand modèle de langage, devenu si célèbre qu'on l'emploie presque comme synonyme d'IA conversationnelle.

Mais laissons les acronymes. Parce que sous ces noms savants, le mécanisme, lui, est d'une simplicité assez déroutante. Alors que ce sont les stars de l'IA, on va prendre le temps de voir un peu comment fonctionne concrètement un LLM. En fait, il fait une seule chose, il prédit le mot suivant.

Pour bien comprendre je vais prendre un exemple.

Je vous donne un début de phrase — « le chat dort sur le… ». Sans réfléchir, vous sentez venir « canapé », « tapis », « lit », et a priori pas « citron » ou "huile de vidange", à moins d'être poète ou garagiste.

Eh bien la machine fait pareil, mais à une échelle colossale : ayant vu des milliards de phrases, elle a appris quels mots suivent d'habitude quels autres, et elle calcule, pour chaque mot possible, sa probabilité d'arriver ensuite. Elle en choisit un. Puis elle recommence, en intégrant le mot qu'elle vient d'ajouter. Mot après mot. C'est tout. Elle ne sait pas ce qu'est un chat ni un canapé, en tout cas pas comme nous, avec un corps et une expérience du monde. Elle prolonge la phrase de la façon la plus plausible. Elle utilise les patterns de notre langage, ses règles, ses régularités.

Dit comme ça, ça paraît assez dérisoire : une machine à compléter les phrases. Et c'est justement pour ça que c'est assez fou, et que ça a surpris tout le monde.

Parce que un peu contre toute attente, à force de devenir excellente à ce petit jeu, sur tout ce que l'humanité a écrit, elle finit par tenir une conversation, résumer un contrat, écrire un poème, expliquer un théorème de maths.

Et concrètement la prédiction du signe suivant, poussée à l'extrême, se met pour nous à ressembler à de la pensée.

Et le plus troublant, et ce qui n'avait d'ailleurs pas vraiment été anticipé par les chercheurs eux-mêmes, c'est que ça marche pour presque tout.

Parce que ce principe ne vaut pas que pour les mots. Un générateur d'images fait exactement la même chose avec des pixels ; un autre avec de la musique, du code, une voix. À chaque fois, le même geste : apprendre les régularités d'un type de données, puis en produire la suite la plus plausible. Le langage n'est qu'un cas particulier.

Mais gardons quand même la tête froide, parce que c'est important pour la suite. Une machine qui apprend des régularités, ce n'est pas pour autant une machine qui comprend. Elle ne sait pas pourquoi le chat dort sur le canapé ; elle a vu assez de phrases pour parier juste. C'est en fait de la statistique poussée à l'extrême.

Mais pourtant, il sort de tout ça des choses que personne n'a montré aux IA : des capacités qui apparaissent toutes seules, qui émergent de toute cette masse d'informations et de recoupements — en code, en traduction, en résolution de problèmes. C'est pour ça qu'on dit, à juste titre, qu'on élève ces systèmes autant qu'on les programme.

Comment de simples régularités statistiques font émerger tout ça, et si, au fond, ça « comprend » quoi que ce soit , c'est un mystère qu'on regardera en face beaucoup plus tard dans la série.

extrait HER : that’s what makes me me

Pour l'instant, on peut retenir ça: ces IA sont désormais extraordinairement puissantes, mais sans compréhension réelle des choses, au sens humain du terme. Les deux.

C'est cette double nature qui fait que la même machine qui résout des problèmes inédits se trompe parfois là où un enfant de cinq ans ne se tromperait pas, ou invente de toutes pièces une citation de Victor Hugo avec un aplomb tranquille, ce qu'on a pris l'habitude d'appeler des « hallucinations ». Par ailleurs, comme elle apprend tout de nous, de nos textes, elle hérite aussi de nos biais : elle reflète nos angles morts, et parfois les amplifie. Puissante et soudainement imprévisible donc, ce qui on s'en doute pose quelques problèmes liés au niveau de confiance qu'on peut accorder à ces petites bébêtes qu'on élève.

C'est d'ailleurs sur l'interprétation de cette puissance et du potentiel, que les experts cessent d'être d'accord et on peut en dire deux mots.

Quand ChatGPT débarque, certains, comme Bill Gates, parlent d'une révolution aussi importante que l'arrivée de l'ordinateur personnel. Au même moment, d'autres, comme Yann LeCun — l'un des pères de ces techniques —, haussent les épaules : pour eux, il n'y a là rien de fondamentalement nouveau, juste de l'apprentissage automatique poussé à une échelle gigantesque.

Les deux camps ont des arguments sérieux. Et c'est toute la difficulté du sujet : on ne sait pas encore si « apprendre des régularités à très grande échelle » finit par faire émerger une forme inédite d'esprit, ou seulement une imitation très, très convaincante. Une rupture, ou de la simple continuité sous stéroïdes qui nous donne l'illusion d'une rupture ? Je ne vais pas trancher ici, et, très honnêtement, je ne suis pas certain que quiconque le puisse aujourd'hui.

Le philosophe Gilbert Simondon remarquait qu'on a tendance, devant les machines, à osciller entre deux erreurs : les prendre pour des sujets, ou les mépriser comme de simples outils. Pour l'instant, ce qu'on peut dire sans se mentir, c'est que ce n'est ni un cerveau, ni une calculette. C'est autre chose, qu'on est encore en train d'apprendre à nommer.

https://www.youtube.com/watch?v=lh15XbuUEgU 0:13 R2D2

Il me reste une famille à reprendre, celle que j'ai mise de côté tout à l'heure. Agir.

Et si je l'ai gardée pour la fin, c'est parce que c'est elle qui bouge le plus vite en ce moment, et qu'elle est peut-être en train de changer la nature même du sujet.

Jusqu'ici, je vous ai décrit une machine à qui l'on demande quelque chose, et qui répond. Un outil qu'on consulte, comme on consulte un dictionnaire en plus bavard. Mais depuis 2025, on a basculé dans autre chose. On parle désormais d'agents.

Un agent, ce n'est plus seulement une machine qui répond : c'est une machine à qui on confie un but, et qui se débrouille pour l'atteindre. Elle découpe la tâche en étapes, se sert d'outils, écrit et corrige du code, va chercher des informations en ligne, recommence quand elle échoue, et continue parfois pendant des heures sans qu'on la surveille.

[INSERT AUDIO — courte démo / voix off : un agent qui exécute une tâche en plusieurs étapes, fin 2025-2026.]

Les premiers à en faire l'expérience, ce sont les développeurs : un outil d'Anthropic, Claude Code, s'est mis à écrire et corriger des programmes presque tout seul, et est devenu en quelques mois un véritable phénomène.

Puis, fin 2025, des logiciels en accès libre ont permis à n'importe qui de se fabriquer son propre agent personnel, branché sur ses mails, ses fichiers, parfois sa carte bancaire, pour réserver, commander, organiser à sa place.

L'un d'eux, baptisé OpenClaw, est devenu presque du jour au lendemain l'un des projets les plus visibles du moment dans le logiciel libre. À côté, d'autres ont poussé tout aussi vite : Manus, un agent généraliste venu de Chine ; Hermes, encore un autre, monté tout aussi vite.

Et je vous le dis franchement : il y a de bonnes chances que, le temps que vous écoutiez cet épisode, ces noms-là aient déjà changé parce qu'on parle d'un domaine qui se réécrit tous les mois.

Et ce ne sont pas que des bricolages d'enthousiastes. Les géants embarquent désormais des agents dans les outils que des milliards de gens utilisent déjà : Google dans Gemini, Microsoft dans Copilot, Alibaba avec Qwen en Chine et demain Apple dans votre iPhone évidemment, avec des prototypes encore plus autonomes qui s'essaient à naviguer sur le web et à enchaîner des tâches à votre place. Personne ne veut rater le coche.

Parce que, même si ces agents sont encore imprévisibles, même s'ils peuvent faire de grosses bourdes, le saut est réel. Quelque chose a bel et bien changé de nature. Tant que la machine se contentait de répondre, c'est nous qui décidions quoi faire de sa réponse. Quand elle agit, on lui délègue le geste lui-même. Et déléguer un geste, ce n'est pas la même chose que demander un avis.

Et l'étape d'après est déjà là : brancher ce type de capacités sur des robots, des voitures, des drones, des machines industrielles. Là, on ne parle plus seulement d'un logiciel qui répond ou qui écrit, mais d'implications très concrètes pour nos corps, nos déplacements, nos métiers, parfois notre sécurité.

Voilà donc, à grands traits, la carte. Voir, prédire, générer, agir : une même famille de méthodes, qui apprend à partir d'exemples — en repérant des patterns — plutôt qu'en suivant des règles, et qui s'est déplacée, en quelques années à peine, de la coulisse vers la parole, puis de la parole vers l'action, et de plus en plus vers le monde physique. À une vitesse folle.

Quand on utilise ces outils, il y a de quoi être bluffé, fasciné même. Parce que de fait, envoyer tout un tas d'infos en vrac à un chatbot avec une demande parfois peu clair et obtenir un résultat nickel qu'on aurait mis des heures, parfois des jours à obtenir, c'est une petite révolution. Et ca vaut pour tellement de cas d'usages, de la production de code à la retouche photo en passant par la démonstration de théorème de maths ou l'écriture d'une dissertation pour un élève de terminal en quelques secondes, qu'il y a vraiment de quoi se dire qu'on est entrés dans une nouvelle ère.

Mais je dirais qu'une fois qu'on a parcouru ces sujets un peu technique, si vous ne deviez retenir que l'essentiel de cet épisode, ce serait sans doute ceci. Que le mot « intelligence » est un piège : derrière, il n'y a pas un esprit qui pense comme le nôtre, mais des montagnes d'exemples dont la machine a tiré des régularités, et c'est nous, en coulisse, qui choisissons ces exemples et ce qu'on lui fait apprendre. Retenir qu'une IA imite notre langage de façon stupéfiante sans qu'on sache vraiment si elle comprend quoi que ce soit. Et qu'étant faite de nos textes, elle en hérite les erreurs et les partis pris et elle peut se tromper avec un aplomb parfait. Voilà, aujourd'hui, ce qu'il y a derrière le sigle « IA ».

Pas de véritable intelligence donc, pas de compréhension profonde pour le moment, mais pourtant c'est bien ça qui est visé in fine. Parce qu'il faut bien comprendre que ceux qui construisent ces systèmes ne visent pas juste un meilleur outil qui nous ferait gagner du temps. Ils visent une intelligence qui ne serait plus seulement douée pour une tâche, ni même à la hauteur de l'humain sur presque tout. Ce qui est visé c'est quelque chose d'un genre nouveau : une intelligence générale.

Ce mot « intelligence » qu'on vient de passer un épisode entier à dégonfler, eux veulent le pousser jusqu'au bout. Ce rêve-là, le moteur qu'il constitue et aussi la peur qui vient avec, c'est le sujet du prochain épisode.

Soutenez Sismique

Sismique existe grâce à ses donateurs.Aidez-moi à poursuivre cette enquête en toute indépendance.

Merci pour votre générosité ❤️

Dans la même série

À l’aube d’une nouvelle ère ? L'enquête commence...

#IA

Qu'appelle-t-on IA ?

Le mot “IA” embrouille plus qu’il ne clarifie

Déplacer la question : moins “est-ce intelligent ?”, plus “que sait faire la machine ?”

Quatre grandes capacités : voir, prédire, générer, agir

Le cœur du mécanisme : repérer des régularités

De la règle écrite à l’apprentissage par exemples

Une machine entraînée, pas entièrement autonome

Entraînement et inférence : deux moments à distinguer

Les LLM : prédire la suite, à une échelle colossale

Puissance sans compréhension claire

Émergence, hallucinations et biais

Rupture ou continuité sous stéroïdes ?

Le tournant agentique : quand l’IA commence à agir

De la parole vers le monde physique

Concepts et repères techniques

Personnes citées

Outils, modèles et entreprises évoqués

Repères historiques et culturels

Concepts à creuser

Livres

Penseuses et penseurs

Articles et ressources

Soutenez Sismique

Dans la même série

À l’aube d’une nouvelle ère ? L'enquête commence...

AGI : le rêve et la peur

IA : la fin de l'individu

Entretien avec une IA