🎛️ Regarde le perceptron apprendre à séparer 2 classes
À chaque itération, le perceptron ajuste sa droite séparatrice pour mieux classer les points roses et bleus.
Étape
0
Bien classés
12/20
Précision
60%
Poids (w₁, w₂, b)
0.5, −0.3, 0.1
Initialisation aléatoire. Clique « +1 étape » pour voir le perceptron ajuster sa droite.
🧠 1958 : Frank Rosenblatt invente le neurone artificiel
Frank Rosenblatt (1928-1971), psychologue et informaticien américain, s'inspire en 1958 du fonctionnement (simplifié) des neurones du cerveau. Il propose un modèle mathématique baptisé perceptron. À l'époque, il déclare au New York Times : « la machine sera bientôt capable de marcher, parler, voir, écrire, se reproduire et être consciente de son existence ».
65 ans plus tard, il avait à la fois raison (l'IA est partout) et tort (un perceptron seul ne peut pas tout faire). Mais sa formule est restée la brique de base de TOUS les réseaux de neurones modernes, y compris GPT et Gemini.
⚡ La règle du perceptron : une équation linéaire
Un perceptron prend en entrée n nombres (les caractéristiques d'une donnée) et renvoie une décision binaire (oui/non, chat/chien, spam/ham…). Pour 2 entrées x1, x2 :
y = signe(w1·x1 + w2·x2 + b)
w1, w2 = poids · b = biais · signe : +1 si positif, −1 sinon
Géométriquement, l'équation w1·x1 + w2·x2 + b = 0 définit une droite dans le plan. Tout ce qui est au-dessus est classé +1, tout ce qui est en dessous est classé −1. Le perceptron, c'est juste une droite séparatrice.
En dimension n, c'est un hyperplan (généralisation de la droite). Le perceptron est donc l'objet le plus simple d'algèbre linéaire appliqué à un problème de classification.
🎯 L'algorithme d'apprentissage : ajuster les poids
Comment trouver les bons poids w1, w2, b ? Rosenblatt propose une règle d'apprentissage géniale :
- Initialise les poids au hasard.
- Présente une donnée (x1, x2) avec sa vraie étiquette y* (+1 ou −1).
- Calcule la prédiction y = signe(w1x1 + w2x2 + b).
- Si y = y* : ne rien faire, continuer avec la donnée suivante.
- Si y ≠ y* (erreur) : ajuster les poids dans la direction qui corrige l'erreur :
- w1 ← w1 + η · y* · x1
- w2 ← w2 + η · y* · x2
- b ← b + η · y*
- Recommence à 2 avec la donnée suivante.
C'est tout. Cette règle, répétée des milliers de fois sur un jeu de données, suffit à trouver une droite séparatrice si elle existe.
🏆 Le théorème de convergence du perceptron (1962)
Théorème de Novikoff (1962)
Si les données sont linéairement séparables (il existe une droite qui les sépare
parfaitement), alors l'algorithme du perceptron converge en un nombre fini d'étapes.
C'est l'un des premiers résultats de convergence en apprentissage automatique. Il garantit que si le problème est faisable, le perceptron trouvera la solution. Pas forcément vite, mais en temps fini.
⚠️ Le problème XOR : la limite cruelle du perceptron
En 1969, Marvin Minsky et Seymour Papert publient un livre destructeur : Perceptrons. Ils montrent que certains problèmes simples sont impossibles à résoudre avec un seul perceptron.
L'exemple iconique : la fonction XOR (ou exclusif). Elle vaut 1 si exactement une des deux entrées vaut 1 :
- (0, 0) → 0
- (0, 1) → 1
- (1, 0) → 1
- (1, 1) → 0
Si tu places ces 4 points dans le plan, aucune droite ne peut séparer les 0 des 1. Le perceptron est donc inutile pour XOR. Cette critique a quasiment tué l'IA pendant 15 ans (le « premier hiver de l'IA »).
🌍 Du perceptron à GPT : la généalogie
- Perceptron simple (1958) : une droite séparatrice, 2 entrées, 1 sortie.
- Multi-Layer Perceptron (MLP, années 1980) : plusieurs couches de perceptrons empilés, capable d'apprendre n'importe quelle fonction (théorème d'approximation universel).
- Convolutional Neural Networks (CNN, années 1990-2010) : perceptrons spécialisés pour les images. LeNet, AlexNet, ResNet.
- Recurrent Neural Networks (RNN, années 2000) : pour le texte et les séries temporelles. LSTM, GRU.
- Transformers (2017) : architecture révolutionnaire qui a permis GPT, BERT, Gemini, Claude. Chaque transformer est fait de millions de perceptrons.
Quand tu utilises ChatGPT, des centaines de milliers de perceptrons s'activent en cascade. Le perceptron de Rosenblatt de 1958 n'a pas disparu — il a été multiplié par 100 milliards.
📐 Le lien avec ton programme
Le perceptron mobilise plusieurs notions du BAC SM :
- Équation de droite : w1x + w2y + b = 0, classique du chapitre géométrie analytique 1BAC SM.
- Produit scalaire (1BAC SM) : la formule du perceptron est un produit scalaire w · x plus un biais. La direction normale à la droite séparatrice est exactement le vecteur w.
- Inégalités linéaires : décider de quel côté d'une droite se trouve un point, c'est tester le signe d'une expression linéaire.
- Algorithmes itératifs : la règle d'apprentissage est une suite récurrente sur les poids.
🎓 Pourquoi tu devrais comprendre ça maintenant
L'IA va dominer les 30 prochaines années dans tous les secteurs. Comprendre que le « cerveau artificiel » n'est qu'une accumulation de droites dans des espaces de dimension élevée est un atout intellectuel énorme.
Ça démystifie ChatGPT, ça t'arme contre le marketing exagéré (« IA consciente », « IA générale »), et ça te place en position de comprendre les vrais enjeux : robustesse, biais, alignement.