Le perceptron simple

⏳

Disponible dans 442 jours

Ce concept sera publié le 3 septembre 2027. L'Atlas des concepts s'enrichit d'un nouveau concept chaque semaine.

📩 Reçois la notification dès la publication

Gratuit · Pas de spam · Désinscription en 1 clic

← Voir les concepts déjà publiés

🎛️ Regarde le perceptron apprendre à séparer 2 classes

À chaque itération, le perceptron ajuste sa droite séparatrice pour mieux classer les points roses et bleus.

Étape

Bien classés

12/20

Précision

60%

Poids (w₁, w₂, b)

0.5, −0.3, 0.1

Initialisation aléatoire. Clique « +1 étape » pour voir le perceptron ajuster sa droite.

🧠 1958 : Frank Rosenblatt invente le neurone artificiel

Frank Rosenblatt (1928-1971), psychologue et informaticien américain, s'inspire en 1958 du fonctionnement (simplifié) des neurones du cerveau. Il propose un modèle mathématique baptisé perceptron. À l'époque, il déclare au New York Times : « la machine sera bientôt capable de marcher, parler, voir, écrire, se reproduire et être consciente de son existence ».

65 ans plus tard, il avait à la fois raison (l'IA est partout) et tort (un perceptron seul ne peut pas tout faire). Mais sa formule est restée la brique de base de TOUS les réseaux de neurones modernes, y compris GPT et Gemini.

⚡ La règle du perceptron : une équation linéaire

Un perceptron prend en entrée n nombres (les caractéristiques d'une donnée) et renvoie une décision binaire (oui/non, chat/chien, spam/ham…). Pour 2 entrées x₁, x₂ :

y = signe(w₁·x₁ + w₂·x₂ + b)

w₁, w₂ = poids · b = biais · signe : +1 si positif, −1 sinon

Géométriquement, l'équation w₁·x₁ + w₂·x₂ + b = 0 définit une droite dans le plan. Tout ce qui est au-dessus est classé +1, tout ce qui est en dessous est classé −1. Le perceptron, c'est juste une droite séparatrice.

En dimension n, c'est un hyperplan (généralisation de la droite). Le perceptron est donc l'objet le plus simple d'algèbre linéaire appliqué à un problème de classification.

🎯 L'algorithme d'apprentissage : ajuster les poids

Comment trouver les bons poids w₁, w₂, b ? Rosenblatt propose une règle d'apprentissage géniale :

Initialise les poids au hasard.
Présente une donnée (x₁, x₂) avec sa vraie étiquette y* (+1 ou −1).
Calcule la prédiction y = signe(w₁x₁ + w₂x₂ + b).
Si y = y* : ne rien faire, continuer avec la donnée suivante.
Si y ≠ y* (erreur) : ajuster les poids dans la direction qui corrige l'erreur :
- w₁ ← w₁ + η · y* · x₁
- w₂ ← w₂ + η · y* · x₂
- b ← b + η · y*
(η = taux d'apprentissage, petit nombre positif)
Recommence à 2 avec la donnée suivante.

C'est tout. Cette règle, répétée des milliers de fois sur un jeu de données, suffit à trouver une droite séparatrice si elle existe.

🏆 Le théorème de convergence du perceptron (1962)

Théorème de Novikoff (1962)
Si les données sont linéairement séparables (il existe une droite qui les sépare parfaitement), alors l'algorithme du perceptron converge en un nombre fini d'étapes.

C'est l'un des premiers résultats de convergence en apprentissage automatique. Il garantit que si le problème est faisable, le perceptron trouvera la solution. Pas forcément vite, mais en temps fini.

⚠️ Le problème XOR : la limite cruelle du perceptron

En 1969, Marvin Minsky et Seymour Papert publient un livre destructeur : Perceptrons. Ils montrent que certains problèmes simples sont impossibles à résoudre avec un seul perceptron.

L'exemple iconique : la fonction XOR (ou exclusif). Elle vaut 1 si exactement une des deux entrées vaut 1 :

(0, 0) → 0
(0, 1) → 1
(1, 0) → 1
(1, 1) → 0

Si tu places ces 4 points dans le plan, aucune droite ne peut séparer les 0 des 1. Le perceptron est donc inutile pour XOR. Cette critique a quasiment tué l'IA pendant 15 ans (le « premier hiver de l'IA »).

🌍 Du perceptron à GPT : la généalogie

Perceptron simple (1958) : une droite séparatrice, 2 entrées, 1 sortie.
Multi-Layer Perceptron (MLP, années 1980) : plusieurs couches de perceptrons empilés, capable d'apprendre n'importe quelle fonction (théorème d'approximation universel).
Convolutional Neural Networks (CNN, années 1990-2010) : perceptrons spécialisés pour les images. LeNet, AlexNet, ResNet.
Recurrent Neural Networks (RNN, années 2000) : pour le texte et les séries temporelles. LSTM, GRU.
Transformers (2017) : architecture révolutionnaire qui a permis GPT, BERT, Gemini, Claude. Chaque transformer est fait de millions de perceptrons.

Quand tu utilises ChatGPT, des centaines de milliers de perceptrons s'activent en cascade. Le perceptron de Rosenblatt de 1958 n'a pas disparu — il a été multiplié par 100 milliards.

📐 Le lien avec ton programme

Le perceptron mobilise plusieurs notions du BAC SM :

Équation de droite : w₁x + w₂y + b = 0, classique du chapitre géométrie analytique 1BAC SM.
Produit scalaire (1BAC SM) : la formule du perceptron est un produit scalaire w · x plus un biais. La direction normale à la droite séparatrice est exactement le vecteur w.
Inégalités linéaires : décider de quel côté d'une droite se trouve un point, c'est tester le signe d'une expression linéaire.
Algorithmes itératifs : la règle d'apprentissage est une suite récurrente sur les poids.

🎓 Pourquoi tu devrais comprendre ça maintenant

L'IA va dominer les 30 prochaines années dans tous les secteurs. Comprendre que le « cerveau artificiel » n'est qu'une accumulation de droites dans des espaces de dimension élevée est un atout intellectuel énorme.

Ça démystifie ChatGPT, ça t'arme contre le marketing exagéré (« IA consciente », « IA générale »), et ça te place en position de comprendre les vrais enjeux : robustesse, biais, alignement.

← L'Atlas des concepts L'Atlas s'enrichit chaque semaine

Disponible dans 442 jours

Le perceptron simple

🎛️ Regarde le perceptron apprendre à séparer 2 classes

🧠 1958 : Frank Rosenblatt invente le neurone artificiel

⚡ La règle du perceptron : une équation linéaire

🎯 L'algorithme d'apprentissage : ajuster les poids

🏆 Le théorème de convergence du perceptron (1962)

⚠️ Le problème XOR : la limite cruelle du perceptron

🌍 Du perceptron à GPT : la généalogie

📐 Le lien avec ton programme

🎓 Pourquoi tu devrais comprendre ça maintenant

Installe Atlasmaths sur ton téléphone