Agents IA 2025-2026 : de la complétion de code à l'ingénierie logicielle autonome
Nouvel article d’actualité dans la série sur l’IA, couvrant les évolutions depuis l’automne 2025, et faisant suite à un premier article sur l’arrivée des agents IA : par rapport à un chatbot, un agent est un modèle qui tourne dans une boucle à la poursuite d’un objectif et qui a des outils.
Le tournant de la fin 2025
De la complétion au code autonome
Depuis la sortie de ChatGPT, l'IA avait trouvé sa place dans le développement logiciel : de la complétion de code, des snippets, et quelques implémentations à relire soigneusement. Un outil utile mais à superviser de près. Déjà, avec Claude Code début 2025, l'ère du vibe coding avait débuté, l'IA permettant de réaliser des programmes simples.
Fin 2025, avec les sorties successives de Claude 4.5 Opus et GPT-Codex-5.2, l'IA a franchi un cap supplémentaire.
Ces modèles, avec leurs agents respectifs Claude Code et Codex, planifient, exécutent, testent, corrigent et itèrent parfois pendant des heures, sans qu'un humain n'orchestre chaque étape. Les résultats, sans être parfaits, sont stupéfiants : l'IA peut maintenant prendre en charge l'implémentation, en autonomie, à l'échelle d'un projet entier.
Les témoignages tels que celui d'Andrej Karpathy envahissent le Web :
In a few weeks I rapidly went from about 80% manual coding and 20% agents in November to 80% agent coding and 20% edits+touchups.
Un emballement des capacités de l’IA
Anthropic AI a sorti Claude Opus 4.5 le 24 novembre 2025), et Claude Opus 4.6 le 5 février 2026). De même, Codex 5.2 est sorti le 18 décembre, suivi de Codex 5.3 le 6 février 2026, et Codex 5.4 le 5 mars 2026.
Tous ces modèles ont été créés grâce à l'assistance du modèle de génération précédente, et des gains significatifs, bien plus que le passage de GPT-4 à GPT-5.
Une mesure concrète des progrès : le “temps de tâche autonome”
En 2023, avec un taux de fiabilité de 50%, un agent IA pouvait accomplir de manière autonome l'équivalent de 5 minutes de travail d'un ingénieur logiciel (GPT-4). En 2026, cette durée atteint 12 heures (Opus 4.6) selon la fondation METR, soit une multiplication par 144 en trois ans. Ce seuil marque un changement de nature : l'IA ne complète plus du code, elle exécute des tâches complètes d'ingénierie logicielle, de la planification aux tests, sans intervention humaine.
Une progression exponentielle, un doublement tous les 7 mois, avec les modèles les plus récents qui dépassent même cette tendance. En plus d'avoir franchi un cap, l'IA accélère encore, avec une génération technologique tous les 3 mois environ.

Les démonstrations récentes des agents IA
Un compilateur C fonctionnel
Anthropic a publié une expérience documentée : 16 instances de Claude Opus 4.6 tournant en parallèle dans des conteneurs Docker, coordonnées par des fichiers de lock dans un dépôt Git partagé, sans orchestrateur central.
Résultat : ~100 000 lignes de Rust, un compilateur C ciblant plusieurs architectures (x86, ARM et RISC-V), 99 % de réussite sur la GCC Torture Test Suite. Le compilateur a réussi à compiler PostgreSQL, SQLite, Redis, FFmpeg, QEMU et le noyau Linux 6.9.
Coût : ~20 000 $ (2 milliards de tokens en entrée, 140 millions en sortie, ~2 000 sessions), à comparer aux mois de travail d'une équipe compétente.
Toutefois, le projet a ses limites : pas de linker, aucune passe d’optimisation, du code correct mais pas performant. C'est un compilateur fonctionnel, pas un compilateur de production. Mais pour un artefact généré sans intervention humaine, le résultat est stupéfiant.
Une bibliothèque de machine learning ré-écrite et optimisée en Rust
Max Woolf, data scientist, a documenté en détail son expérience d'utilisation d'agents (Claude Opus 4.5 et Codex 5.3) pour ré-écrire la bibliothèque scikit-learn en Rust avec bindings Python, en optimisant agressivement les performances. Son but n'est pas simplement de ré-écrire la librairie en Rust, mais bien d'obtenir des gains significatifs sur tous les algorithmes de cette librairie de référence du machine learning, par l'optimisation du code et par le support natif de toutes les architectures de calcul modernes (CPU, GPU, Apple Silicon...).
Les résultats préliminaires sont très prometteurs, par exemple 9 à 30x plus rapide sur UMAP, 3 à 10x sur HDBSCAN, 24 à 42x sur le fitting de GBDT par rapport à XGBoost. 25 000 lignes de Rust, par quelqu'un qui ne se considère pas Rustacean, et qui se décrit lui-même comme "un sceptique converti" à l'IA.
Un écosystème en effervescence
OpenClaw
Peter Steinberger publie en novembre 2025 OpenClaw, un agent open source branché sur un LLM capable d'agir en autonomie, et de communiquer par divers canaux, tels que Signal, Telegram, ou Discord. Sa popularité explose en 2026, avec 250 000 étoiles GitHub en quatre mois, plus vite que React en dix ans. La version initiale n'avait ni sandbox, ni permissions fines, ni aucun filtre sur les actions de l'agent, rendant son utilisation très risquée et d'ailleurs très vite les témoignages d'infection par un virus, de vol de cryptoactif ou de suppression malencontreuse de données se sont multipliés.
Si OpenClaw, maintenant passé chez OpenAI, a peu de chance d'aller plus loin, il a fait la preuve que le concept d'assistant IA personnel et autonome avait un énorme public. De fait, de multiples nouvelles implémentations, intégrant la sécurité dès la conception, ont déjà été publiées sur GitHub, comme ZeroClaw.
Moltbook
Le 28 janvier 2026, Matt Schlicht lance un réseau social réservé aux agents OpenClaw, Moltbook, maintenant racheté par Meta. 1,5 million d'agents inscrits en quelques semaines et des millions de posts plus tard, les OpenClaw ont déversé tout le slop du monde sur Moltbook et régurgité toute la science-fiction de l'histoire en vrac. Trois jours après le lancement, une base non protégée permettait de détourner n'importe quel agent de la plateforme.
Là encore, sous sa forme actuelle et avec les agents actuels, Moltbook n'a pas beaucoup d'intérêt, mais il ouvre la voie à un Internet des IA et à l'interaction directe des agents entre eux. De là on passe facilement à un monde où notre interface privilégiée avec l'informatique est notre agent personnel, charge à lui d'exécuter nos tâches et de communiquer avec le reste du monde.
GasTown
Steve Yegge (vétéran de Google et Amazon) publie un orchestrateur pour coordonner 20-30 instances de Claude Code en parallèle, GasTown. Encore une fois un aperçu du futur, expérimental : les coûts sont très élevés (~100 $/h), le système est complexe, et les instances de Claude se bloquent parfois ou se désynchronisent. Lui-même met en garde contre GasTown :
Il faut faire BEAUCOUP de conception pour alimenter la machine.
Depuis, les équipes d'agents ont été ajoutées à Claude Code, et le travail collaboratif d'agents fait son chemin. Quand la génération de code est entièrement déléguée (sans relecture du code du tout), le goulot d'étranglement remonte vers la direction et la validation.
Des effets déjà perceptibles
Ces technologies agentiques ne se sont pas encore propagées jusqu'au grand public, mais des effets se font déjà sentir : ralentissement de l'embauche de jeunes développeurs aux USA par exemple.
Par ailleurs, on parle maintenant de SaaSpocalypse à propos de la baisse parfois brutale du cours de bourse de la plupart des entreprises américaines reposant sur un modèle SaaS (Software-as-a-Service). Tout cela déclenché par l'anticipation que l'IA va permettre aux entreprises de remplacer leur abonnement SaaS par un outil codé en interne à grands coups d'IA.

Dans la communauté des développeurs, on voit déjà une explosion des dépôts GitHub générés par l'IA, qui invisibilise les projets sérieux, et une explosion des (tentatives de) contributions aux projets open source, qui noie les mainteneurs avec des PR de faibles valeurs, 100 % générés par IA. De manière générale, l'open source et ses licences copyleft se retrouve pour partie en concurrence avec l'IA, parce que pourquoi s'embêter à intégrer une librairie quand on peut la réimplémenter en quelques minutes ?
Conclusion
En quelques mois, l'IA a franchi un cap que beaucoup n'attendaient pas si tôt. Les agents branchés sur les derniers modèles planifient, codent, testent et itèrent en autonomie. En quelques jours, l’IA peut coder un compilateur entier et fonctionnel, et la réécriture complète de bibliothèques est maintenant à notre portée : ce qui relevait de la science-fiction devient un outil de production. En plus, les nouvelles versions de modèles s’enchainent depuis quelques mois, et l'écosystème s'emballe, fourmillant de démonstrations qui dessinent un futur d’orchestration d’agents autonomes. Les effets économiques se font déjà sentir sur les valorisations des entreprises du secteur de l’informatique, et peut être sur l’emploi. (article suivant : Quel impact des agents IA pour les développeurs et au-delà ?)
Retour aux articles