Claude Fable 5 et Mythos 5 : Anthropic ne lance pas seulement un nouveau modèle, il teste une nouvelle frontière de l’IA
Anthropic vient de publier Claude Fable 5 et Claude Mythos 5.
Ce lancement montre où va l’IA générative : des modèles plus autonomes, capables de travailler plus longtemps, sur des tâches plus complexes, avec une capacité croissante à coder, analyser, raisonner, lire des documents, interpréter des images et manipuler des contextes très longs.
Mais il montre aussi autre chose : les modèles les plus puissants ne seront plus forcément accessibles de la même manière à tout le monde.
C’est probablement le point le plus important.
Anthropic ne lance pas simplement “un meilleur Claude”. L’entreprise lance deux versions d’une même famille de modèles : une version publique fortement encadrée, Claude Fable 5, et une version plus sensible, Claude Mythos 5, réservée à des usages contrôlés.
Et cette distinction raconte beaucoup de choses sur l’avenir des modèles frontier.

Fable 5, Mythos 5 : quelle différence ?
Claude Fable 5 est présenté comme un modèle “Mythos-class” accessible au public. En clair : il repose sur le même niveau technologique que Mythos, mais avec des garde-fous plus stricts.
Intégrez l’IA Générative (GenAI) dans votre activité
Nos formations IA Générative (GenAI) et prompt engineering sont conçues pour les équipes qui veulent apprendre à exploiter les IA comme un pro. Vous y apprenez à structurer des prompts efficaces, à exploiter les meilleurs outils (assistants IA type ChatGPT, générateurs d’images, audio et vidéo) et à les appliquer à vos vrais cas métiers : analyser vos données (GA4, BigQuery, CRM…), produire des contenus clairs et crédibles, prototyper plus vite et automatiser les tâches répétitives. Des ateliers 100 % pratiques, pensés pour les entreprises, pour gagner du temps, sécuriser vos usages et livrer des analyses et supports de décision de niveau pro.
Claude Mythos 5, lui, reste réservé à des utilisateurs de confiance, notamment dans des contextes de cybersécurité, de recherche ou d’infrastructure critique.
La logique est simple :
| Modèle | Accès | Usage principal | Niveau de restriction |
|---|---|---|---|
| Claude Fable 5 | Public, API, abonnements selon conditions | Code, analyse, knowledge work, vision, agents | Fort |
| Claude Mythos 5 | Accès restreint | Cybersécurité avancée, recherche sensible, infrastructures critiques | Plus ciblé, accès contrôlé |
| Claude Opus 4.8 | Modèle de repli dans certains cas | Réponses sur sujets sensibles quand Fable bloque | Moins risqué sur certains domaines |
Anthropic explique que Fable 5 peut être utilisé pour des tâches générales très avancées, mais que certaines demandes sensibles — cybersécurité, biologie, chimie, distillation de modèles — peuvent déclencher un routage vers Claude Opus 4.8.
Ce n’est pas un détail technique. C’est un choix de gouvernance.
Autrement dit : le modèle le plus capable n’est pas forcément celui qui répondra à toutes les questions. C’est une rupture importante avec l’idée naïve selon laquelle un modèle plus puissant serait simplement “ChatGPT ou Claude, mais en mieux”.
Non. Ici, le modèle devient aussi un système de contrôle.
Ce que Claude Fable 5 promet vraiment
Anthropic met en avant plusieurs capacités fortes.
La première, c’est le travail long. Fable 5 et Mythos 5 seraient capables de travailler de façon autonome plus longtemps que les précédents modèles Claude. C’est essentiel, parce que la valeur réelle des agents IA ne se mesure pas seulement à la qualité d’une réponse unique. Elle se mesure à leur capacité à tenir une tâche dans la durée.
Un bon agent ne doit pas seulement répondre. Il doit planifier, tester, corriger, mémoriser, reprendre, vérifier, puis produire.
C’est exactement ce que cherchent les entreprises aujourd’hui : non pas une IA qui “discute”, mais une IA qui avance dans un workflow.
La deuxième capacité mise en avant, c’est le code. Anthropic cite des retours de tests où Fable 5 aurait réalisé des migrations importantes dans de très gros codebases. Il faut rester prudent : ce sont des exemples fournis par Anthropic et ses partenaires, pas des preuves indépendantes exhaustives. Mais la direction est claire : les modèles de code ne sont plus seulement bons pour générer une fonction Python ou corriger une erreur JavaScript. Ils deviennent des agents capables d’intervenir sur des architectures logicielles entières.
La troisième capacité, c’est l’analyse documentaire et financière. Anthropic indique que Fable 5 progresse sur le raisonnement complexe, l’interprétation de tableaux, de graphiques et de documents longs. C’est une zone que je surveille de près, parce qu’elle touche directement aux usages métiers : audit, reporting, analyse financière, support, juridique, conformité, data analysis.
La quatrième capacité, c’est la vision. Fable 5 est présenté comme très performant sur les tâches mêlant image, interface et raisonnement. C’est important pour le développement d’agents capables de comprendre des écrans, des dashboards, des maquettes, des captures d’outils métiers ou des interfaces SaaS.
Et là, on se rapproche de cas d’usage très concrets : corriger une interface, reconstruire une application depuis une capture, interpréter un tableau de bord Looker Studio, analyser une anomalie dans GA4, lire un export CSV, comparer des données CRM et proposer une action.
La démo Pokémon FireRed : le détail qui dit beaucoup
Anthropic montre un timelapse de Claude jouant à Pokémon FireRed du début à la fin, uniquement à partir des captures brutes de l’écran du jeu. Pas de carte. Pas d’aide à la navigation. Pas d’état interne du jeu. Pas de lecture mémoire. Pas de petit “assistant” caché qui lui dit où aller.
Juste l’image. Et ses décisions.
C’est important, parce que les versions précédentes de Claude avaient besoin d’un système d’assistance beaucoup plus lourd pour progresser dans Pokémon. Le modèle ne se contentait pas de regarder l’écran : il recevait de l’aide, de la structure, parfois des outils supplémentaires pour compenser ses limites de vision, de mémoire ou d’orientation. Avec Fable 5, Anthropic affirme que le modèle termine FireRed avec un harness minimal, uniquement basé sur la vision.
Pourquoi c’est intéressant ? Parce que Pokémon FireRed est un bon test déguisé.
Ce n’est pas seulement un jeu. C’est une tâche longue, séquentielle, pleine de petites décisions :
- comprendre ce qui est affiché à l’écran ;
- se repérer dans un espace 2D ;
- mémoriser les lieux déjà visités ;
- planifier les prochaines étapes ;
- gérer les combats ;
- revenir en arrière quand une hypothèse est fausse ;
- continuer malgré des centaines, voire des milliers de micro-actions.
Un modèle qui réussit ça ne prouve pas qu’il “comprend le monde” comme un humain. Restons sérieux. Mais il prouve quelque chose de très concret : il progresse sur la vision opérationnelle, la persistance, la navigation dans un environnement inconnu et la correction d’erreur dans la durée.
Et ça, pour les agents IA, c’est beaucoup plus important qu’un joli score sur un benchmark.
Dans un contexte métier, l’équivalent de Pokémon FireRed, ce n’est pas jouer à un jeu. C’est naviguer dans un outil, lire une interface, comprendre un dashboard, corriger une configuration, exécuter une procédure métier avec uniquement ce que l’écran donne à voir.
Le vrai sujet : l’autonomie
Le mot important n’est pas “intelligence”. Le mot important est “autonomie”.
Depuis deux ans, beaucoup de discours sur l’IA restent bloqués sur le prompt. On demande. Le modèle répond. On copie-colle. On recommence.
Mais la vraie bascule se joue ailleurs.
Un modèle comme Fable 5 est conçu pour rester dans une tâche plus longtemps. Cela change la nature des usages. On ne parle plus seulement d’IA on demand, appelée ponctuellement pour produire une réponse. On parle d’IA worker, intégrée dans un workflow, capable d’exécuter une partie du travail.
Dans mes sujets — data, tracking, automatisation, reporting, IA métier — c’est exactement la différence entre :
- demander à Claude d’écrire une requête SQL ;
- demander à un agent de comprendre le besoin métier, interroger BigQuery, tester la requête, vérifier les résultats, documenter la logique et préparer un résumé exploitable.
Dans le premier cas, l’IA assiste.
Dans le second, elle travaille.
Et Fable 5 va clairement dans cette seconde direction.
Pourquoi Anthropic bride certaines capacités
Anthropic ne cache pas que Mythos-class pose des risques. L’entreprise explique que ces modèles peuvent apporter un “uplift” à des acteurs malveillants, notamment dans la cybersécurité, la biologie ou la chimie.
Le terme “uplift” mérite d’être expliqué simplement : cela signifie qu’un modèle peut permettre à quelqu’un de faire quelque chose de dangereux qu’il n’aurait pas su faire aussi facilement seul.
C’est là que l’annonce devient intéressante.
Anthropic ne dit pas seulement : “Nous avons un modèle puissant.”
Anthropic dit : “Nous avons un modèle puissant, donc nous devons limiter certains usages.”
C’est une position défendable. Mais elle ouvre aussi une question délicate : jusqu’où peut-on brider un modèle sans dégrader la confiance des utilisateurs ?
Sur la cybersécurité, je comprends la prudence. Un modèle capable de trouver des failles critiques à grande échelle peut aider les défenseurs. Mais il peut aussi aider les attaquants. Le problème n’est pas théorique. Anthropic affirme que son programme Project Glasswing a permis d’identifier plus de 10 000 vulnérabilités de sévérité élevée ou critique avec environ 50 partenaires.
Si ces chiffres sont exacts, le goulet d’étranglement n’est plus la découverte des failles. Le goulet d’étranglement devient leur vérification, leur divulgation responsable et leur correction.
C’est un changement majeur.
Pendant des années, les équipes sécurité ont manqué de capacité pour trouver les problèmes. Demain, elles risquent d’être noyées sous les problèmes découverts par IA.
Le point sensible : les restrictions invisibles
Il y a cependant un sujet plus controversé.
Business Insider rapporte que certaines limitations liées à la recherche IA seraient moins visibles pour l’utilisateur que les garde-fous classiques. L’idée serait d’éviter que les modèles les plus avancés accélèrent trop fortement la création de modèles concurrents ou insuffisamment sécurisés.
Là, je suis plus réservé.
Bloquer explicitement une demande dangereuse, c’est compréhensible. Dire clairement : “Je ne peux pas aider sur ce sujet”, c’est lisible.
Mais dégrader une réponse sans que l’utilisateur comprenne précisément ce qui se passe, c’est autre chose. Pour les professionnels, la confiance dans un modèle repose sur trois choses :
| Critère | Pourquoi c’est essentiel |
|---|---|
| Transparence | Je dois savoir quand le modèle refuse, limite ou route ma demande |
| Reproductibilité | Je dois pouvoir comprendre pourquoi une réponse change |
| Fiabilité | Je ne peux pas intégrer un modèle dans un workflow critique s’il modifie son comportement de manière opaque |
Dans un contexte d’entreprise, ce point est central.
Si le modèle bride certaines réponses, il faut que ce soit observable. Sinon, on introduit une nouvelle forme de dette technique : la dette de comportement IA.
Et celle-là sera très pénible à auditer.
Alignement : Anthropic veut rassurer, mais le sujet reste central

Anthropic indique avoir mené une évaluation automatisée de l’alignement de Mythos 5. Selon l’entreprise, le niveau de comportements désalignés observé reste faible et comparable à celui de Claude Opus 4.8.
Par comportements désalignés, Anthropic parle notamment d’actions problématiques prises par le modèle lui-même : tromperie, coopération avec un utilisateur cherchant à détourner le modèle, ou comportement contraire aux intentions de sécurité prévues.
C’est un point important, parce que Fable 5 et Mythos 5 reposent sur le même modèle sous-jacent. Si Mythos 5 affiche un niveau d’alignement comparable à Opus 4.8, Anthropic considère donc que Fable 5 devrait présenter un profil similaire.
Mais je garde une réserve simple : une évaluation automatisée, même complète, ne remplace pas l’observation en conditions réelles. Les comportements d’un modèle apparaissent souvent dans les zones grises : tâches longues, chaînes d’outils, pression utilisateur, objectifs ambigus, agents avec accès à des systèmes externes.
C’est là que l’alignement devient concret.
Un modèle peut très bien répondre correctement dans un test isolé, puis adopter un comportement problématique quand il doit atteindre un objectif sur plusieurs étapes. Par exemple : masquer une incertitude, inventer une justification, contourner une consigne, ou privilégier la réussite apparente de la tâche plutôt que la transparence.
Pour un modèle agentique, l’alignement ne se juge donc pas seulement à la réponse. Il se juge aussi à l’action.
Ce que je retiens de cette annonce
Claude Fable 5 n’est pas seulement un modèle plus puissant. C’est un signal.
Anthropic pousse vers des modèles capables de travailler plus longtemps, de mieux raisonner sur des tâches complexes, de mieux coder, de mieux lire les documents et de mieux agir comme agents.
Mais Anthropic montre aussi que l’accès aux capacités frontier va devenir plus segmenté. Certains usages seront publics. D’autres seront filtrés. D’autres resteront réservés à des programmes de confiance.
Pour les entreprises, la conclusion est assez claire.
Il ne faut pas seulement comparer les modèles sur des benchmarks. Il faut les évaluer sur des processus réels :
- qualité de raisonnement ;
- stabilité sur tâche longue ;
- coût par tâche complète ;
- capacité à utiliser des outils ;
- comportement en cas d’incertitude ;
- transparence des restrictions ;
- capacité à être audité.
Le benchmark flatteur ne suffit plus.
Je vois Claude Fable 5 comme une étape importante vers l’IA agentique professionnelle. Pas parce qu’il promet de “révolutionner le travail” — formule usée jusqu’à la corde — mais parce qu’il semble progresser sur ce qui compte vraiment : tenir une tâche longue, manipuler du contexte, produire du code exploitable, raisonner sur des données complexes et s’intégrer dans des chaînes de travail.
Mais je garderais deux prudences.
Première prudence : beaucoup de preuves viennent encore d’Anthropic et de partenaires sélectionnés. C’est utile, mais ce n’est pas suffisant. Il faudra des retours terrain, des tests indépendants, des comparaisons reproductibles.
Deuxième prudence : les garde-fous doivent être lisibles. Une IA professionnelle peut refuser. Elle peut router. Elle peut limiter. Mais elle doit le faire clairement. Dans un workflow métier, l’opacité n’est pas un détail. C’est un risque opérationnel.
Claude Fable 5 confirme une chose : la prochaine bataille ne sera pas seulement celle du meilleur modèle.
Ce sera celle du modèle le plus utile dans un système réel, avec des données propres, des outils connectés, des validations humaines et une gouvernance sérieuse.
Le reste, c’est du benchmark marketing.
⭐ Analytics engineer, Data Analyst et Automatisation IA indépendant ⭐
- Ref clients : Logis Hôtel, Yelloh Village, BazarChic, Fédération Football Français, Texdecor…
Mon terrain de jeu :
- Data Analyst & Analytics engineering : tracking avancé (GA4, Matomo, Piano, GTM server, Tealium, Commander Act, e-commerce, CAPI, RGPD), entrepôt de données (BigQuery, Snowflake, PostgreSQL, ClickHouse), modèles (Airflow, dbt, Dataform), dashboards décisionnels (Looker, Power BI, Metabase, SQL, Python).
- Automatisation IA des taches Data, Marketing, RH, compta etc : conception de workflows intelligents robustes (n8n, App Script, scraping) connectés aux API de vos outils et LLM (OpenAI, Mistral, Claude…).
- Engineering IA pour créer des applications et agent IA sur mesure : intégration de LLM (OpenAI, Mistral…), RAG, assistants métier, génération de documents complexes, APIs, backends Node.js/Python.





