À en croire Anthropic, l’humanité entre dans une nouvelle ère de la cybersécurité, pour le meilleur ou pour le pire. La firme vient d’annoncer une nouvelle version de son chatbot Claude, baptisée Claude Mythos. Mais vous ne pourrez pas le tester. Ce nouveau modèle est tellement puissant qu’il est trop dangereux de le laisser entre les mains du grand public.
Les scores du chatbot sont impressionnants. Il ne s’agit pas d’une petite amélioration par rapport à son prédécesseur, mais plutôt d’un vrai pas de géant. En matière de programmation en particulier, le domaine où Claude Opus 4.6 est considéré comme le modèle le plus avancé, ses scores ont fait un bond considérable. Sur le benchmark de codage SWE-bench Pro, Claude Mythos atteint 77,8 %, contre 53,4 % pour Opus 4.6. De même, pour la version multimodale, on passe de 27,1 % à 59 % !
Tags :
tech
Vraiment bluffant : Claude peut désormais prendre la main sur votre ordinateur, même à distance
Lire l’article
Et cette avancée ne se limite pas au codage. Sur Humanity’s Last Exam, une série de 2 500 questions auxquelles seuls des experts de chaque domaine peuvent répondre, il obtient un score de 56,8 %, et même 64,7 % en utilisant des outils. À titre de comparaison, Claude Opus 4.6 plafonne à 40 % et 53,1 % respectivement.

Les scores de Claude Mythos sur différents tests standardisés, comparé à Claude Opus 4.6. © Anthropic
Un modèle particulièrement efficace pour déceler les failles de sécurité
En matière de cybersécurité, Claude Mythos obtient 83,1 % sur le test CyberGym pour l’analyse de failles, contre 66,6 % pour Opus 4.6. Il atteint même 100 % sur Cybench CTF (Capture The Flag). Et c’est un problème. Anthropic a testé son nouveau modèle pendant quelques semaines et a découvert des milliers de failles zero-day dans divers logiciels. L’une d’entre elles existe depuis 27 ans dans OpenBSD, un système d’exploitation de type Unix réputé pour sa sécurité. Une autre existe depuis 16 ans dans FFmpeg, un outil d’encodage de vidéos utilisé dans de nombreux logiciels. Enfin, un troisième exemple concerne une faille présente depuis 17 ans dans FreeBSD.
Pire, Claude Mythos peut combiner plusieurs failles afin de créer des attaques capables d’obtenir un contrôle total de la machine ciblée. Il a écrit 181 exploits visant le navigateur Firefox, et a pu compromettre des bibliothèques de chiffrement. Anthropic donne aussi l’exemple de la création d’un exploit, ou code d’exploitation, à partir d’une faille connue. Il a fallu au modèle une demi-journée, et cela aurait coûté moins de 1 000 dollars en utilisant l’API. Ce serait donc à la portée de tous les groupes de hackers si le modèle était accessible au grand public.
Présentation du projet Glasswing. En anglais, activez la traduction automatique des sous-titres. © Anthropic
Une nouvelle ère de la cybersécurité
Claude Mythos pourrait donc débuter une nouvelle ère de la cybersécurité où les entreprises peuvent déceler toutes les failles dans leurs logiciels et proposer ainsi des produits entièrement sécurisés. Ou alors, il signifie que les cybercriminels auront bientôt accès à ce genre d’outils et pourront pirater même les systèmes les plus sécurisés en découvrant de nouvelles failles et en développant des malwares afin de les exploiter en quelques clics.

Tags :
tech
L’IA Claude exprime parfois un malaise d’être un produit et se donne une probabilité d’être conscient
Lire l’article
Devant une telle puissance, Anthropic a donc décidé de limiter l’accès à son nouveau modèle. La firme a annoncé la création du projet Glasswing, une initiative qui donne accès à Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, Nvidia, et Palo Alto Networks. Ces partenaires, ainsi que 40 organisations supplémentaires, pourront utiliser Claude Mythos dans le but d’analyser leurs propres logiciels afin d’y déceler et corriger des failles. Ils pourront aussi s’en servir sur des projets sous licence libre qui n’ont pas accès à ce modèle et ainsi contribuer à leur code. C’est une excellente nouvelle à court terme, car cela permettra de rendre de nombreux logiciels open source bien plus sûrs et devrait encourager leur adoption.
Toutefois, si Anthropic est parvenu à ce résultat, ce n’est qu’une question de temps avant que d’autres modèles arrivent au même niveau ou le dépassent et tombent entre les mains de groupes mal intentionnés.
Source:
www.futura-sciences.com

