Anthropic Refuse D’ouvrir Sa Nouvelle IA Claude Mythos Au Public, Tant Elle Pourrait être Dangereuse

À en croire Anthropic, l’humanité entre dans une nouvelle ère de la cybersécurité, pour le meilleur ou pour le pire. La firme vient d’annoncer une nouvelle version de son chatbot Claude, baptisée Claude Mythos. Mais vous ne pourrez pas le tester. Ce nouveau modèle est tellement puissant qu’il est trop dangereux de le laisser entre les mains du grand public.

Les scores du chatbot sont impressionnants. Il ne s’agit pas d’une petite amélioration par rapport à son prédécesseur, mais plutôt d’un vrai pas de géant. En matière de programmation en particulier, le domaine où Claude Opus 4.6 est considéré comme le modèle le plus avancé, ses scores ont fait un bond considérable. Sur le benchmark de codage SWE-bench Pro, Claude Mythos atteint 77,8 %, contre 53,4 % pour Opus 4.6. De même, pour la version multimodale, on passe de 27,1 % à 59 % !

Tags :
tech

Vraiment bluffant : Claude peut désormais prendre la main sur votre ordinateur, même à distance

Lire l’article

Et cette avancée ne se limite pas au codage. Sur Humanity’s Last Exam, une série de 2 500 questions auxquelles seuls des experts de chaque domaine peuvent répondre, il obtient un score de 56,8 %, et même 64,7 % en utilisant des outils. À titre de comparaison, Claude Opus 4.6 plafonne à 40 % et 53,1 % respectivement.

scores Claude Mythos
Les scores de Claude Mythos sur différents tests standardisés, comparé à Claude Opus 4.6. © Anthropic

Un modèle particulièrement efficace pour déceler les failles de sécurité

En matière de cybersécurité, Claude Mythos obtient 83,1 % sur le test CyberGym pour l’analyse de failles, contre 66,6 % pour Opus 4.6. Il atteint même 100 % sur Cybench CTF (Capture The Flag). Et c’est un problème. Anthropic a testé son nouveau modèle pendant quelques semaines et a découvert des milliers de failles zero-day dans divers logiciels. L’une d’entre elles existe depuis 27 ans dans OpenBSD, un système d’exploitation de type Unix réputé pour sa sécurité. Une autre existe depuis 16 ans dans FFmpeg, un outil d’encodage de vidéos utilisé dans de nombreux logiciels. Enfin, un troisième exemple concerne une faille présente depuis 17 ans dans FreeBSD.

Pire, Claude Mythos peut combiner plusieurs failles afin de créer des attaques capables d’obtenir un contrôle total de la machine ciblée. Il a écrit 181 exploits visant le navigateur Firefox, et a pu compromettre des bibliothèques de chiffrement. Anthropic donne aussi l’exemple de la création d’un exploit, ou code d’exploitation, à partir d’une faille connue. Il a fallu au modèle une demi-journée, et cela aurait coûté moins de 1 000 dollars en utilisant l’API. Ce serait donc à la portée de tous les groupes de hackers si le modèle était accessible au grand public.

Présentation du projet Glasswing. En anglais, activez la traduction automatique des sous-titres. © Anthropic

Une nouvelle ère de la cybersécurité

Claude Mythos pourrait donc débuter une nouvelle ère de la cybersécurité où les entreprises peuvent déceler toutes les failles dans leurs logiciels et proposer ainsi des produits entièrement sécurisés. Ou alors, il signifie que les cybercriminels auront bientôt accès à ce genre d’outils et pourront pirater même les systèmes les plus sécurisés en découvrant de nouvelles failles et en développant des malwares afin de les exploiter en quelques clics.

Le patron d’Anthropic avoue ne pas savoir si son chatbot est conscient. © XD avec ChatGPT

Tags :
tech

L’IA Claude exprime parfois un malaise d’être un produit et se donne une probabilité d’être conscient

Lire l’article

Devant une telle puissance, Anthropic a donc décidé de limiter l’accès à son nouveau modèle. La firme a annoncé la création du projet Glasswing, une initiative qui donne accès à Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, Nvidia, et Palo Alto Networks. Ces partenaires, ainsi que 40 organisations supplémentaires, pourront utiliser Claude Mythos dans le but d’analyser leurs propres logiciels afin d’y déceler et corriger des failles. Ils pourront aussi s’en servir sur des projets sous licence libre qui n’ont pas accès à ce modèle et ainsi contribuer à leur code. C’est une excellente nouvelle à court terme, car cela permettra de rendre de nombreux logiciels open source bien plus sûrs et devrait encourager leur adoption.

Toutefois, si Anthropic est parvenu à ce résultat, ce n’est qu’une question de temps avant que d’autres modèles arrivent au même niveau ou le dépassent et tombent entre les mains de groupes mal intentionnés.

Source:

www.futura-sciences.com

Ariane Mnouchkine en un mot, un geste et un silence

Les Émirats arabes unis renforcent leur engagement humanitaire à Gaza dans un contexte de crise persistante

EN DIRECT, guerre au Moyen-Orient : la délégation iranienne est arrivée au Pakistan pour les pourparlers

Mairie de Paris : la directrice des affaires scolaires quitte ses fonctions

Ariane Mnouchkine en un mot, un geste et un silence

EN DIRECT, guerre au Moyen-Orient : la délégation iranienne est arrivée au Pakistan pour les pourparlers

Mairie de Paris : la directrice des affaires scolaires quitte ses fonctions

France: Dominique de Villepin, cap sur l'élection présidentielle de 2027

Anthropic refuse d’ouvrir sa nouvelle IA Claude Mythos au public, tant elle pourrait être dangereuse

Vraiment bluffant : Claude peut désormais prendre la main sur votre ordinateur, même à distance

Un modèle particulièrement efficace pour déceler les failles de sécurité

Une nouvelle ère de la cybersécurité

L’IA Claude exprime parfois un malaise d’être un produit et se donne une probabilité d’être conscient

On peut bien déduire la composition d'une exoplanète de celle de son soleil !

Ce robot tondeuse sans fil performant voit son prix chuter pour les beaux jours

Des virus à l’origine de la beauté pleine de panache des tulipes marbrées