Η Anthropic αποκατέστησε το Fable 5 παγκοσμίως την 1η Ιουλίου με τις ικανότητές του άθικτες, προσθέτοντας ένα φίλτρο που αποκλείει ένα επισημασμένο prompt hacking σε περισσότερες από το 99% των προσπαθειών.
Το Υπουργείο Εμπορίου των ΗΠΑ ήρε την εντολή επείγουσας εξαγωγής στις 30 Ιουνίου, και το μοντέλο έφτασε ξανά στους χρήστες την επόμενη ημέρα μέσω της Πλατφόρμας Claude, Claude.ai, Claude Code και Claude Cowork. Η πρόσβαση μέσω των μεγάλων πλατφορμών cloud θα ακολουθήσει.
Οι επί πληρωμή συνδρομητές μπορούν να το χρησιμοποιούν εντός των εβδομαδιαίων ορίων τους έως τις 7 Ιουλίου, μετά την οποία η συνεχιζόμενη πρόσβαση μετατοπίζεται σε ένα μετρήσιμο σύστημα πιστώσεων χρήσης.
Το μοντέλο είχε τεθεί εκτός λειτουργίας στις 12 Ιουνίου. Οι ρυθμιστικές αρχές απαγόρευσαν σε κάθε αλλοδαπό να το χρησιμοποιήσει και έδωσαν στην εταιρεία μόνο περίπου 90 λεπτά για να συμμορφωθεί, έτσι η Anthropic απέσυρε το μοντέλο για όλους τους χρήστες αντί να προσπαθήσει να τους ελέγξει έναν προς έναν σε πραγματικό χρόνο.
Η οδηγία ακολούθησε μια έκθεση στην οποία ερευνητές της Amazon βρήκαν ένα prompt που οδήγησε το μοντέλο να επισημάνει μια σειρά από ευπάθειες λογισμικού σε κοινά συστήματα. Σε μία περίπτωση προχώρησε περαιτέρω και παρήγαγε λειτουργικό κώδικα που έδειχνε πώς θα μπορούσε να εκμεταλλευτεί ένα μεμονωμένο σφάλμα. Αυτή η μεμονωμένη επίδειξη, περισσότερο από τη λίστα ευπαθειών, είναι αυτή που σήμανε τον συναγερμό.
Διαβάστε Επίσης: Η CrowdStrike Προειδοποιεί ότι το Claude Mythos Θα μπορούσε να Επιταχύνει τις Αποφάσεις Zero-Day
Η δική τους ανασκόπηση της Anthropic, που διεξήχθη παράλληλα με την κυβέρνηση και την εταιρεία που υπέβαλε την έκθεση, επιβεβαίωσε ότι πολύ πιο αδύναμα μοντέλα θα μπορούσαν να αποκαλύψουν τα ίδια σφάλματα, μεταξύ των οποίων τα Opus 4.8, GPT-5.5 και Kimi K2.7. Κάθε άλλο μοντέλο που έλεγξε η ομάδα θα μπορούσε ακόμα να αναπαράγει τη μεμονωμένη επίδειξη εκμετάλλευσης, γεγονός που εξασθένησε την υπόθεση ότι μόνο το Fable 5 κατείχε ένα μοναδικό κυβερνοόπλο. Η εταιρεία είχε χαρακτηρίσει την απαγόρευση ως υπερβολική.
Η διόρθωση ήταν στενή. Κατά την επιστροφή του, το μοντέλο φέρει έναν ταξινομητή που εντοπίζει το αναφερόμενο prompt και το ανακατευθύνει στο πιο αδύναμο Opus 4.8, διατηρώντας τις ικανότητες του Fable 5 άθικτες αλλά προκαλώντας ψευδείς συναγερμούς σε συνηθισμένο προγραμματισμό, και προειδοποιώντας τον χρήστη όποτε παρεμβαίνει.
Το Mythos 5, το ίδιο υποκείμενο μοντέλο με λιγότερα προστατευτικά κιγκλιδώματα, παραμένει απομονωμένο σε περίπου 100 ελεγμένους οργανισμούς των ΗΠΑ στο πλαίσιο ενός προγράμματος που ονομάζεται Project Glasswing.
Η εταιρεία άνοιξε επίσης ένα δημόσιο κανάλι για αναφορές jailbreak. Υποσχέθηκε επίσης στις ρυθμιστικές αρχές νωρίτερη πρόσβαση για τη δοκιμή μελλοντικών μοντέλων αιχμής πριν από την κυκλοφορία τους.
Το Fable 5 κυκλοφόρησε για πρώτη φορά στις 9 Ιουνίου ως το πρώτο ευρέως διαθέσιμο μοντέλο κλάσης Mythos της Anthropic, αποσπώντας επαίνους σε μια σειρά από βιομηχανικά benchmarks πριν εξαφανιστεί μέσα σε λίγες ημέρες από την κυκλοφορία του. Η διακοπή λειτουργίας διήρκεσε μόλις τρεις εβδομάδες. Η επιστροφή του ανακτά τώρα το έδαφος των benchmarks που ένα ταχέως αναπτυσσόμενο κινεζικό εργαστήριο είχε καταλάβει σιωπηλά όσο το μοντέλο ήταν αδρανές.
Διαβάστε Στη Συνέχεια: Το XRP Δοκιμάζει Ξανά τα 1,07 $ Καθώς οι Απορρίψεις του Ιουνίου Επισκιάζουν τους Ταύρους


