Teknologi

Claude Fable 5 er tilbake — en sikkerhetsklassifikator løste det eksportkontrollene skapte

Adrian Kessler

Claude Fable 5, Anthropics mest kapable offentlig tilgjengelige KI-modell, er igjen tilgjengelig globalt. Tilbakekomsten skjer etter atten dagers fullstendig suspensjon, utløst da den amerikanske regjeringen innførte eksportkontroller som krevde at Anthropic verifiserte brukernes nasjonalitet i sanntid. Siden selskapet ikke kunne oppfylle dette kravet i global skala, valgte det full suspensjon fremfor delvis etterlevelse.

Teknikken som utløste kontrollene var en spesifikk jailbreak-metode oppdaget av Amazon-forskere. Metoden brukte Fable 5 til å kartlegge programvaresårbarheter på måter som amerikanske eksportrestriksjoner forbyr for visse utenlandske statsborgere. Den interne undersøkelsen avdekket noe som kompliserer den regulatoriske logikken: de samme kategoriene av sårbarheter kunne identifiseres med langt mindre kapable modeller, inkludert Opus 4.8, GPT-5.5 og Kimi K2.7. Kapasiteten var altså ikke unik for Fable 5.

Fiksen som låste opp kontrollene

Det som endret seg er en ny sikkerhetsklassifikator trent spesifikt for å blokkere den av Amazon dokumenterte omgåelsesteknikken. Anthropic opplyser at klassifikatoren fanger den avslørtemetoden i mer enn 99 prosent av tilfellene. Det er ikke en garanti for fullstendig beskyttelse mot fremtidige jailbreaks — det er en målrettet fiks for en kjent sårbarhet. Klassifikatoren virker på inngangsnivå og omdirigerer forespørsler som matcher dokumenterte mønstre, før modellen behandler dem.

Den bredere implikasjonen er relevant for hvordan KI-regulering sannsynligvis vil utvikle seg. Eksportkontrollene ble anvendt på Fable 5 ikke fordi modellen unikt muliggjorde skaden, men fordi en kjent teknikk utnyttet den. De ble opphevet ikke fordi det regulatoriske rammeverket løste spørsmålet, men fordi en klassifikator lukket den dokumenterte lekkasjen. Anthropic jobber med Amazon, Microsoft og Google med et felles rammeverk for å vurdere alvorlighetsgraden av KI-jailbreaks basert på fire kriterier: kapasitetsgevinst, bredde av denne gevinsten, weaponiseringslethet og oppdagbarhet. Det rammeverket eksisterer ennå ikke som offentlig standard.

Hva modellen gjør og hva den koster

Modellen i seg selv er uendret. Fable 5 er bygget for krevende langsiktig resonnering og agentisk arbeid — oppgaver som krever planlegging, utførelse og kurskorreksjon på tvers av lange sekvenser uten menneskelig godkjenning ved hvert trinn. Kontekstvinduet er én million tokens, som også er standardverdien. Maksimal output per svar er 128 000 tokens. Tenking er alltid aktiv og returneres som et lesbart sammendrag fremfor rå resonnementskjede.

Tilgang kommer med betingelser som ikke gjaldt før suspensjonen. Fable 5 krever nå 30 dagers datalagring — det er ikke tilgjengelig under avtaler om null datalagring. Det påvirker direkte organisasjoner i helse-, juridisk- og offentlig sektor, der null-lagringsavtaler ofte er grunnkravet for KI-adopsjon. Prissettingen ligger over Opus-nivået: ti dollar per million input-tokens, femti per million output-tokens. Forespørsler som utløser sikkerhetsklassifikatorer kan håndteres av en alternativ modell i stedet for å avvises, og om denne substitusjonen er synlig for sluttbrukeren avhenger av den enkelte operatørens konfigurasjon.

Tilgjengelighet

Fable 5 har en søstermodell, Claude Mythos 5, med de samme grunnleggende kapasitetene og den samme prissettingen, men med offensive cybersikkerhetsfunksjoner som Fable 5 ikke har. Mythos 5 er tilgjengelig via Project Glasswing. De to modellene vendte ikke tilbake samtidig: Mythos 5-tilgang ble gjenopprettet for visse amerikanske organisasjoner en uke før Fable 5s globale tilbakekomst.

Fable 5 er tilgjengelig nå på Claude-plattformen, Claude.ai, Claude Code og Claude Cowork. For Pro-, Max-, Team- og utvalgte Enterprise-planer er modellen inkludert opp til 50 prosent av ukentlige bruksgrenser til og med 7. juli, hvoretter den overgår til bruksbasert kreditprissetting. Tilgang via AWS, Google Cloud og Microsoft Foundry gjenopprettes gradvis. Rammeverket som vil regulere hva som skjer neste gang en ny omgåelsesteknikk dukker opp er fortsatt under bygging.

Tagger: , , , , ,

Diskusjon

Det er 0 kommentarer.