Společnost Anthropic uvedla na trh dva nové hybridní jazykové modely — Claude Sonnet 4 a Claude Opus 4. Druhý jmenovaný je podle tvůrců „nejvýkonnější“ v portfoliu firmy a zároveň „nejlepší na světě pro práci s kódem“. Model je určen pro tvůrce AI agentů: zvládá úkoly trvající „několik hodin“ a vyžadující „tisíce kroků“, přičemž nabízí dva režimy práce — rychlou odpověď nebo pomalejší verzi s „analytickým přístupem“.
Testy na benchmarkech SWE-Bench Verified a Terminal-Bench ukázaly, že Opus 4 dosahuje 72,5 % a 43,2 % efektivity. To je vyšší výsledek než u modelů GPT-4.1 od OpenAI a Gemini 2.5 Pro od Googlu. Sonnet 4, ačkoliv ve většině úkolů zaostává za Opus 4, překonává svou předchůdkyni Sonnet 3.7 a v SWE-Bench Verified dosáhla 72,7 %. GitHub již potvrdil, že Sonnet 4 využije pro novou verzi svého kódovacího nástroje v Copilot.
Oba modely lépe zpracovávají spuštění více nástrojů současně, přesněji dodržují instrukce a umí využívat externí zdroje (např. vyhledávání na webu) i během analýzy. Pro firmy to znamená efektivnější procesy: „I během řešení úkolu může model paralelně sbírat data z externích zdrojů,“ vysvětlili v Anthropic.
Přístup k Claude Opus 4 získají předplatitelé placených verzí Pro, Max, Team a Enterprise. Bezplatní uživatelé mohou vyzkoušet pouze Sonnet 4. Modely jsou také dostupné v Amazon Bedrock, Google Cloud Vertex AI a API od Anthropic. Cena za 1 milion vstupních tokenů (textových jednotek) je u Opus 4 15 dolarů, u Sonnet 4 3 dolary. Za výstupní tokeny platí uživatelé 75 a 15 dolarů.
„Nejde jen o aktualizaci, ale o krok k vytvoření AI, který funguje jako plnohodnotný asistent,“ dodali zástupci společnosti.