Claude Opus 4.1: Upgrade v AI kódování pro vývojáře
Dnes se podíváme na čerstvou novinku od společnosti Anthropic, která právě oznámila vydání modelu Claude Opus 4.1. Tento upgrade přináší výrazná zlepšení v oblasti agentických úkolů, reálného kódování a logického uvažování. Vydání proběhlo 5. srpna a je to jen začátek – Anthropic plánuje v nadcházejících týdnech přijít s ještě většími vylepšeními svých modelů.
Co nového přináší Claude Opus 4.1?
Claude Opus 4.1 je nyní dostupný pro placené uživatele Claude a v nástroji Claude Code. Můžete ho využívat také přes API, Amazon Bedrock nebo Google Cloud's Vertex AI. Cena zůstává stejná jako u předchozí verze Opus 4, což je skvělá zpráva pro ty, kteří chtějí rychle přejít na novinku bez dodatečných nákladů.
Tento model posouvá hranice v kódování na novou úroveň. Dosahuje úctyhodných 74.5 % na benchmarku SWE-bench Verified, což je posun vpřed. Zlepšuje také schopnosti v hloubkovém výzkumu a analýze dat, zejména v sledování detailů a agentickém vyhledávání. Podle informací od GitHub model vyniká v přepracovávání kódu ve více souborech, kde ukazuje výrazné zlepšení oproti předchozí verzi.

Ohlasy od expertů a firem
Společnost Rakuten Group oceňuje, jak Claude Opus 4.1 dokáže přesně identifikovat opravy v rozsáhlých kódech bez zbytečných změn nebo zavádění chyb. Jejich tým to považuje za ideální pro každodenní ladění (debugging). Další pozitivní zpětnou vazbu poskytla firma Windsurf, která hlásí zlepšení o jednu standardní odchylku oproti Opus 4 na jejich benchmarku pro junior developery. To je srovnatelné se skokem od modelu Sonnet 3.7 k Sonnet 4.
V benchmarkové tabulce, která porovnává Claude Opus 4.1 s předchozími modely Claude a jinými veřejnými modely, vyniká v kategoriích jako SWE-bench Verified, Terminal-Bench, TAU-bench, GPQA Diamond, MMMLU, MMMU a AIME. Některé výsledky byly dosaženy s rozšířeným uvažováním (extended thinking) až do 64K tokenů, což pomáhá modelu lépe řešit složité úkoly.

Jak začít?
Anthropic doporučuje všem uživatelům přejít z Opus 4 na Opus 4.1 pro všechny aplikace. Pokud jste vývojář, stačí v API použít označení „claude-opus-4-1-20250805“. Další detaily najdete v systémové kartě, stránce modelu, ceníku a dokumentaci. Společnost vítá zpětnou vazbu na e-mail [email protected], aby mohla modely dále vylepšovat.
V příloze k oznámení jsou uvedeny zdroje dat, jako například launch posty od OpenAI pro modely o3 a o3 system card, model card pro Gemini 2.5 Pro, nebo předchozí oznámení od Anthropic pro Sonnet 3.7 a Claude 4. Pro SWE-bench se používá jednoduchý scaffold s nástroji jako bash tool a file editing tool, bez třetího plánovacího nástroje z předchozích verzí.
