Anthropic vydal Claude Sonnet 4.6, model střední třídy, který výkonem dohání dosavadní vlajkovou loď Opus. A co je nejlepší? Cena zůstala stejná.
Druhý velký model za dva týdny
Anthropic vydal Claude Opus 4.6 pouhých 12 dní před příchodem Sonnetu 4.6. Takové tempo vývoje by ještě před rokem bylo nepředstavitelné. Firma, kterou v roce 2021 založili bývalí výzkumníci z OpenAI, dnes soupeří s OpenAI a Googlem – a rozhodně nezpomaluje.
Tenhle sprint má ale i stinnou stránku. Akcie softwarových firem se propadají jako kámen do vody. Index iShares Expanded Tech-Software Sector ETF (IGV) klesl od začátku roku o více než 20 %. Investoři se bojí, a upřímně – mají proč. Když AI zvládne kódovat, analyzovat dokumenty a ovládat počítač, co zbyde pro tradiční software?
Co skutečně umí nový Sonnet 4.6?
Nový model přináší výrazné zlepšení hned v několika oblastech. Kódování, práce s počítačem, design, zpracování dlouhých dokumentů a plánování agentních úloh – to vše posunul Anthropic na novou úroveň.
Vývojáři, kteří měli přístup k betaverzi, preferovali Sonnet 4.6 před jeho předchůdcem v 70 % případů při práci v Claude Codu. Ještě překvapivější číslo? 59 % uživatelů dávalo přednost Sonnetu 4.6 před Opusem 4.5 – tedy před modelem, který byl ještě nedávno tím nejlepším, co Anthropic nabízel. Méně přeinženýrování, méně halucinací, lepší sledování instrukcí.
Sonnet 4.6 také přichází s kontextovým oknem 1 milionu tokenů v beta verzi. To znamená, že do jediného dotazu vejde celá kódová základna, desítky výzkumných článků nebo obsáhlé smlouvy. A model v tom skutečně dokáže rozumně navigovat – ne jen mechanicky prohledávat.
Počítač ovládaný AI
Anthropic byl v říjnu 2024 první firmou, která představila model schopný ovládat počítač jako člověk – klikat myší, psát na klávesnici, procházet webové stránky. Tehdy sami přiznali, že jde o experimentální funkci, která je „někdy těžkopádná a náchylná k chybám."
Sonnet 4.6 tuhle kapitolu přepisuje. Na benchmarku OSWorld, který testuje stovky reálných úloh v prostředí Chrome, LibreOffice nebo VS Code, dosáhly modely Anthropicu za posledních šestnáct měsíců dramatického pokroku. Raní uživatelé hlásí, že model zvládá navigaci ve složitých tabulkách nebo vyplňování vícekrokových webových formulářů na lidské úrovni.
Jedna pojišťovací firma – Pace – naměřila na svém interním benchmarku 94% přesnost při počítačovém použití. To je číslo, které může změnit byznys.
Zároveň Anthropic posílil obranu proti tzv. prompt injection útokům – situacím, kdy se škodlivý obsah na webu pokusí přimět AI k nežádoucím akcím. Sonnet 4.6 je v tomto ohledu výrazně odolnější než jeho předchůdce.
Zdarma pro všechny – a cena pro vývojáře zůstává stejná
Tohle je možná nejdůležitější zpráva pro běžné uživatele. Claude Sonnet 4.6 se stal výchozím modelem pro Free i Pro plán na claude.ai a v nástroji Claude Cowork. Bezplatná úroveň navíc nově zahrnuje tvorbu souborů, konektory, dovednosti a kompakci kontextu.
Pro vývojáře zůstává cena přes API stejná jako u Sonnetu 4.5 – 3 dolary za milion vstupních tokenů a 15 dolarů za milion výstupních tokenů. Výkon Opusu za cenu Sonnetu.
Firma nedávno uzavřela investiční kolo ve výši 30 miliard dolarů při valuaci 380 miliard dolarů – více než dvojnásobek hodnoty z loňského září. Claude Sonnet 4.6 je dostupný na všech plánech, přes API i na hlavních cloudových platformách. Vývojáři ho volají přes identifikátor claude-sonnet-4-6.
