Boris Cherny, šéf Claude Code od Anthropiku, se na konferenci @Scale od Mety postavil před plný sál inženýrů a hned první otázka z publika ho zastavila na místě. "Jsou smyčky další hypecyklus, nebo jsou skutečné?" zeptal se někdo ze sálu. Chernyho odpověď přišla bez váhání: "Ano, jsou skutečné."
Cherny o smyčkách nehovoří jako pozorovatel z povzdálí. Je inženýrem, který vedl tým, jenž Claude Code postavil, a to je dnes jeden z vůbec nejpoužívanějších nástrojů pro agentní kódování. Když on řekne, vývojářský svět zpozorní.
Éra smyčky
Cherny konferenci nabídl jednoduché čtení posledních dvou let. Nejdřív jsme psali zdrojový kód ručně. Pak jsme přesedlali na agenty, kteří kód píší za nás. Teď přicházíme do třetí fáze: agenti promtují jiné agenty, kteří pak kód teprve generují. "Jak velký byl skok od zdrojového kódu k agentům, tak velký je i skok ke smyčkám," řekl.
Co přesně je smyčka v AI světě? Jde o dlouho běžící, rekurzivní strukturu, kde podagenti sledují repozitář, otvírají pull requesty a pracují na pozadí tak dlouho, dokud nedostanou signál k zastavení. Jenže ten signál neurčuje pevně daná podmínka v kódu, jako to funguje v klasickém programování. Rozhoduje jiný agent.
Cherny během přednášky popsal, co sám aktuálně provozuje. Jeden agent nepřetržitě hledá způsoby, jak zlepšit architekturu kódu. Druhý pátrá po zdvojených abstrakcích, které by šlo sloučit. Oba odevzdávají pull requesty jako každý jiný vývojář v týmu. A protože kód se neustále mění, nikdy nepřestanou.
Ralph Loop a test výpočetního času
Smyčky jako takové nejsou v informatice nic nového. Rekurzivní funkce, které volají samy sebe a zastavují se po splnění podmínky, patří do prvního semestru každého technického oboru. Co je jiné, je to, že logika zastavení je teď nedeterministická. Neurčuje ji pravidlo, ale podagent.
Jednou z nejpoužívanějších technik je takzvaný Ralph Loop, pojmenovaný po Ralphu Wiggumovi ze Simpsonových. Funguje tak, že shrne veškerou práci, kterou model dosud odvedl, a zeptá se, jestli splnil svůj cíl. Pokud ne, pokračuje. Je to způsob, jak zabránit tomu, aby se model při dlouhých operacích ztratil. Přehazuje ho tam a zpět, dokud úkol není hotový.
Výzkumník OpenAI Noam Brown dříve tento měsíc poznamenal, že dnešní modely dokážou vyřešit téměř jakýkoliv problém, pokud jim poskytnete dost výpočetního výkonu. Smyčky jsou přímým důsledkem tohoto pozorování. Pokud nevíte, kdy agent skončí, jednoduše ho nechte běžet, dokud to nezvládne.
Obrovská důvěra a obrovské náklady
Tohle je silný nápad, ale přichází s cenou. Doslova. Agentní smyčky spalují tokeny podstatně rychleji než klasičtí chatboti s otázkami a odpověďmi. A protože smyslem je, aby běžely nepřetržitě, neexistuje žádný strop výdajů. Pro Anthropic, který vydělává prodejem tokenů, je to skvělá zpráva. Pro ostatní to může být velmi nákladný způsob práce.
Původní přístup k agentnímu kódování byl jiný. Vývojář agenta spustil, sledoval první kroky, zasáhl, když se odchýlil, a práci ukončil, když byl úkol hotový. Smyčky tento model mění. Agenti nečekají na další prompt. Čekají na signál, že práce je dokončena. A o tom, kdy ten signál přijde, rozhoduje jiný agent, ne člověk.
Zdroj: techcrunch.com
