Výskum AI ⭐ Dôležité

Dan Luu: Agentické kódovanie z Galapágov — fuzzing víťazí nad LLM code review, výber modelu je sekundárny

Sobota 4. júla 2026 • Zdroj: Dan Luu

Čo sa stalo

Softwarový inžinier Dan Luu zverejnil rozsiahlu analýzu agentických AI kódovacích workflow z praktických experimentov. Post sa stal top príspevkom na Hacker News.

Kontext a dopad

Dan Luu je rešpektovaný autor empirických softwarových analýz. Jeho zistenia sú kriticky dôležité pre tímy zvažujúce nasadenie AI agentov v produkčnom vývoji — naznačujú, že väčšina hodnoty pochádza z testovacej infraštruktúry, nie z výberu frontier modelu.

Detaily a argumenty

Fuzzing víťazí: randomizované testovanie nachádza bugy rýchlejšie ako LLM code review
Vysoká variabilita: GPT-5.5 poráža Opus 4.8 na niektorých benchmarkoch a naopak — aggregate rankingy sú prakticky bezcenné
Autonómne agenty zlyhávajú: bez ľudského vedenia sa agenti zasekávajú vo failure modoch pri iteratívnej analýze
Záver: úspech vyžaduje pochopenie failure modes a systematické workarounds — nie plnú automatizáciu

Otvoriť pôvodný zdroj Dan Luu