Simon Willison: Claude Sonnet 5 má skrytý náklad — nový tokenizer produkuje o 30 % viac tokenov
Hlavná myšlienka
Claude Sonnet 5 sa prezentuje ako o 60 % lacnejší od Fable 5 pri $2/$10 za milión tokenov. Willison však zistil, že nový tokenizer produkuje ~30 % viac tokenov pre rovnaký anglický text, čo reálne náklady výrazne zvyšuje oproti marketingovej prezentácii.
Kontext
Willison publikoval analýzu deň po spustení Claude Sonnet 5 (30. jún 2026). Vychádza z jeho dlhoročnej praxe testovať LLM modely a dokumentovať ich skutočné vlastnosti. Anthropic zároveň vypustil podporu pre temperature, top_p, top_k — čo je neobvyklé pri midtier modeli.
Prečo to stojí za pozornosť
Pre vývojárov plánujúcich migráciu z Claude 3.5 Sonnet na Sonnet 5 na základe ceny je toto kritická informácia. Faktická cena za ekvivalentný výstup môže byť bližšie k parite s Fable 5, nie 60 % zľava. Willison's analýza je praktický benchmark pred rozhodnutím o migrácii.
Detaily / argumenty
- Nový tokenizer: ~30 % viac tokenov pre anglický text
- Adaptive thinking zapnutý predvolene (generuje extra tokeny pre reasoning)
- temperature, top_p, top_k viac nepodporované — obmedzenie pre experimentátorov
- Promo ceny $2/$10 platia do 31. 8. 2026 — po skončení promo ekonomika ešte horšia
- Odporúčanie: testovať vlastné use-case náklady pred migráciou