Tokenmaxxing je mŕtvy, nech žije tokenmaxxing — esej o skrytých nákladoch agentov
Čo sa stalo
Esej na blogu 12gramsofcarbon reaguje na rozprávanie OpenAI a Anthropicu o presune zákazníkov 'z tokenmaxxingu na efektivitu' (CNBC, 26. jún) a tvrdí, že je to ilúzia.
Kontext a dopad
Autor argumentuje, že agentické runtime-y ako Claude Code, Codex a Cursor síce racionalizujú per-call cenu, ale viacnásobne zvyšujú počet volaní cez plánovanie, retry, evaluáciu a verifikáciu. Výsledný účet je vyšší, len zabalený do vyššej abstrakcie ('per-task pricing'). Esej rezonuje v komunite ML inžinierov, ktorí pripravujú FinOps procesy pre AI workloady.
Detaily
- 104 bodov na HN, top thread víkendu
- Reaguje na CNBC piece o 'efficiency shift'
- Argument: token usage je dnes per-task, nie per-call
- Implikácia: enterprise FinOps musí merať task-level cost
Otvoriť pôvodný zdroj
12gramsofcarbon