Späť na rubriku
Biznis ⭐ Dôležité

Tokenmaxxing je mŕtvy, nech žije tokenmaxxing — esej o skrytých nákladoch agentov

Pondelok 29. júna 2026 Zdroj: 12gramsofcarbon

Čo sa stalo

Esej na blogu 12gramsofcarbon reaguje na rozprávanie OpenAI a Anthropicu o presune zákazníkov 'z tokenmaxxingu na efektivitu' (CNBC, 26. jún) a tvrdí, že je to ilúzia.

Kontext a dopad

Autor argumentuje, že agentické runtime-y ako Claude Code, Codex a Cursor síce racionalizujú per-call cenu, ale viacnásobne zvyšujú počet volaní cez plánovanie, retry, evaluáciu a verifikáciu. Výsledný účet je vyšší, len zabalený do vyššej abstrakcie ('per-task pricing'). Esej rezonuje v komunite ML inžinierov, ktorí pripravujú FinOps procesy pre AI workloady.

Detaily

  • 104 bodov na HN, top thread víkendu
  • Reaguje na CNBC piece o 'efficiency shift'
  • Argument: token usage je dnes per-task, nie per-call
  • Implikácia: enterprise FinOps musí merať task-level cost
Otvoriť pôvodný zdroj 12gramsofcarbon