Späť na rubriku
Vercel ⭐ Dôležité

Vercel AI Gateway pridal GLM 5.2 Fast cez Wafer s 170+ tokens/s

Štvrtok 25. júna 2026 Zdroj: Vercel

Čo je nové

  • GLM 5.2 Fast od Z.ai je teraz dostupný v Vercel AI Gateway cez Wafer inference stack.
  • Priemerný throughput 170+ tokens/sekundu, rozsah 120-250 TPS.
  • 2× vyšší decode throughput než iní providery na serverless.
  • Zachované strengths GLM 5.2: powerful coding, použiteľný 1M token kontext, dlhé úlohy.
  • Bez markupu, BYOK podpora, ZDR režim a budgets pre API kľúče.

Prečo to stojí za pozornosť

GLM 5.2 sa od svojho vydania v polovici júna prediera medzi open agentic modely svetovej triedy. Wafer mu pridáva inference rýchlosť, ktorá robí model konkurencieschopným pre code agents v reálnom čase – už nielen ako lacná alternatíva, ale aj ako fast inference voľba.

Ako to vyskúšať

Dostupné v Vercel AI Gateway pod modelom glm-5.2-fast. Routing cez Wafer je default.