Vercel AI Gateway pridal GLM 5.2 Fast cez Wafer s 170+ tokens/s
Čo je nové
- GLM 5.2 Fast od Z.ai je teraz dostupný v Vercel AI Gateway cez Wafer inference stack.
- Priemerný throughput 170+ tokens/sekundu, rozsah 120-250 TPS.
- 2× vyšší decode throughput než iní providery na serverless.
- Zachované strengths GLM 5.2: powerful coding, použiteľný 1M token kontext, dlhé úlohy.
- Bez markupu, BYOK podpora, ZDR režim a budgets pre API kľúče.
Prečo to stojí za pozornosť
GLM 5.2 sa od svojho vydania v polovici júna prediera medzi open agentic modely svetovej triedy. Wafer mu pridáva inference rýchlosť, ktorá robí model konkurencieschopným pre code agents v reálnom čase – už nielen ako lacná alternatíva, ale aj ako fast inference voľba.
Ako to vyskúšať
Dostupné v Vercel AI Gateway pod modelom glm-5.2-fast. Routing cez Wafer je default.
Otvoriť pôvodný zdroj
Vercel