AI Gateway od Vercelu podporuje realtime hlas, reč a transkripciu
Čo je nové
- Realtime hlasoví agenti: nízko-latenčné dialogové slučky s tool calls v priebehu konverzácie
- Text-to-speech: konverzia textu na hovorené audio s výberom hlasov a MP3 výstupom
- Speech-to-text: prepis súborov, base64 reťazcov alebo URL
- Podpora OpenAI gpt-realtime-2: prvý realtime model napojený cez Gateway
- Rovnaká správa: observabilita, spend caps a BYOK identické ako pri textových/obrázkových/video modeloch
- Dostupné cez AI SDK 7: drop-in pre existujúce Vercel AI SDK aplikácie
Prečo to stojí za pozornosť
Hlasoví agenti sú teraz na Vercelu plnohodnotnou primitívou, čo odstraňuje potrebu vlastných realtime pipeline. Jednotná správa je dôležitá pre tímy, ktoré potrebujú limity, kontrolu kľúčov a tracing naprieč modalitami.
Ako to vyskúšať
Upgradujte na AI SDK 7 a zavolajte podporovaný model (napr. openai/gpt-realtime-2) cez AI Gateway, alebo si ho vyskúšajte priamo v playgrounde.
Otvoriť pôvodný zdroj
Vercel Changelog