Späť na rubriku
Výskum 🔥 Top

DeepSeek vydal DSpark — V4 inferencia o 60-85 % rýchlejšia bez retréningu

Nedeľa 28. júna 2026 Zdroj: MarkTechPost

Čo sa stalo

DeepSeek 27. júna otvoril DSpark — "Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation". Framework dramaticky zrýchľuje per-user generovanie na DeepSeek-V4 Flash i Pro variantoch bez nutnosti pretrénovať podkladový model.

Kontext a dopad

Ide o serializačný proboj v inferencii, ktorý umožňuje V4 "cítiť sa" výrazne rýchlejšie na existujúcom hardvéri — kritické vzhľadom na US export controls voči Číne. Je to zároveň prvý veľký technický release DeepSeeku po nedávnom funding kole a potvrdzuje pokračujúce silné open-source príspevky z Číny v jadrovej infraštruktúre.

Detaily

  • Speedup: 60-85 % na V4 Flash, 57-78 % na V4 Pro oproti MTP-1 baseline
  • Kombinuje paralelný draft backbone so sekvenčnou hlavou + confidence head + load-aware scheduler
  • Open-source checkpointy aj tréningový kód
  • Paper na arXiv:2606.19348
  • Top na Hacker News (771 bodov, 330 komentárov)
Otvoriť pôvodný zdroj MarkTechPost