DeepSeek vydal DSpark — V4 inferencia o 60-85 % rýchlejšia bez retréningu
Čo sa stalo
DeepSeek 27. júna otvoril DSpark — "Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation". Framework dramaticky zrýchľuje per-user generovanie na DeepSeek-V4 Flash i Pro variantoch bez nutnosti pretrénovať podkladový model.
Kontext a dopad
Ide o serializačný proboj v inferencii, ktorý umožňuje V4 "cítiť sa" výrazne rýchlejšie na existujúcom hardvéri — kritické vzhľadom na US export controls voči Číne. Je to zároveň prvý veľký technický release DeepSeeku po nedávnom funding kole a potvrdzuje pokračujúce silné open-source príspevky z Číny v jadrovej infraštruktúre.
Detaily
- Speedup: 60-85 % na V4 Flash, 57-78 % na V4 Pro oproti MTP-1 baseline
- Kombinuje paralelný draft backbone so sekvenčnou hlavou + confidence head + load-aware scheduler
- Open-source checkpointy aj tréningový kód
- Paper na arXiv:2606.19348
- Top na Hacker News (771 bodov, 330 komentárov)
Otvoriť pôvodný zdroj
MarkTechPost