LongCat-2.0: Meituan vydáva MoE model s 1,6 bilióna parametrov a kontextom 1 milión tokenov
Čo sa stalo
Tím Meituan LongCat zverejnil 30. júna model card a blog príspevok k LongCat-2.0, ktorý sa rýchlo dostal medzi top príspevky na Hacker News.
Kontext a dopad
LongCat-2.0 je ďalším dôkazom rýchleho vzostupu čínskych modelov s otvorenými váhami, ktoré sa vyrovnávajú alebo blížia západným špičkovým systémom, hoci sa vyhýbajú americkým akcelerátorom. Posilňuje argument, že Čína dokáže stavať systémy s biliónom parametrov výhradne na domácich čipoch napriek exportným kontrolám, a vývojárom po celom svete dáva ďalší veľký, prístupný reasoning model. Vydanie je významné aj preto, že Meituan, gigant rozvozu jedla a služieb, je teraz pevnou súčasťou pretekov na hranici AI.
Detaily
- 1,6 bilióna celkových parametrov, ~48 mld. aktívnych na token
- Kontext 1 milión tokenov, optimalizovaný pre agentické scenáre vrátane kódovania a plánovania úloh
- Tréning prebehol na 50 000–60 000 domácich čínskych čipoch — najväčší tréningový beh na domácom hardvéri v Číne
- Počas testovacieho obdobia získava každý používateľ 10 mil. tokenov denne zdarma
- Parametricky porovnateľný s nedávno vydaným DeepSeek V4
Otvoriť pôvodný zdroj
Hacker News