Tým DeepSeek představil aktualizovanou verzi své vlajkové jazykové DeepSeek-V3-0324, oficiální oznámení s detaily změn však dosud nezveřejnil. První testeři na sociální síti X uvádějí, že model vykazuje znatelný pokrok v řešení matematických úloh a práci s kódem.
Co je známo o aktualizaci?
Uživatelé, kteří novou verzi vyzkoušeli, popisují rozdíl mezi předchozí a současnou verzí jako „markantní“. Přestože konfigurace modelu zůstala nezměněna — stále využívá architekturu Směs expertů (MoE) s 685 miliardami parametrů — kvalita odpovědí, zejména v exaktních vědách, výrazně vzrostla.
Jak získat přístup k aktualizaci?
Na oficiálním webu DeepSeek není dostupnost nové verze v chatovém rozhraní potvrzena. Model však lze již testovat:
- Prostřednictvím Hugging Face, kde jeho velikost činí téměř 700 GB, což lokální použití pro většinu uživatelů limituje kvůli nárokům na hardware.
- Prostřednictvím služby OpenRouter, která aktualizaci integrovala a nabízí bezplatné testování.
Co stojí za zlepšením výkonu?
Odborníci uvádějí, že pokrok mohl být dosažen optimalizací tréninkových metod nebo rozšířením datové sady o kvalitní příklady matematických úloh a kódu. „Taková vylepšení bez změn architektury obvykle souvisejí s úpravami algoritmů nebo dat,“ dodávají.
Komunita čeká na technickou zprávu od DeepSeek, která objasní konkrétní inovace. Společnost zatím detaily nekomentuje, což ponechává prostor pro spekulace.