Společnost DeepSeek oznámila aktualizovanou řadu modelů umělé inteligence VL2. Hlavní inovací je schopnost analyzovat vizuální data – od dokumentů a grafů až po fotky produktů. Jak se ukázalo, systém dokáže také rozpoznat ručně psaný text a převést ho do digitální formátu.
Základem technologie je metoda Mixture of Experts (MoE), která funguje na principu propojení více specializovaných algoritmů. Představte si to jako tým expertů: každý řeší část problému a výsledky se spojí do finální odpovědi. Díky tomu vznikly tři modely:
- DeepSeek-VL2-Tiny (1 miliarda parametrů);
- VL2-Small (2,8 miliardy parametrů);
- VL2 (4,5 miliardy parametrů).
Podle tvůrců nová verze překonala předchůdce DeepSeek-VL v přesnosti zpracování dat. Mezitím si uživatelé novinku již vyzkoušeli: AI například rozpozná složení produktu na fotce a navrhne recepty nebo dekóduje složité tabulky. Nejpozoruhodnější je, že systém nejen „čte“ ruční zápisky, ale umí je i reprodukovat v digitální podobě – podobně jako virtuální asistent.
Přes technickou náročnost se tvůrcům podařilo zachovat rovnováhu mezi výkonem a dostupností. „Je to jako dát běžnému uživateli mikroskop, který zároveň vysvětlí, co vidí,“ přibližuje podstatu projektu zástupce společnosti.
Aktualizace DeepSeek-VL2 navazuje na trend integrace AI do každodenních úkolů. Zatím je systém určen především pro profesionály, ale zjednodušené verze by se v budoucnu mohly objevit i v masových aplikacích.