DeepSeek představil aktualizované modely umělé inteligence s rozšířenými možnostmi analýzy obrazu

Šéfredaktor

09 února 2025, 14:18

Neuronová síť umí rozpoznat text na fotkách a převést ho do tištěné podoby
Systém využívá metodu kombinace expertních algoritmů (MoE)
Řada zahrnuje tři verze s 1 až 4,5 miliardami parametrů

uiw.cz

Společnost DeepSeek oznámila aktualizovanou řadu modelů umělé inteligence VL2. Hlavní inovací je schopnost analyzovat vizuální data – od dokumentů a grafů až po fotky produktů. Jak se ukázalo, systém dokáže také rozpoznat ručně psaný text a převést ho do digitální formátu.

Základem technologie je metoda Mixture of Experts (MoE), která funguje na principu propojení více specializovaných algoritmů. Představte si to jako tým expertů: každý řeší část problému a výsledky se spojí do finální odpovědi. Díky tomu vznikly tři modely:

DeepSeek-VL2-Tiny (1 miliarda parametrů);
VL2-Small (2,8 miliardy parametrů);
VL2 (4,5 miliardy parametrů).

Podle tvůrců nová verze překonala předchůdce DeepSeek-VL v přesnosti zpracování dat. Mezitím si uživatelé novinku již vyzkoušeli: AI například rozpozná složení produktu na fotce a navrhne recepty nebo dekóduje složité tabulky. Nejpozoruhodnější je, že systém nejen „čte“ ruční zápisky, ale umí je i reprodukovat v digitální podobě – podobně jako virtuální asistent.

Přes technickou náročnost se tvůrcům podařilo zachovat rovnováhu mezi výkonem a dostupností. „Je to jako dát běžnému uživateli mikroskop, který zároveň vysvětlí, co vidí,“ přibližuje podstatu projektu zástupce společnosti.

Aktualizace DeepSeek-VL2 navazuje na trend integrace AI do každodenních úkolů. Zatím je systém určen především pro profesionály, ale zjednodušené verze by se v budoucnu mohly objevit i v masových aplikacích.

Čtěte také: Odborníci radí vyhýbat se stručným formulacím při dotazech na AI

Komentáře