Google představil multimodální AI model Gemini 2.5 Pro s funkcí přemýšlení

Šéfredaktor

Model analyzuje data před odpovědí a zvyšuje přesnost výsledků
Kontextové okno zvládne až 1 milion tokenů — ekvivalent 725 tisíc slov
V programovacích testech překonala Gemini 2.5 Pro řešení od OpenAI a Anthropic

deepmind.google

Schopnost umělé inteligence „přemýšlet“ před odpovědí se stává realitou — Google tuto funkci integroval do nového modelu Gemini 2.5 Pro. Neuronová síť dělá pauzu pro analýzu dat, což podle tvůrců zajišťuje její status „nejchytřejšího současného modelu“.

Model je dostupný v nástroji Google AI Studio pro vývojáře a v aplikaci Gemini pro předplatitele tarifu Advanced (20 $ měsíčně). Jeho klíčová vlastnost — rozšířené kontextové okno — umožňuje zpracovat až 1 milion tokenů (přibližně 725 000 slov). To odpovídá obsahu 10 románů. Plánuje se navýšení na 2 miliony tokenů.

„V modelu Gemini 2.5 jsme dosáhli nové úrovně výkonu kombinací vylepšeného základního modelu s pokročilým post-tréninkem,“ uvádí oficiální blog společnosti.

Výsledky testování

V komplexním testu Humanity’s Last Exam (1000 otázek z různých oborů) model dosáhl 18,8 %, což překonává konkurenční řešení.
V programovacím testu Aider Polyglot zaznamenal výsledek 68,6 % — více než modely od OpenAI, Anthropic a DeepSeek.
V benchmarku SWE-bench Verified pro vývojáře softwaru však Gemini 2.5 Pro prohrála s Claudem 3.7 Sonnet (63,8 % vs. 70,3 %).

„Přemýšlející“ přístup vyžaduje více času a výpočetních zdrojů, ale zvyšuje přesnost odpovědí u složitých úkolů — od analýzy vědeckých dat po psaní kódu. Například zpracování dotazu s kontextem 1 milionu tokenů umožní modelu pracovat s informačním objemem, který by člověk studoval několik týdnů.

Funkce analytické pauzy v modelu Gemini 2.5 Pro mění přístup k řešení komplexních úkolů — od vývoje softwaru po vědecký výzkum. Uživatelé tak získají přesnější odpovědi v oblastech, kde je kontext klíčový, například při analýze právních dokumentů nebo lékařských studií. Příklad: V testu Aider Polyglot model správně zpracoval 68,6 % dotazů spojených s hledáním chyb v kódu.

Čtěte také: Jak AI od DeepMind změní tvorbu videí na YouTube Shorts?

Komentáře