Schopnost umělé inteligence „přemýšlet“ před odpovědí se stává realitou — Google tuto funkci integroval do nového modelu Gemini 2.5 Pro. Neuronová síť dělá pauzu pro analýzu dat, což podle tvůrců zajišťuje její status „nejchytřejšího současného modelu“.
Model je dostupný v nástroji Google AI Studio pro vývojáře a v aplikaci Gemini pro předplatitele tarifu Advanced (20 $ měsíčně). Jeho klíčová vlastnost — rozšířené kontextové okno — umožňuje zpracovat až 1 milion tokenů (přibližně 725 000 slov). To odpovídá obsahu 10 románů. Plánuje se navýšení na 2 miliony tokenů.
„V modelu Gemini 2.5 jsme dosáhli nové úrovně výkonu kombinací vylepšeného základního modelu s pokročilým post-tréninkem,“ uvádí oficiální blog společnosti.
Výsledky testování
- V komplexním testu Humanity’s Last Exam (1000 otázek z různých oborů) model dosáhl 18,8 %, což překonává konkurenční řešení.
- V programovacím testu Aider Polyglot zaznamenal výsledek 68,6 % — více než modely od OpenAI, Anthropic a DeepSeek.
- V benchmarku SWE-bench Verified pro vývojáře softwaru však Gemini 2.5 Pro prohrála s Claudem 3.7 Sonnet (63,8 % vs. 70,3 %).
„Přemýšlející“ přístup vyžaduje více času a výpočetních zdrojů, ale zvyšuje přesnost odpovědí u složitých úkolů — od analýzy vědeckých dat po psaní kódu. Například zpracování dotazu s kontextem 1 milionu tokenů umožní modelu pracovat s informačním objemem, který by člověk studoval několik týdnů.
Funkce analytické pauzy v modelu Gemini 2.5 Pro mění přístup k řešení komplexních úkolů — od vývoje softwaru po vědecký výzkum. Uživatelé tak získají přesnější odpovědi v oblastech, kde je kontext klíčový, například při analýze právních dokumentů nebo lékařských studií. Příklad: V testu Aider Polyglot model správně zpracoval 68,6 % dotazů spojených s hledáním chyb v kódu.