Společnost Google představila aktualizaci svého AI modelu Gemini 2.5 Pro, která potěšila především webové vývojáře. Podle posledních testů model lépe generuje kód pro weby a aplikace a předstihl konkurenční nástroj Claude 3.7 Sonnet od Anthropic. V jiných typech úloh však Gemini stále zaostává.
Zajímavé jsou výsledky testu SimpleQA, který ověřuje znalost specifických faktů (např. „kolik let má nejstarší dub v Evropě“). Gemini 2.5 Pro a Claude 3 zde dosáhly podobného skóre. To naznačuje, že jejich „kapacita“ může být srovnatelná, ačkoli přesné údaje nejsou k dispozici.
Na trhu AI nástrojů aktuálně vedou dvě verze Gemini a jedna verze Claude 3. Oba modely řeší úkoly podobně efektivně, ale liší se stylem. Například Claude 3 píše kód v Pythonu s minimem komentářů — někteří uživatelé to považují za výhodu.
Během posledního týdne uživatelé zaznamenali, že Gemini 2.5 Pro zvládla dvakrát úkoly, se kterými si Claude 3 neporadil. Opačný případ nastal pouze jednou.
Aktualizovaný model je již dostupný pro vývojáře prostřednictvím platforem Google Vertex a AI Studio. Vyzkoušet jej můžete okamžitě — stačí přejít do účtu a vybrat novou verzi v nastavení.