Společnost Google oznámila rozšíření řady umělé inteligence Gemini 2.0 o tři nové modely. Každý z nich je přizpůsoben pro různé úkoly – od běžných dotazů po složité výpočty. Všechny varianty jsou již dostupné vývojářům přes platformy Google AI Studio a Vertex AI nebo v prémiovém chatbotu Gemini Advanced.
První v seznamu aktualizací je Gemini 2.0 Flash, uvedená v prosinci. Nyní má zvýšenou rychlost zpracování a některá omezení byla odstraněna. Jak se ukázalo, tato verze zůstává zdarma, ale zatím podporuje pouze textové odpovědi. V nadcházejících měsících Google plánuje přidat práci s obrázky, zvukem a živým videem.
Následuje Gemini 2.0 Flash-Lite – zjednodušený model pro základní úkoly. Je ve fázi veřejného testování prostřednictvím API a je pozicována jako konkurent předchozí verze 1.5 Flash. Při podobné ceně vykazuje Flash-Lite lepší výkon ve většině testů.
Seznam uzavírá Gemini 2.0 Pro – experimentální model pro složité dotazy včetně programování. Jeho kontextové okno (objem dat, která AI dokáže analyzovat najednou) bylo rozšířeno na 2 miliony tokenů. Pro srovnání: jde o dvojnásobek oproti Flashi. Pro je zatím omezena na textový výstup, ale v budoucnu získá multimediální funkce.
Google odstoupil od rozdělování tarifů na krátké a dlouhé dotazy. Nyní mohou smíšené úlohy (text + obrázky) vyjít levněji než s předchozím modelem Gemini 1.5 Flash. Zároveň je nová Flash dražší než její předchůdce a Flash-Lite zachovává původní cenu.
Společnost zároveň testuje modely Flash Thinking, které fungují na stejném principu jako OpenAI o3 a Deepseek-R1. Ty analyzují data z YouTube, Map a Vyhledávání Google a před generováním odpovědi provádějí dodatečné kroky.
Všechny tři modely přijímají na vstupu obrázky a zvuk, ale ve výstupu je zatím nepodporují. Jak uvedla společnost Google, multimediální funkce pro Flash a Pro budou přidány během několika měsíců. Přesné termíny nebyly upřesněny.
Vývojáři také zdůrazňují, že navzdory vylepšením lze skutečnou kvalitu Flash-Lite a 1.5 Flash posoudit až v praxi. „Pouze testy ukážou, jak jsou srovnatelné,“ uvádí se v prohlášení společnosti.
*Poznámka: Token je jednotka informace, na kterou AI dělí text pro analýzu. Například slovo „počítač“ = 1 token, věta z 10 slov = ~10 tokenů.