Společnost Google přidala do svého API pro vývojáře nový model vektorizace textu Gemini Embedding. Technologie převádí slova a fráze na číselné sekvence (vektory), které zachycují významové vztahy mezi textovými fragmenty. To umožňuje efektivněji řešit úkoly jako vyhledávání dokumentů nebo jejich klasifikaci, přičemž snižuje náklady a urychluje zpracování dat.
Představte si, že každé slovo nebo věta je bod na mapě, kde prvky s podobným významem leží blízko sebe. Například slova „kočka“ a „pes“ budou blíž než „kočka“ a „počítač“. Tento přístup pomáhá algoritmům rychleji odhalovat vzorce v datech.
„Trénovaný na samotném modelu Gemini tento model zdědil schopnost porozumět jazyku a jemným kontextům, což ho činí vhodným pro širokou škálu aplikací,“ uvádí se v prohlášení Googlu.
Gemini Embedding překonává výkonnost text-embedding-004, dosavadní špičkové řešení Googlu. Mezi klíčové vylepšení patří:
- Možnost zpracovat větší úseky textu a kódu v jednom dotazu.
- Podpora přes 100 jazyků – dvojnásobek oproti předchozí verzi.
- Univerzálnost: model se přizpůsobuje úlohám ve financích, právu, vědě a dalších oborech.
Technologie je zatím ve fázi experimentu. Vývojáři ji mohou testovat přes API Gemini, ale s omezenými funkcemi.
Podobné modely vektorizace již nabízejí Amazon, Cohere a OpenAI. Google sice podobné nástroje dříve uvedl, ale Gemini Embedding je první model trénovaný na rodině modelů Gemini – vlajkové lodi společnosti v oblasti AI. Díky tomu přesněji zachycuje významové nuance, což je klíčové pro náročné úkoly jako analýza právních dokumentů nebo vědeckých článků.