Francouzská společnost Mistral, považovaná za jednoho z předních evropských konkurentů amerických gigantů umělé inteligence, představila svůj první multimodální model AI. Nový vývoj, nazvaný Pixtral 12B, je schopen zpracovávat jak textové, tak vizuální informace.
Technické charakteristiky
Pixtral 12B je založen na textové neuronové síti Nemo 12B a má 12 miliard parametrů, což určuje jeho schopnosti řešit různé úkoly. Velikost modelu je přibližně 24 gigabytů. Pro srovnání, jeden z předních modelů na trhu, Llama 3.1 405B, má 405 miliard parametrů.
Sofia Yang, vedoucí oddělení pro spolupráci s vývojáři Mistral, informovala o vydání nového modelu. Podle jejích slov je Pixtral 12B již dostupný ke stažení na populárních platformách GitHub a Hugging Face. Do budoucna se plánuje integrace modelu do vlastního chatbota společnosti Mistral.
Možnosti a perspektivy
Klíčovou vlastností Pixtralu 12B je jeho schopnost odpovídat na otázky související s obrázky, což otevírá široké možnosti pro aplikaci v různých oblastech, od analýzy vizuálního obsahu až po vytváření intuitivnějších uživatelských rozhraní.
Vydání Pixtralu 12B znamená důležitý krok ve vývoji evropského průmyslu umělé inteligence, který demonstruje potenciál kontinentu vytvářet pokročilé technologie schopné konkurovat produktům předních amerických společností.