Ve světě umělé inteligence došlo k nečekané změně vedení. Podle aktualizovaného žebříčku generátorů obrazů Text to Image Leaderboard, vyvinutého týmem ArtificialAnalysis, se na první místo dostal zcela nový model – FLUX 1 Pro. Tento model, vytvořený společností Black Forest Labs, v slepém hlasování uživatelů překonal dokonce i nedávno vydaný Midjourney v6.1.
Tým vývojářů FLUX, vedený bývalými inženýry Stable Diffusion, kteří opustili Stability AI na jaře tohoto roku, dodává tomuto úspěchu další váhu. Jejich odchod zřejmě ovlivnil kvalitu produktů Stability AI – po jejich odchodu vydaný Stable Diffusion 3 Medium se ukázal být překvapivě slabý v generování obrazů lidí.
FLUX, stejně jako Stable Diffusion, je model s otevřeným zdrojovým kódem. Je dostupný ve třech verzích: Schnell (rychlá, ale jednoduchá), Dev (vyvážená) a Pro (maximální kvalita). Podle žebříčku dokonce i verze Dev nezaostává za Midjourney 6.0.
Na rozdíl od placeného Midjourney lze FLUX Schnell a Dev již nyní bezplatně vyzkoušet na různých webových stránkách, včetně platformy Hugging Face. FLUX Dev ukazuje působivé výsledky v generování obrazů lidí, řešíc problémy s anatomií, které byly pozorovány u Stable Diffusion 3.
Model FLUX také vyniká mezi konkurencí schopností porozumět složitým požadavkům a generovat několik objektů se zadanými vlastnostmi. Kromě toho ukazuje dobré výsledky v psaní textu na obrazech, i když zatím pouze v angličtině.

Navzdory vedoucí pozici FLUX zůstává konkurence v oblasti generátorů obrazů vysoká. Očekává se vydání Playground 3.0 s „funkcemi, které v generátorech obrazů ještě nebyly“, a také aktualizace populární neuronové sítě Ideogram. Midjourney připravuje vydání verze 6.2 a pracuje na rozsáhlé aktualizaci 7.0.
Svět generátorů obrazů se nadále rychle vyvíjí a FLUX 1 Pro ukazuje, jak rychle se mohou měnit lídři v této oblasti. Zbývá sledovat, zda si nováček dokáže udržet své pozice tváří v tvář intenzivní konkurenci.