Nový hráč na trhu umělé inteligence, startup Black Forest Labs, se hlasitě ohlásil představením řady modelů pro generování obrazů FLUX.1. Společnost, založená bývalými zaměstnanci Stability AI, tvrdí, že jejich vývoj aspiruje na titul nejlepších ve své třídě.
„Naše modely převyšují existující analogie v řadě ukazatelů,“ – prohlašují vývojáři Black Forest Labs.
Podle jejich slov FLUX.1 nejen vytváří vysoce kvalitní obrazy, ale také přesně sleduje původní popis, čímž předčí takové známé platformy jako Midjourney a DALL-E.
Historie a tým
Spuštění FLUX.1 přichází na pozadí nedávných událostí ve Stability AI. Pouhých sedm týdnů po vydání Stable Diffusion 3 Medium, který vyvolal vlnu kritiky kvůli problémům s generováním obrazů lidí, klíčoví zaměstnanci opustili společnost. Robin Rombach, Andreas Blattmann a Dominik Lorenz spolu s Patrickem Esserem, který se podílel na vývoji první verze Stable Diffusion, založili Black Forest Labs.
Modelová řada FLUX.1
Startup představil tři modely FLUX.1:
- FLUX.1 pro – výkonný generátor pro komerční využití přes API
- FLUX.1 dev – bezplatná verze pro nekomerční použití, dostupná pro instalaci na osobní počítač
- FLUX.1 schnell – rychlý a lehký model pro operativní generování
Na rozdíl od mnoha konkurentů Black Forest Labs poskytuje možnost bezplatného využití FLUX.1 dev. Uživatelé si mohou nainstalovat tuto verzi na svůj počítač, což otevírá široké možnosti pro experimenty a tvorbu bez nutnosti platit předplatné nebo přístup ke cloudovým službám.
Technologické inovace a srovnání s konkurencí
Inovativní přístup Black Forest Labs spočívá ve využití hybridní architektury, která kombinuje metody transformace a difúze. Modely, čítající až 12 miliard parametrů, vykazují působivé výsledky, zejména při generování obrazů lidských rukou a textu – oblasti, kde mnoho konkurentů zažívá potíže.

Výsledky FLUX.1 jsou srovnatelné s DALL-E 3 v přesnosti sledování popisu a blíží se fotorealistickému vzhledu Midjourney 6. Přitom nové modely výrazně převyšují Stable Diffusion XL – poslední velké vydání týmu v rámci Stability AI. Je důležité poznamenat, že na rozdíl od placených služeb konkurentů FLUX.1 dev poskytuje uživatelům výkonný nástroj pro generování obrazů bez finančních nákladů.
Objevení FLUX.1 může být zlomovým momentem ve vývoji technologií pro generování obrazů. Bezplatná dostupnost a možnost lokální instalace činí tuto technologii zvláště atraktivní pro široký okruh uživatelů – od amatérů po profesionály. Nicméně zůstává otevřenou otázkou, na jakých datech byly modely trénovány – vývojáři zatím tyto informace nezveřejňují.