Čínský technologický gigant Tencent představil aktualizovanou verzi svého generátoru obrázků Hunyuan Image 2.0. Hlavní výhodou je okamžité vytváření vizuálů. Zatímco uživatel píše požadavek, algoritmus již začíná generovat, zatímco jiné nástroje potřebují 5–10 sekund.
Rychlost je zajištěna novou difuzní architekturou a optimalizovaným obrazovým kodekem. Počet parametrů modelu se oproti předchozí verzi zvýšil 10×, což zlepšilo detaily. Generátor například vytváří fotorealistické obrázky bez typického „umělého“ vzhledu díky učení s posilováním a estetickým šablonám.
Mezi nové funkce patří:
- Režim kreslení v reálném čase — náhled se okamžitě mění s úpravami skic;
- Dual-Canvas Studio — nástroj pro kombinování nápadů a experimentování s perspektivami;
- Automatická synchronizace skic — systém sám sladí osvětlení a úhly při nahrání více obrázků.
„Aktuálně pracujeme na multimodálním modelu, který nabídne ještě více tvůrčích možností,“ uvedli vývojáři.
Hunyuan Image 2.0 je zatím dostupný pouze v čínštině na oficiálních stránkách Tencentu. Termín mezinárodního vydání nebyl upřesněn.
K testování technologie nejsou potřeba speciální znalosti — rozhraní je intuitivní i pro nováčky. Podle interních testů GenEval systém správně zpracuje 95 % složitých požadavků, jako je „nakreslit kočku v impresionistickém stylu sedící na levitující pohovce“. Detaily o trénování modelu a jeho omezeních však společnost nesdělila.