Tencent představil AI generátor videa z obrázků s open-source kódem

Šéfredaktor

Nástroj převádí statické obrázky na videa až 5 sekund dlouhá
Model vychází z předchozí verze s 13 miliardami parametrů
Pro provoz je potřeba grafická karta s minimálně 60 GB video paměti

uiw.cz

Čínská společnost Tencent oznámila model HunyuanVideo-I2V — open-source nástroj, který generuje videoklipy z obrázků. Řešení vytváří videa v rozlišení 720p s maximální délkou 129 snímků (přibližně 5 sekund) na základě textových pokynů.

HunyuanVideo-I2V je postaven na platformě HunyuanVideo — největší open-source modelu pro generování videa na světě, představeném v prosinci 2024. Obsahuje přes 13 miliard parametrů, což umožňuje zpracovávat komplexní scény. Uživatelé mohou využít LoRA adaptéry — speciální nástroje pro úpravu stylů, podobné filtrům v fotoeditorech. To dává kontrolu nad vizuálními efekty: například přidat déšť nebo změnit osvětlení.

Pro spuštění modelu je nutná výkonná grafická karta. Doporučený objem video paměti je 80 GB, minimální limit 60 GB. Někteří uživatelé uvádějí, že pro statické scény stačí karta RTX 4090 s 24 GB paměti. Dynamické prvky, jako pohybující se objekty, však mohou vyžadovat silnější hardware.

Vývojáři zdůrazňují, že open-source kód umožňuje přizpůsobit nástroj různým úkolům. Zároveň model zůstává specializovaným řešením kvůli vysokým nárokům na výpočetní výkon. Tencent pracuje na optimalizaci HunyuanVideo-I2V, aby snížil zatížení zařízení a rozšířil okruh uživatelů.

Čtěte také: Jak může AI zvýšit sledovanost na YouTube o 49 %? Odpověď od Spotter Studio

Komentáře