Čínská společnost Tencent oznámila model HunyuanVideo-I2V — open-source nástroj, který generuje videoklipy z obrázků. Řešení vytváří videa v rozlišení 720p s maximální délkou 129 snímků (přibližně 5 sekund) na základě textových pokynů.
HunyuanVideo-I2V je postaven na platformě HunyuanVideo — největší open-source modelu pro generování videa na světě, představeném v prosinci 2024. Obsahuje přes 13 miliard parametrů, což umožňuje zpracovávat komplexní scény. Uživatelé mohou využít LoRA adaptéry — speciální nástroje pro úpravu stylů, podobné filtrům v fotoeditorech. To dává kontrolu nad vizuálními efekty: například přidat déšť nebo změnit osvětlení.
Pro spuštění modelu je nutná výkonná grafická karta. Doporučený objem video paměti je 80 GB, minimální limit 60 GB. Někteří uživatelé uvádějí, že pro statické scény stačí karta RTX 4090 s 24 GB paměti. Dynamické prvky, jako pohybující se objekty, však mohou vyžadovat silnější hardware.
Vývojáři zdůrazňují, že open-source kód umožňuje přizpůsobit nástroj různým úkolům. Zároveň model zůstává specializovaným řešením kvůli vysokým nárokům na výpočetní výkon. Tencent pracuje na optimalizaci HunyuanVideo-I2V, aby snížil zatížení zařízení a rozšířil okruh uživatelů.