Tavus spustila tři nové modely AI pro vylepšení videokomunikace

Redaktor

07 března 2025, 00:26

Vytvářejí realistickou animaci obličeje s zachováním individuality
Umožňují AI analyzovat vizuální podněty v reálném čase
Zlepšují plynulost dialogu díky minimalizaci prodlev mezi replikami

tavus.io

Společnost Tavus, specializující se na rozhraní pro videokomunikaci (CVI), uvedla tři nové modely umělé inteligence: Phoenix-3, Raven-0 a Sparrow-0. Algoritmy mají učinit interakci člověka s AI přirozenější — podobně jako živý rozhovor tváří v tvář.

Jak fungují nové modely

Phoenix-3 — detekuje emoce včetně mikroprojevů obličeje a pohybů rtů. Systém vytváří animaci s vysokou přesností při zachování individuálních rysů. Například pokud uživatel zasměje, avatar okamžitě zrcadlí jeho výraz.
Raven-0 — poskytuje AI „vizuální vnímání“. Algoritmus rozpoznává gesta, text, emoce a okolní prostředí přes kameru. Umožňuje například reagovat na zvednutou ruku nebo přečíst text na obrazovce.
Sparrow-0 — vylepšuje rytmus dialogu. Model analyzuje pauzy, tempo řeči a kontext, aby snížil prodlevy mezi replikami. V metrice přesnosti přechodů (Mean Absolute Error) dosahuje hodnoty 0,3989 oproti předchozímu rekordu 1,7467.

Všechny tři modely pracují společně v operačním systému Tavus, vytvářející řetězec reakcí od vnímání po odpověď. Společnost je již implementovala do svého AI agenta Charlie, který umí:

Vést dialog s realistickou mimikou;
Vyhledávat informace na internetu;
Analyzovat obsah obrazovky;
Generovat obrázky na požádání.

Technologie je dostupná přes veřejná API — nástroje pro propojení se třetími stranami. Tavus uvádí, že první klienti již novinky testují. Mezi nimi jsou velké značky i startupy integrující „digitální lidi“ do workflow. Společnost předpokládá, že virtuální avataři se stanou běžným nástrojem jako chytré telefony.

Čtěte také: Sonar od Perplexity AI: rychlost generování odpovědí dosáhla 1200 tokenů/s

Komentáře