Společnost Tavus, specializující se na rozhraní pro videokomunikaci (CVI), uvedla tři nové modely umělé inteligence: Phoenix-3, Raven-0 a Sparrow-0. Algoritmy mají učinit interakci člověka s AI přirozenější — podobně jako živý rozhovor tváří v tvář.
Jak fungují nové modely
- Phoenix-3 — detekuje emoce včetně mikroprojevů obličeje a pohybů rtů. Systém vytváří animaci s vysokou přesností při zachování individuálních rysů. Například pokud uživatel zasměje, avatar okamžitě zrcadlí jeho výraz.
- Raven-0 — poskytuje AI „vizuální vnímání“. Algoritmus rozpoznává gesta, text, emoce a okolní prostředí přes kameru. Umožňuje například reagovat na zvednutou ruku nebo přečíst text na obrazovce.
- Sparrow-0 — vylepšuje rytmus dialogu. Model analyzuje pauzy, tempo řeči a kontext, aby snížil prodlevy mezi replikami. V metrice přesnosti přechodů (Mean Absolute Error) dosahuje hodnoty 0,3989 oproti předchozímu rekordu 1,7467.
Všechny tři modely pracují společně v operačním systému Tavus, vytvářející řetězec reakcí od vnímání po odpověď. Společnost je již implementovala do svého AI agenta Charlie, který umí:
- Vést dialog s realistickou mimikou;
- Vyhledávat informace na internetu;
- Analyzovat obsah obrazovky;
- Generovat obrázky na požádání.
Technologie je dostupná přes veřejná API — nástroje pro propojení se třetími stranami. Tavus uvádí, že první klienti již novinky testují. Mezi nimi jsou velké značky i startupy integrující „digitální lidi“ do workflow. Společnost předpokládá, že virtuální avataři se stanou běžným nástrojem jako chytré telefony.