Společnost Amazon oznámila univerzálního AI agenta Nova Act, který dokáže samostatně provádět akce na internetu: vyplňovat formuláře, rezervovat stoly nebo objednávat zboží. Jde o první produkt laboratoře AGI Amazon, vytvořené pod vedením bývalých výzkumníků OpenAI Davida Luana a Petera Abbeela. Technologie má konkurovat řešením jako OpenAI Operator nebo Anthropic Computer Use v oblasti univerzálních AI agentů.
Agent pracuje prostřednictvím webového prohlížeče a napodobuje lidské chování. Může například:
- Vyhledat restauraci, ověřit volné termíny a rezervovat stůl.
- Automatizovat objednávky zboží podle zadaných parametrů.
- Analyzovat text na obrazovce pro určení dalšího kroku.
Pro vývojáře je k dispozici Nova Act SDK — sada nástrojů pro přizpůsobení scénářů konkrétním potřebám. „Toto je výzkumný náhled, který otevírá nové možnosti,“ uvádí se v prohlášení.
Nova Act vznikl v rámci projektu Alexa+ — aktualizované verze hlasového asistenta. Podle interních testů Amazonu agent překonal konkurenci:
- 94 % v testu ScreenSpot Web Text (analýza interakce s textem na obrazovce);
- 88 % u OpenAI CUA;
- 90 % u Claude 3.7 Sonnet od Anthropic.
Přístup k SDK je již otevřen na platformě nova.amazon.com, kde jsou dostupné i další modely Nova Foundation. Současná verze agenta však zvládá pouze základní operace — komplexní scénáře zatím nejsou podporovány.
Propojení Nova Act s Alexa+ může zvýšit dostupnost technologie díky integraci s chytrými zařízeními Amazonu. Společnost zatím nezveřejnila termín komerční verze, ale vývojáři již testují prototypy pro automatizaci rutinních procesů. Dalším cílem je naučit agenta pracovat s dynamickým obsahem, jako jsou aktualizované rozvrhy nebo ceny.