Společnost OpenAI představila autonomního agenta Operator, který dokáže automatizovat rutinní úkoly na internetu. Systém analyzuje webové stránky, interaguje s prvky rozhraní a opravuje chyby. Například na žádost uživatele vyhledá letenky podle zadaných kritérií — prozkoumá weby, porovná ceny a nabídne možnosti, v nejasných případech požádá o upřesnění.
Jak Operator napodobuje člověka?
Základem agenta je model Computer-Using Agent, který kombinuje schopnost GPT-4o analyzovat vizuální data s algoritmy učení s posilováním. To umožňuje:
- „Vidět“ prvky stránek jako člověk (tlačítka, pole pro zadání textu, menu).
- Používat virtuální klávesnici a myš — technologie nevyžaduje API připojení k platformám.
- Samostatně korigovat chyby: pokud úkol nedokončí, předá řízení uživateli.
Bezpečnost a omezení
Při práci s citlivými údaji (hesla, platební informace) Operator vyžaduje potvrzení akce. OpenAI také implementovala filtry pro blokování rizikových požadavků, jako jsou pokusy o hackování nebo přístup k zakázanému obsahu.
Technologie je zatím dostupná pouze v USA pro předplatitele ChatGPT Pro. OpenAI plánuje rozšířit geografickou dostupnost a integrovat agenta do standardní verze ChatGPT. Podle vývojářů to zpřístupní interakci s umělou inteligencí širšímu publiku: namísto manuálních příkazů stačí zadat textový požadavek.
Co to znamená pro běžné uživatele?
Operator usnadní situace vyžadující hromadné zpracování dat nebo opakované úkony. Příklady:
- Hledání nejvýhodnějších cen zboží napříč e-shopy.
- Automatická rezervace hotelů podle hodnocení a lokality.
- Vyplňování šablonových formulářů (registrace, dotazníky).
Technologie není stoprocentní: u složitých úkonů, jako je vyřizování víz nebo právních dokumentů, bude nutný zásah člověka. Přesto OpenAI označuje Operátora za krok k „univerzálním pomocníkům“, kteří sníží čas strávený rutinou.