Ars Technica tester OpenAIs ‘Agent Mode’: Autonom web-navigasjon under lupen

TLDR;

I en test utført av Ars Technica viser OpenAIs “Agent Mode” imponerende evner til å navigere og handle på nettsider, men også svakheter som begrenset kontekstforståelse, ineffektivitet og behov for menneskelig tilsyn.

Teknologinettstedet Ars Technica har nylig testet en ny funksjon kalt “Agent Mode” i OpenAIs nettleser Atlas – et eksperimentelt verktøy som lar kunstig intelligens autonomt navigere og interagere med nettsider for å utføre komplekse oppgaver. Testen, utført av journalist Kyle Orland, avdekket både imponerende evner og tydelige begrensninger, og gir et interessant innblikk i fremtiden for AI-drevet nettbasert automatisering.

Funksjonalitet og demonstrerte evner

I eksperimentet lot Orland “Agent Mode” løse en rekke nettbaserte oppgaver, fra å finne informasjon til å utføre enkle handlinger på nettsider. Agenten demonstrerte evne til å:

Navigere nettsider: Klikke på lenker, fylle ut skjemaer, scrolle og identifisere relevante elementer.
Ekstrahere informasjon: Hente ut data fra nettsider basert på gitte kriterier.
Dekomponere oppgaver: Bryte ned komplekse instruksjoner i håndterbare steg.
Tilpasse seg: I noen tilfeller justere sin fremgangsmåte etter respons fra nettsider eller uventede situasjoner.

Disse egenskapene peker mot et betydelig potensial for å automatisere rutinepregede oppgaver på nett og effektivisere digitale arbeidsprosesser.

Utfordringer og begrensninger

Testen avdekket imidlertid flere utfordringer før teknologien kan brukes bredt:

Hallucinations: AI-en kunne generere feil informasjon eller utføre irrelevante handlinger.
Tvetydige instruksjoner: Vansker med å tolke uklare kommandoer.
Sikkerhetsrisiko: Risiko for utilsiktet interaksjon med skadelige nettsider eller eksponering av sensitiv informasjon.
Ineffektivitet: Tendens til å havne i løkker eller bruke unødvendig tid på enkelte oppgaver.
Mangel på kontekstforståelse: Begrenset evne til å forstå helheten i mer komplekse scenarier.

Dette viser behovet for bedre feilhåndtering, økt kontekstforståelse og strenge sikkerhetsprotokoller.

Implikasjoner og fremtidsperspektiver

Selv om “Agent Mode” fortsatt er i en tidlig fase, viser testen at teknologien kan bli et nyttig verktøy for å håndtere enkle, repeterende oppgaver. Som Orland påpeker, er dette foreløpig ikke en “sett og glem”-løsning, men et potensielt kraftig hjelpemiddel når det brukes under menneskelig tilsyn.

Kilde: Ars Technica – “We let OpenAI’s ‘Agent Mode’ surf the web for us—here’s what happened”, skrevet av Kyle Orland.

October 26, 2025