GPT Operator als persoonlijke assistent: werkt het zoals verwacht? [4 ervaringen]
![GPT Operator als persoonlijke assistent: werkt het zoals verwacht? [4 ervaringen]](https://www.frankwatching.com/app/uploads/2025/02/GPT-Operator-shutterstock_2577596187-1600x900.jpg)
In al het DeepSeek-geweld, werd de lancering van GPT Operator totaal overschaduwd. Het langverwachte antwoord van GPT op de grootste AI-trend die voor dit jaar wordt voorzien. Hoe werkt het en werkt het ook zoals verwacht? Ik ging experimenteren met Operator en deel in dit artikel al mijn ervaringen.
Norbert Wiener, de grondlegger van de cybernetica, schreef in zijn boek The Human Use of Human Beings in 1950 al dat automatische machines in staat zouden zijn om het werk van mensen over te nemen. Hij waarschuwde dat technologie niet alleen fysieke arbeid, maar ook denkwerk zou automatiseren.
Destijds klonk dit voor velen als sciencefiction, maar Wiener voorzag al dat machines slimmer zouden worden dan men dacht. Zijn woorden:
The automatic machine, when used for production, competes with human labor not on the basis of man’s muscle power, but on the basis of his intelligence. – Norbert Wiener
AI-agenten zijn al jaren een droombeeld, maar Operator lijkt een serieuze stap voorwaarts. De technologie wordt ondersteund door een nieuw model, de ‘Computer-Using Agent’ (CUA), dat vision en reasoning combineert. En ja, alleen voor de happy few met een Pro-abonnement van 200 dollar per maand. Maar hoe slim is deze AI nu echt? Afgelopen weekend kreeg ik de mogelijkheid om via een klant in de VS eens te gaan spelen met Operator. Ik heb het uitgebreid getest, en de resultaten waren… laten we zeggen: verrassend.
Operator is niet zomaar een chatbot. In tegenstelling tot een gewone chatbot zoals GPT en Gemini, kan deze tool zelfstandig webpagina’s bekijken, klikken, typen en formulieren invullen. In theorie betekent dat: “Hey Operator, boek een tafel voor twee in Eindhoven” en hop, het wordt geregeld.
Maar hoe autonoom is het echt? Operator werkt niet met traditionele API’s, maar gebruikt een ingebouwde browser die websites visueel interpreteert en bedient, net als een mens. Het kan data verzamelen, taken uitvoeren en zelfs interacteren met platforms als OpenTable. Toch kleven er ook nadelen aan deze aanpak, zoals ik zelf heb ondervonden.
Ik besloot Operator verschillende taken te geven om zijn capaciteiten te testen, om te kijken of het echt een verschil kan maken in het dagelijks gebruik.
GPT Operator aanleren om te reserveren
De afgelopen tijd ben ik een paar keer vergeten een restaurant te boeken om een hapje te eten met een klant of vriend. Helaas is dat, door de drukte in de horeca, wel steeds vaker nodig. Daarom liet ik Operator eens aan het werk gaan, om te kijken of het dit makkelijk kan regelen voor mij.
“Boek een tafel voor twee in Eindhoven bij restaurant X (naam niet relevant voor deze blog), vrijdagavond om 19:00 uur”, vroeg ik hem. Operator ging enthousiast aan de slag en opende OpenTable op de site van het restaurant. Een tool die de meeste restaurants waar ik eet, gebruiken. Maar al snel bleek dat het systeem flinke moeite had met de dynamische interface ervan.
- Niet kunnen inloggen: Operator vroeg niet om mijn accountgegevens, waardoor het vastliep bij de reserveringspagina. Zonder login kon het geen reservering voltooien.
- Verkeerde selectie: in plaats van de beschikbaarheid te zoeken, bleef het op de homepage hangen. Het selecteerde willekeurige opties en gaf geen realtime beschikbare tijdslots aan.
- Geen flexibiliteit: toen mijn eerste keuze om 19:00 uur niet beschikbaar was, bood Operator geen alternatieve opties aan. Een menselijke gebruiker zou direct andere tijden of restaurants proberen, maar Operator gaf simpelweg op.
Na 10 minuten moest ik de controle overnemen en zelf de reservering maken. Had ik dit niet gedaan, dan had ik op vrijdag weer zonder tafel gezeten.
Simpel stagair-werk automatiseren
Na mijn restaurant-avontuur ging ik een case uitproberen voor mijn werk. De opdracht was simpel: zoek 20 populaire crypto-influencers op YouTube, verzamel hun LinkedIn-profielen en e-mailadressen en zet alles in een net Excel-overzicht.
De eerste minuten waren echt heel gaaf en indrukwekkend om te zien. Operator opende een browser, zocht naar financiële influencers en begon informatie te verzamelen. Maar al snel kwamen ook hier de eerste struikelblokken:
- Verkeerde zoekstrategie: in plaats van YouTube zelf te doorzoeken, koos het Bing als primaire bron. Dit leidde tot resultaten die irrelevant waren of verouderde informatie bevatten. Logischerwijs zou een mens in mijn optiek beginnen op YouTube zelf, waar influencers hun bio, links en contactgegevens plaatsen. Operator dacht daar anders over.
- Hallucinaties: Operator begon uit het niets e-mailadressen en LinkedIn-profielen te verzinnen. Sommige opgegeven contactgegevens waren volledig fictief en kwamen nergens op het internet voor. Als ik deze data klakkeloos had overgenomen, had ik een groot aantal nutteloze of zelfs schadelijke leads in mijn lijst gehad.
- Snelheidsprobleem: scrollen, klikken en typen duurde secondenlang. Na 20 minuten had Operator slechts 10 influencers verzameld en veel van de data klopte niet. Een handmatige zoektocht had me sneller en nauwkeurigere informatie opgeleverd.
Kortom: als Operator een stagiair was, had ik hem vriendelijk bedankt voor de moeite… en nooit meer teruggebeld.
Operator als persoonlijke shopper
Nog zo’n taak waar ik best wat tijd aan kwijt ben, terwijl het niet gelijk lol geeft: webwinkelen. Vooral de standaard, simpele dingen die ik gewoon nodig heb. Daarom gaf ik Operator de opdracht: “Bestel een pak koffie en een USB-C-naar-USB-kabel bij een grote Nederlandse webshop.”
Dit leek in eerste instantie goed te gaan. Operator zocht de producten op, voegde ze toe aan de winkelwagen en ging richting de betaalpagina. Maar toen kwamen de problemen.
- Geen betalingsverwerking: Operator kon niet omgaan met het invoeren van betaalgegevens en vroeg niet om mijn tussenkomst. Zonder deze stap kon de bestelling niet worden afgerond.
- Geen controle op productkeuze: de gekozen producten kwamen niet overeen met de exacte specificaties die ik had opgegeven. Het bestelde bijvoorbeeld een USB-C kabel terwijl ik specifiek een USB-C-naar-USB-kabel had gevraagd.
- Foutmeldingen genegeerd: bij een foutmelding over beschikbaarheid probeerde Operator niet om een alternatief te zoeken. Een menselijke gebruiker zou intuïtief een ander merk of een ander formaat kiezen, maar Operator stopte simpelweg.
Resultaat: een half gevulde winkelwagen en een bestelling die ik alsnog zelf moest afronden.
Vliegensvlug vluchten vastleggen
Als laatste probeerde ik Operator uit met een veel genoemd voorbeeld vanuit GPT zelf: het boeken van vluchten. Ik vlieg vaak en weet hoeveel tijd het mij kost, dus ik was hoopvol. Maar ook hier kwam ik van een koude kermis thuis.
Het liet me ook meteen zien waar Operator wél goed voor is: het regelen van simpele, repetitieve taken. Zoals elke week dezelfde bestelling plaatsen bij dezelfde partij.
Maar wie wel eens een vliegticket boekt, weet hoeveel stappen er in het boekingsproces zitten. Hoeveel keuzes er zijn. Hoe fijn het is dat je ziet dat je goedkoper kan vliegen op een ander tijdstip die dag. Maar ook; het selecteren van een stoel, wat elke keer weer anders is omdat er onwijs veel soorten vliegtuigen zijn. Laat staan wat voor maaltijd, kofferkeuze en dat soort dingen je allemaal wil.
Ondanks deze missers heeft Operator in mijn optiek wel echt potentie. Dit is nog maar een eerste versie, en OpenAI zal ongetwijfeld de snelheid en nauwkeurigheid verbeteren. Vergelijk de eerste versie van GPT maar eens met de versie die we vandaag de dag gebruiken.
Daarnaast kunnen betaalbare alternatieven zoals DeepSeek deze technologie toegankelijk maken voor een breder publiek. Andere bedrijven zoals Google (met Project Mariner) en Anthropic (met hun eigen Computer Use AI) werken aan vergelijkbare systemen. De concurrentie betekent dat we binnenkort nog krachtigere AI-agenten kunnen verwachten.
Voor nu? Het is een indrukwekkende demo, maar geen gamechanger. Mijn baan is voorlopig nog veilig. Maar wie weet hoe dat over een jaar is?
Bron header-afbeelding: Selman GEDIK / Shutterstock.com