Van snel naar grondig: Deep Research verandert AI-zoekopdrachten

Het Chinese DeepSeek krijgt veel aandacht, maar het antwoord van OpenAI en de rest van de gevestigde orde is minstens even revolutionair. AI-onderzoeksassistenten die ‘Deep Research’ genoemd worden. Wat is het, werkt het, en wat kun je ermee? We doen een deep dive!
Het zal je niet ontgaan zijn dat in januari het Chinese DeepSeek gelanceerd werd. De hele wereld – je collega’s, je buurman, je hele tijdlijn – had het erover. Veel minder aandacht krijgen de reacties van ‘gevestigde’ AI-tools zoals Perplexity en OpenAI’s ChatGPT. En dat is niet terecht, want hun reactie liegt er niet om: Deep Research.
Een AI-onderzoeksassistent, dus. Net voor kerst kwam Google met Deep Research, begin februari volgde ChatGPT met – jawel – Deep Research, en op Valentijnsdag introduceerde Perplexity dezelfde functie. Ook Elon Musk’s Grok komt nu met een nieuwe versie met ‘Deep Search’. Dat klinkt alsof iedereen haast had met het vinden van een antwoord op DeepSeek. En dat is ook wel zo, want er zitten nog best wat kinderziektes in. Maar daarover later meer.
Wat is Deep Research eigenlijk?
Toen ChatGPT eind 2022 gelanceerd werd, gaf het alleen antwoorden op basis van trainingsdata. Pas later kwam de mogelijkheid om antwoorden aan te vullen met informatie van het internet via tools als ChatGPT Search, Google Gemini en Perplexity. Deze tools vertalen je vraag in enkele goede zoekopdrachten, bezoeken websites, en vatten de resultaten samen. In een paar seconden heb je je antwoord. Maar als het antwoord niet te vinden is, dan gaan ze vaak hallucineren. Je krijgt wel een antwoord, maar het is onzin.
De nieuwe Deep Research-tools doen het anders. Ze combineren twee recente ontwikkelingen: taalmodellen die langer ‘nadenken’ voor betere antwoorden, en het steeds zelfstandiger werken van AI-tools via agents. Het doel is niet een snel, maar een grondig antwoord. Ze kunnen je zoekvraag opdelen in kleinere stukken, en gebruiken meer bronnen dan de ‘oude’ tools als Perplexity. Bij ChatGPT’s versie meestal tussen de 20 en 30 bronnen.
Daarnaast kunnen de onderzoeksassistenten informatie van verschillende bronnen beter vergelijken. Blijkbaar kunnen ze hypotheses opstellen en toetsen. Deep Research-tools vatten niet alleen samen wat ze online vinden, maar beredeneren een echt antwoord. Ook als het niet in de trainingsdata zit, en ook als er niet letterlijk een kant-en-klaar antwoord online staat.
Hoe grondig en hoe goed ze dat doen, verschilt per tool. ChatGPT’s Deep Research is al beschikbaar voor Pro-gebruikers. Een Pro-abonnement kost 200 dollar per maand. Daarvoor krijg je 120 analyses (daar krijg je wel video’s maken met Sora en de nieuwe Operator-agent bij). De functie wordt nu ook uitgerold voor onder andere Plus-abonnees. Zij kunnen voor 20 dollar per maand maximaal 10 Deep Research-analyses doen. Een analyse met Deep Research duurt meestal zo’n 10 minuten, maar kan oplopen tot een half uur. Maar het is het wachten waard: uitgebreide analyses van meestal rond de 15 A4-pagina’s, soms korter, soms langer.
Het belangrijkste is natuurlijk de kwaliteit. AI-expert Ethan Mollick is onder de indruk; volgens hem zijn de analyses via Google’s versie op bachelor-niveau, maar die van ChatGPT bijna op promovendus/PhD-niveau. Daar staat tegenover dat Google’s versie veel goedkoper is. Het is inbegrepen in hun Google One AI Premium-abonnement van 22 euro per maand. Bij Perplexity mag je het zelfs 5 keer per dag helemaal gratis uitproberen.
Wat kun je met Deep Research?
Leuk, al die mogelijkheden. Maar wat heb je er als marcom-professional aan? Hier enkele toepassingen van Deep Research, die je kunt aanvullen met alle gebieden waar onderzoek waarde toevoegt:
Content en SEO
- Analyse van zoekgedrag en trending topics
- Dieper inzicht in waarom bepaalde content wel of juist niet werkt
- Onderzoek naar SEO-strategieën van concurrenten
Reputatie
- Gedetailleerde media-analyses over langere periodes
- Reputatieonderzoek onder verschillende stakeholders
- Monitoring van veranderende percepties en sentimenten, en gebruikte frames en argumenten
Marktonderzoek
- Identificeren van nieuwe marktkansen
- Concurrentieanalyse en ontdekken van zwakke punten bij concurrenten
- Veranderende klantbehoeften in kaart brengen
- Testen van marktstrategieën
Ongetwijfeld zullen er de komende tijd nog veel meer toepassingsmogelijkheden bedacht en ontdekt worden. Maar de betekenis van Deep Research gaat verder dan alleen toepassingsmogelijkheden. Het vraagt nieuwe vaardigheden: niet alleen de juiste onderzoeksvragen formuleren, maar vooral kritisch kunnen evalueren wat de analyses opleveren.
Belangrijk is dat iedereen toegang heeft tot een eigen onderzoeksassistent. Tijdrovende marktonderzoeken worden beschikbaar voor iedereen: grote bedrijven, mkb’ers, zzp’ers, actiegroepen… Natuurlijk, 200 dollar per maand is niet voor iedereen haalbaar, maar OpenAI heeft aangekondigd dat Deep Research op termijn ook naar het gewone ChatGPT-Plus-abonnement van 20 dollar komt. Dat is voor veel meer mensen betaalbaar. Voorlopig kun je met Google en Perplexity voor weinig geld snelle, oppervlakkigere onderzoeken doen. Wil je nu al diepgaande, strategische analyses maken, dan zul je toch de portemonnee moeten trekken.
Wat op termijn de effecten zullen zijn van een ‘onderzoeksassistent voor iedereen’ is anybody’s guess. Maar dat het een grondige verandering zal zijn, is al wel duidelijk.
Deep Research testen in de praktijk: 4 voorbeelden
Om te ervaren of Deep Research nu echt zo goed is als beweerd wordt, en om te kijken wat allemaal wel en niet kan, heb ik meerdere tests uitgevoerd met de dure ChatGPT-variant.
1. Media-analyse
De eerste test: een media-analyse over het RIVM-onderzoek naar geitenhouderijen en longontstekingen bij omwonenden. Na 12 minuten en 27 bronnen kreeg ik een analyse van 13 pagina’s. En van een goed niveau! De analyse beschreef onder andere hoe RIVM-onderzoekers voorzichtig waren met het trekken van harde conclusies uit hun onderzoek, belichtte nauwkeurig de onenigheid tussen PVV-minister Agema en BBB-minister Wiersma, en hoe de sector benadrukte dat overhaaste beslissingen vermeden moesten worden.
Interessanter nog was het communicatieadvies. Zo adviseerde Deep Research het ministerie van LVVN om goed te onderbouwen waarom aanvullend onderzoek nodig zou zijn. Zo kon het ministerie de indruk vermijden dat het vertragingstactieken in zou zetten. Voor het ministerie van IenW was het advies om het vraagstuk als omgevingskwestie te kaderen en als neutrale partij een brug te vormen tussen de ministeries LVVN en VWS. Dit soort inzichten zijn direct bruikbaar voor communicatieprofessionals, ook al neem je de adviezen misschien niet over.
De analyse was overigens niet feilloos. Sommige beweringen over de publieke opinie misten onderbouwing of bronvermelding. Je moet dus zoals altijd kritisch blijven en feiten controleren.
2. Concurrentie-analyse
Een andere test was een concurrentie-analyse voor de KLM. In 10 minuten onderzocht Deep Research 29 bronnen en leverde een 21 pagina’s tellende analyse die alle grote uitdagingen behandelde: het wereldwijde luchtvaartnetwerk, economische schommelingen, milieuaspecten, de Schiphol-kwestie, en zelfs de invloed van thuiswerken op ticketverkoop.
De tool beoordeelde potentiële overnamekandidaten, stelde SWOT-analyses op en suggereerde strategieën. Zelfs de eerste aanbevolen stap had uit de koker van een duurbetaalde consultant kunnen komen: bezuinigen!
Hier overtuigde Deep Research doordat het veel verschillende onderwerpen en invalshoeken (milieu, markt, concurrenten, politiek) op een indrukwekkende manier combineerde tot één doorwrocht rapport. Het had zo een management-samenvatting van een echte concurrentie-analyse van de KLM kunnen zijn.
3. Marktonderzoek
Om de waarde voor marktonderzoek te testen, vroeg ik een om geschikte locaties voor een fictieve landelijke opticien-keten gericht op 65-plussers. Deep Research ging grondig te werk: het zocht demografische cijfers op, betrok de concentratie van seniorenwoningen, betrok de bereikbaarheid voor minder mobiele klanten, en analyseerde bestaande concurrentie.
Het leverde echte analyses op. Zo werd Heerlen eerst afgewezen vanwege teveel concurrentie, maar later toch aanbevolen omdat deze stad ook ouderen uit omliggende gemeenten bedient. Ruimte genoeg voor een nieuwe speler dus.
4. Onderzoeksjournalistiek
Om te kijken hoe goed Deep Research zou zijn in onderzoeksjournalistiek vroeg ik het een artikel van 1500 woorden te schrijven over wat de gevolgen van DeepSeek zijn voor chipfabrikant ASML. In plaats van 1500 woorden kreeg ik er 5500, 14 pagina’s A4. En opnieuw was de analyse niet alleen uitvoerig, maar behandelde het alle belangrijke onderwerpen. De beurskoersen, het vernieuwende van DeepSeek, uitspraken van CEO’s van AI-tools en chipfabrikanten.
Maar het is vooral de diepgang die imponeert. Zo werkt het twee scenario’s uit: één waarin DeepSeek zorgt voor een lagere vraag naar chips omdat het op minder zware hardware draait. Maar ook één waarin er door DeepSeek juist meer toepassingsmogelijkheden van AI ontstaan en er daardoor juist méér chips nodig zijn. Beide scenario’s werkt het vervolgens uit voor ASML. Deze benadering en dit niveau zijn representatief voor de kwaliteit van de analyses van Deep Research.
Kinderziekten en andere kwaaltjes van Deep Research
Natuurlijk zijn er ook nadelen aan ChatGPT’s Deep Research:
- Kinderziekten. Het weigert soms dienst. Bij sommige opdrachten start Deep Research niet op en krijg je een ‘gewoon’ ChatGPT-antwoord.
- Bugs. Regelmatig blijft het hangen op 100%, maar kun je de analyse niet afbreken. Opnieuw inloggen kan helpen om de analyse alsnog te kunnen lezen. Soms komt de analyse met uren vertraging, maar soms verdwijnt na zo’n vastloper de hele conversatie. Met je lang verwachte analyse.
- Beperkte bronnen. Deep Research kan alleen bij openbare online bronnen of uitgeverijen waar OpenAI deals mee heeft (zoals Axel Springer’s Politico). Kranten achter betaalmuren, vakbladen, radio en tv, het ontbreekt allemaal.
- Betrouwbaarheid. De analyses zijn doorgaans goed, maar kunnen hallucinaties, misinterpretaties en onjuistheden bevatten. Fact-checken blijft nodig.
- De lengte. Een ChatGPT-antwoord van twee pagina’s controleren is te doen, maar 21 pagina’s minutieus controleren? En: je wilt de belangrijkste conclusies delen, maar veel collega’s gaan niet de hele analyse lezen. Samenvatten dus!
- Inconsistentie. Vergelijkbare opdrachten kunnen verschillende analyses opleveren. Bij een bijna identieke vraag was het ene rapport 17 pagina’s, het andere maar 11. De grote lijn was wel gelijk, maar verwacht geen rekenmachine met telkens exact dezelfde uitkomst.
Zelf experimenteren
Wat in dit artikel niet goed uit de verf komt, is de essentie: je ervaart pas hoe goed ChatGPT’s Deep Research is als je een volledige analyse doorleest. Niet door dit artikel van 1600 woorden. Daarom zitten er in dit artikel links in naar de complete analyses, zodat je zelf kunt beoordelen hoe goed je de analyses vindt.
Maar het allerbeste leer je door het zelf uit te proberen. Weet je nog dat je van je stoel viel bij je eerste AI-ervaring? Hou je vast, want Deep Research doet dat opnieuw. Geen 200 dollar beschikbaar? Probeer dan Perplexity’s versie gratis, al is die minder uitgebreid en van lager niveau.
Deep Research is misschien wat te haastig gelanceerd als reactie op de schokgolf van DeepSeek, waardoor het nog duidelijke kinderziekten en andere nadelen zoals betrouwbaarheid heeft. Maar het is nu al nuttig voor iedere professional die onderzoek gebruikt om beter werk te leveren. De kosten vormen voor sommigen een drempel, maar drempels bieden ook kansen: je kunt nu een voorsprong opbouwen voordat iedereen het gaat gebruiken.