ChatGPT-updates: voice, afbeeldingen & toegang tot het hele internet

ChatGPT-updates: voice, afbeeldingen & toegang tot het hele internet

OpenAI kondigde afgelopen week aan dat voice beschikbaar is in ChatGPT en dat je binnenkort afbeeldingen kan uploaden en zelfs kan laten genereren met een prompt. Daarnaast heeft ChatGPT straks toegang tot het hele internet en is de output dus actueel. Ik krijg serieuze AI-FOMO van al deze ontwikkelingen, dus ben er in gedoken en praat jullie bij. Wat betekenen deze updates en wat heb je eraan?

1. Praat met ChatGPT

Je kan nu een gesprek voeren met ChatGPT door middel van voice. Vertel je prompt en ChatGPT antwoordt met een zelf gekozen stem terug. De nieuwe stemfunctie wordt aangedreven door een nieuw tekst-naar-spraak-model, dat in staat is om menselijk klinkende audio te genereren uit enkel tekst en enkele seconden van voorbeeldspraak. OpenAI heeft samengewerkt met professionele stemacteurs om elk van de stemmen te creëren. Ze gebruiken ook Whisper, hun open source spraakherkenning-systeem om je gesproken woorden om te zetten in tekst.

Belangrijk: je hebt nu nog een betaald abonnement nodig om voice te gebruiken. Heb je een betaald abonnement? Dan zet je in de mobiele app bij instellingen onder ‘Beta Features’ voice aan. Daarna kan je via de koptelefoon in de rechterbovenhoek starten. Je selecteert een stem en het kletsen kan beginnen. De stem klinkt een stuk natuurlijker dan Alexa of Siri, vind ik.

De verschillende voices in ChatGPT.

De verschillende voices in ChatGPT (bron).

Wat zijn de voordelen van voice in ChatGPT?

  • De toegankelijkheid wordt aanzienlijk verbetert. Voor gebruikers met visuele beperkingen is spraakinteractie vaak makkelijker dan typen.
  • Het biedt meer gemak in situaties waarin typen onhandig of niet mogelijk is.
  • Het is natuurlijker. Voor veel mensen voelt een gesprek met spraak natuurlijker en intuïtiever dan een geschreven conversatie.
  • Het is sneller. Een goede prompt schrijven kost best wat tijd. Een prompt uitspreken gaat sneller.
  • Er ontstaat een nieuw pallet aan gebruiksscenario’s. Denk aan het leren van een nieuwe taal, een leuke bed time story voor je kind of een buddy tegen eenzaamheid.
  • In de toekomst kan spraakinteractie met ChatGPT geïntegreerd worden in andere technologieën en apparaten, zoals smart speakers, waardoor nog meer gebruiksscenario’s ontstaan.

In essentie biedt de mogelijkheid om met ChatGPT te praten een meer flexibele en toegankelijke manier om met de technologie te communiceren.

2. Afbeeldingen toevoegen

Ik heb de fotoknop nog niet, de nieuwe updates worden langzaam uitgerold, maar het wordt straks mogelijk om een foto te maken of een afbeelding te kiezen en deze door ChatGPT te laten analyseren en interpreteren. GPT-3.5 en GPT-4 passen hun taalredeneringsvaardigheden toe op een breed scala aan afbeeldingen, zoals foto’s, schermafbeeldingen en documenten die zowel tekst als afbeeldingen bevatten. Waar ik bij voice vooral vind dat het meer gebruiksgemak oplevert, zie ik met deze nieuwe feature heel veel nieuwe gebruiksscenario’s ontstaan.

Ik ben bijvoorbeeld iemand die vaak kladdert op een bord of een stuk papier tijdens meetings. Daar maak ik straks een foto van en ChatGPT werkt het uit. Maar denk ook aan feedback vragen over advertentiecampagnes. Sluit het beeldmateriaal aan bij je doel en doelgroep? Daarnaast kan je denken aan feedback op producten: bijvoorbeeld over de verpakking. En afbeeldingen van grafieken of dashboards kunnen straks door ChatGPT geanalyseerd en geïnterpreteerd worden.

Dan hebben we het nog niet gehad over de gebruiksscenario’s buiten marketing om. Denk aan: er iets stuk aan je fiets, maak er een foto van en ChatGPT vertelt hoe je het kan oplossen. Of maak een foto van de inhoud van je koelkast en je krijgt een recept voorgeschoteld.

3. Afbeeldingen laten genereren

Het nieuwe tekst-naar-afbeelding-model DALL·E 3 van OpenAI kan afbeeldingen maken op basis van een prompt. Dus straks krijg je niet alleen een antwoord in tekst of voice, maar ook in beelden. Dit is nog niet beschikbaar en wordt waarschijnlijk vanaf oktober ook eerst uitgerold onder gebruikers met een betaald abonnement.

Hieronder zie je een afbeelding waarvan wordt gezegd dat deze is gemaakt met DALL·E 3. Als niet-designer ben ik heel benieuwd naar deze feature. Het prikkelt je creativiteit, maar kan je ook helpen om bijvoorbeeld een uitleg te verduidelijken met afbeeldingen.

Afbeelding gemaakt met DALL·E 3

Afbeelding gemaakt met DALL·E 3 (bron).

4. Toegang tot het hele internet

ChatGPT kan nu op het internet browsen om je te voorzien van actuele informatie, compleet met directe links naar bronnen. Het is niet beperkt meer tot gegevens van voor september 2021. Volgens OpenAI is dit nu beschikbaar voor Plus en Enterprise users. Ik heb het nog niet staan bij ‘Beta Features’.

Ik lees op de LinkedIn van OpenAI dat meer gebruikers hier last van hebben. Het lijkt met de versie te maken te hebben, volgens dit forum. In de gaten houden maar! Als het wel werkt, dan heb je weer een legio aan nieuwe gebruiksscenario’s. Denk aan marktonderzoek, concurrentieonderzoek of het vinden van relevante blogs of links.

Best eng he?

Ik vind het heel tof wat voor nieuwe gebruiksscenario’s er straks bijkomen. De mogelijkheden worden steeds grenzelozer, maar dat is tegelijkertijd ook best spannend. Of eigenlijk vooral veel. De AI-ontwikkelingen gaan wel erg hard en je kan aannemen dat het tempo nog verder versneld gaat worden. Ik merk aan mezelf dat ik een soort AI-FOMO begin te ontwikkelen. Ik vind het allemaal vooral leuk, maar heb ook het gevoel dat ik achter de feiten aan blijf lopen. Ik bedoel, de kans is groot dat dit artikel morgen alweer achterhaald is… Herken je dat?

Volgens ChatGPT zelf is het in ieder geval heel normaal. Sky (een van de stemmen) vertelt me dat het normaal is voor professionals en enthousiastelingen in een snel veranderende industrie om zich soms overweldigend te voelen. Ze geeft als tip dat het nuttig kan zijn om je te omringen met een community waar je ervaringen en inzichten kunt delen.

Handig! Laten we die hier net hebben…

Ik ben heel benieuwd welke nieuwe gebruiksscenario’s jij ziet ontstaan door deze nieuwe features?

Bron header-afbeelding: Diego Thomazini / Shutterstock.com

Blog