AI-video mét geluid: hoe spraakmakend is Veo 3?

Een kleine honderd jaar geleden kwam The Jazz Singer uit. Voor het eerst hoorde het bioscooppubliek een acteur écht praten op het witte doek: ‘Wait a minute, wait a minute, you ain’t heard nothin’ yet.’ Dit maakte in 1927 diepe indruk en zou de toekomst van de film voorgoed veranderen – het tijdperk van de stomme film was definitief voorbij. In 2025 doet Veo 3 iets vergelijkbaars, maar dan voor AI-video. Voor het eerst kunnen zowel beeld als geluid op basis van één prompt worden gegenereerd. Is dat even spraakmakend als in 1927? Laten we het samen onderzoeken. In dit artikel deel ik voorbeeldvideo’s en onderaan vind je een oproep om ook jouw prompt te delen.
AI-video zónder geluid bestaat al even. Naast Veo kun je met platforms als Runway, Pika Labs en Sora ‘stomme’ AI-video’s maken. Het geluid moet je er dan achteraf zelf aan toevoegen. Op zich geen probleem, maar wel een gedoetje als het om gesproken tekst gaat.
Om dat lipsync te krijgen, is een precisieklus. Veo 3 combineert beeld en geluid: zowel achtergrondgeluid als stemmen. Native geluid dus. Daarin is Veo 3 trouwens niet helemaal uniek, Grok van X kan het bijvoorbeeld ook. Maar Veo 3 loopt hierin wel voorop. Online worden de meest waanzinnige voorbeelden gedeeld, zoals springende konijnen op een trampoline, opgenomen via een bewakingscamera. De AI-video wordt als ‘echt’ ervaren en haalt miljoenen views.
Veo 1, 2 en nu dus 3
Waar zijn Veo 1 en 2 gebleven, vraag je je misschien af? Veo is gelanceerd in 2024, tijdens de Google I/O-ontwikkelaarsconferentie. Eind 2024 volgde Veo 2. En sinds mei 2025 zijn we dus bij Veo 3. Tenminste, als je in de Verenigde Staten woont of een andere manier hebt gevonden om vroegtijdig Veo 3 te gebruiken, zoals via een VPN-verbinding. In ons land is Veo 3 vanaf begin juli 2025 officieel te gebruiken, bijvoorbeeld als onderdeel van een abonnement op Google AI Pro, Google Flow of Canva AI. Zelf gebruik ik SonoVid.ai.
Veo kon 1080p-video’s maken van een minuut lang. Veo 2 maakte scherpere 4K-beelden en begreep al meer van de werking van het menselijk lichaam. Veo 3 laat je realistische video’s maken, in combinatie met lipsync geluid. Oók in het Nederlands! Vooral het feit dat de video’s zo levensecht zijn, is bijzonder. En dat zal er alles mee te maken hebben dat Google achter Veo zit – en YouTube dus waarschijnlijk gebruikt wordt om de AI te trainen.
Wel zijn de video’s slechts maximaal 8-10 seconden lang. Je eerste AI-speelfilm maken, is op deze manier een tijdrovende bezigheid. Maar aangezien online video’s tegenwoordig steeds korter worden, hoeft de lengte voor de meeste toepassingen geen probleem te zijn.
Eerste gebruikservaring
Wat Veo precies kost, hoeveel video’s je per maand kunt genereren en welke andere features er zijn, hangt af van de tool waarmee je aan de slag gaat. Om je een idee te geven: ik kocht via SonoVid.ai het Starter Pack van 7.000 credits voor 50 dollar. Het Creator Pack van 15.000 credits is 100 dollar. En het Business Pack van 32.000 credits is 200 dollar. Daar komt de BTW nog bij. Ook zijn er maandelijkse of jaarlijkse abonnementen beschikbaar (Plus, Pro of Enterprise). Naast wat andere kosten per credit is het grote verschil tussen de pakketten dat je met het Starter Pack geen rechten afkoopt voor commercieel gebruik van de video’s.
Als je Veo 3 gebruikt via Canva AI of Google Flow, kunnen de kosten nog (veel) verder oplopen. Ook kan het aantal video’s dat je kunt genereren per maand, beperkt zijn. De kosten en de beperkte hoeveelheid video’s die je kunt genereren zijn de grotere nadelen van Veo 3, als je het mij vraagt. Er zijn gratis alternatieven, zoals Grok van X en Wan 2.2 van Alibaba. Daarover zometeen meer.
Na te hebben betaald, laat Veo 3 mij de keuze maken voor Tekst-to-video of Image-to-video. Prompten kan gewoon in het Nederlands, wel zo makkelijk. Daarna maak ik de keuze voor snel genereren of kwalitatieve video. Dit heeft ook gevolgen voor de credits die worden verbruikt. Een video van lage kwaliteit kost 300 credits. (Voor Image-to-video is dit 400 credits.) Dezelfde video van hoge kwaliteit is 1.200 credits. (Of 1.600 credits bij Image-to-video.) Video’s zijn 8 seconden lang en worden opgeleverd met geluid, standaard in 16:9 formaat. Via een MS Stream-link kun je een preview van de video’s delen.
In Normal Mode kan ik video’s zonder geluid genereren, van 5 of 10 seconden. Voor 5 seconden video in Standard Version betaal je 100 credits. Voor 10 seconden in Pro Version 800 credits. Het formaat is liggend (16:9), vierkant (1:1) of staand (9:16).
Ten slotte kan Veo 3 video’s reframen. Een ander formaat geven dus. Je uploadt een video of deelt een videolink. Na het uploaden wordt je video voor 200 credits met AI in een ander formaat gezet (Reframe). Een Veo-watermerk wordt bij sommige video’s automatisch meegegeven, rechtsonder in de hoek. In andere video’s niet.
Let the magic happen
De voorbereidingen zijn getroffen. Nu is het tijd om mijn eerste prompt op Veo 3 los te laten. Dat moment waarop je jouw creatie loslaat en toevertrouwt aan AI… magisch!
Wees zo specifiek en gedetailleerd mogelijk, waarschuwt Veo me vooraf nog. In 3-5 minuten is de eerste lage resolutie video klaar. Hogere resolutie video’s duren iets langer om te maken, zo’n of 5-10 minuten. Mijn eerste pogingen mislukken. ‘Failed to start video generation.’ Daarna probeer ik dezelfde prompt, maar dan in het Engels en het lukt!
Later lukt het me toch ook om in het Nederlands te prompten. Mijn eerste Veo 3-project is geboren! De preview is niet direct zichtbaar, maar als ik het bestand download, kan ik de video wel gelijk bekijken. Ook kan ik een MS Stream-link genereren en delen. De preview verschijnt na een paar minuten ook bij My Creations.
Kleine tip: maak het niet te ingewikkeld. Mijn eerste video bevatte zoveel elementen dat het systeem alles door elkaar gooide. Mijn tweede video was al beter. Maar ook daar ging het nog niet helemaal goed. Hier zie je hoe een arrestatieteam een criminele vis vangt. Althans, dat was het idee.
JSON-prompting voor maximale grip
Hoe duidelijker en gestructureerder je Veo 3 aanstuurt, hoe groter de kans dat het resultaat overeenkomt met wat je voor ogen hebt. Dé standaard op het gebied van prompten (voor AI-video) is JSON: JavaScript Object Notation. Daarmee geef je heel precies aan wat je in beeld wil zien.
Online worden talloze voorbeelden gedeeld van JSON-prompts voor AI-video. Vooral de JSON-prompt van deze Ikea-unboxing video kom ik vaak tegen:
{ “description”: “Cinematic shot of a sunlit Scandinavian bedroom. A sealed IKEA box trembles, opens, and flat pack furniture assembles rapidly into a serene, styled room highlighted by a yellow IKEA throw on the bed. No text.”, “style”: cinematic”, “camera”: “fixed wide angle”, “lighting”: “natural warm with cool accents”, “room”: “Scandinavian bedroom”, “elements”: [ “IKEA box (logo visible)”, “bed with yellow throw”, “bedside tables”, “lamps”, “wardrobe”, “shelves”, “mirror”, “art”, “rug”, “curtains”, “reading chair”, “plants” ], “motion”: “box opens, furniture assembles precisely and rapidly”, “ending”: “calm, modern space with yellow IKEA accent”, “text”: “none”, “keywords”: [ “16:9”, “IKEA”, “Scandinavian”, “fast assembly”, “no text”, “warm & cool tones” ] }
Door zelf andere elementen aan de JSON-prompt toe te voegen, zoals je logo en andere artikelen, kun je eenvoudig op basis van dit unboxing-basisconcept een AI-video voor je eigen merk genereren.
Even wat inspiratie opdoen
Voor je aan het prompten slaat: bekijk deze waanzinnige voorbeelden eens. Dit is allemaal met Veo 3 gemaakt! (En een goede edit-tool, denk ik.)
Liquid Death
Deze Liquid Death-commercial is 1 minuut lang en supercreatief. Wacht op de plot!
Pratende muffins
Gesprek tussen twee muffins in een oven: ze kunnen zelf nauwelijks geloven dat ze echt kunnen praten, dankzij Veo 3.
Sprekende zeeman en de zee
Prachtige oude man voor een wilde zee.
5 text-to-video tools, 1 duidelijke winnaar
Naast Veo 3 zijn er nog talloze alternatieven voor AI-video. De verschillen kun je het beste ervaren. Door dezelfde prompt in te voeren in meerdere platforms, zie je hoe dit uitpakt.
Dit is de prompt die ik heb gebruikt in meerdere platforms, met een filmische setting:
Leden van de maffia spelen poker in een rokerige, slechtverlichte kamer. Iemand speelt vals en een gevecht breekt uit.
Grok
Via de Grok-app wordt mijn prompt eerst automatisch in het Engels vertaald. Daarna kan ik een keuze maken uit verschillende afbeeldingen. Dit is de start van mijn video. Mannen met hoeden of zonder, een achtergrond in de vorm van een speelkaart, alles is mogelijk. Ik kies voor mét hoeden en een close-up setting en klik op Make Video.
Het resultaat is een video van pokerspelende maffiosi, op de achtergrond hoor je geroezemoes van de bar en het tikken van kaarten op tafel. Maar van een gevecht is geen sprake.
Ik kan de video achteraf nog aanpassen naar: Aangepast / Spicy of Fun. Pas op met Spicey, trouwens. Daar zijn al wat voorbeelden van bekend die Not Suitable For Work zijn.
Gratis tool: ja
Geluid: ja
Lengte video: 6 seconden
Wan2.2
Hier ben ik, van alle alternatieven die er zijn voor Veo, het meest nieuwsgierig naar.
Wan2.2 is in principe gratis te gebruiken, maar dan moet je als gebruiker wel geduld hebben. Na een account te hebben aangemaakt, kan ik mijn eerste video-ervaring opdoen. Het genereren vanuit de prompt duurt bij de gratis variant (bewust?) erg lang. Dat duurt uiteindelijk zó lang, dat ik besluit 150 credits aan te kopen, voor 5 dollar. Daarmee kun je, als het goed is, 10-30 video’s genereren. Een stuk goedkoper dan Veo 3 dus!
‘You’ve reached the edge!’ zegt Wan2.2 als mijn video klaar is. En daar gaan we…
Nadat mijn video ‘gereed’ is, duurt het alleen nog wel even voor ik deze te zien krijg. Uiteindelijk moet ik meer dan twee uur (!) wachten op het resultaat. Dat gaat bij Veo een stuk sneller. Als ik in de tussentijd een tweede video wil laten genereren, wordt dat niet toegestaan. Dit terwijl ik toch een upgrade heb aangekocht.
Na dus urenlang te hebben gewacht tot mijn Piority Generation eindelijk klaar is, is het zover. Film-like quality, delicate motion belooft Wan2.2 mij. Dat mag natuurlijk wel even wat tijd kosten.
De Wan2.2-video laat inderdaad levensechte pokerspelende maffiosi zien. Er wordt gekaart, dat escaleert vrijwel direct en dan wordt er gevochten. Zelf zó erg gevochten dat er een rookwolk verschijnt na een vuistslag! (Die mis lijkt te zijn.) De video heeft geen geluid.
Gratis tool: nee
Geluid: nee
Lengte video: 6 seconden
Midjourney
Naast AI-afbeeldingen kun je met Midjourney óók AI-video’s genereren. Daarbij maak je vanuit de prompt eerst een keuze voor een afbeelding en klik je dan op Animate.
Midjourney is oorspronkelijk natuurlijk een tool voor de generatie van afbeeldingen, video’s maken is geen intuïtief proces. In het ‘gevecht’ worden geen rake klappen uitgedeeld. Elke pokerspeler doet aan luchtboksen.
Gratis tool: nee
Geluid: nee
Lengte video: 5 seconden
Runway
Ook Runway zet mijn prompt in eerste instantie om in een afbeelding. Pas daarna wordt gevraagd of ik deze wil omzetten in een video. Tijdens het ‘gevecht’ maken de speler wilde bewegingen, maar echt vechten doen ze niet, al ziet het er heftig uit.
Gratis tool: nee
Geluid: nee
Lengte video: 5 seconden
Veo 3
De maffiaspelers zien er levensecht uit en er wordt iemand betrapt op valsspelen. Daar wordt naar gewezen en dan breekt een gevecht uit. Kort maar hevig. Daarbij moet vreemd genoeg vooral de lamp het ontgelden. Geld vliegt vanaf de tafel in het rond.
Gratis tool: nee
Geluid: ja
Lengte video: 8 seconden
Conclusies na het genereren van 5 AI-video’s
Wat heb ik geleerd na het delen van mijn filmische prompt in 5 platforms?
- Sommige tools zetten tekst eerst om in een afbeelding, andere genereren de video direct vanuit de prompt.
- Alle geteste platforms kunnen Nederlandstalige prompts verwerken.
- Mijn oorspronkelijke idee is bevestigd: Veo 3 loopt inderdaad voorop, op het gebied van AI-video. De pokerspelers zijn levensecht en Veo 3 ‘luistert’ van alle geteste text-to-video tools het ‘best’ naar de prompt.
- Bij de maffia werken alleen mannen.
Wanneer zet je AI-video in? En wanneer niet?
Vooropgesteld: de video’s die je met Veo maakt, zijn waanzinnig. In no-time prompt je vanuit het niets de geweldigste verhalen. Alles wat je maar kunt bedenken, gebeurt. Jouw gedachten, jouw wereld. Easy. En tegelijkertijd supermagisch.
De eerste versie van zo’n video overtreft in alle opzichten je verwachtingen, dat weet ik zeker. Maar als je video professioneel wil inzetten, wordt het een klein beetje een ander verhaal. Want AI is geen animatie. Je kunt niet álles 100% sturen wat er in beeld gebeurt. Soms moet je je verwachtingen wat bijstellen. Of de verwachtingen van je (interne) opdrachtgever.
Ook de sfeer vanuit één video meenemen naar een volgende is niet altijd makkelijk. Itereren, zoals we gewend zijn in bijvoorbeeld ChatGPT, is niet per se hoe dit werkt. Dat merkte ook Luke Andries van Aigenwijs.com die Veo 3 vanuit Google Flow gebruikte voor een videoreeks.
Voor vrij werk, of commerciële opdrachten die niet binnen superstrakke kaders uitgevoerd hoeven worden, is video-AI een perfecte oplossing. Als je wat budget tot je beschikking hebt, maak je hiermee in no-time professionele video’s waarmee je iedereen omver blaast. Maar voor opdrachten die binnen een vast stramien moeten worden uitgevoerd, zou ik misschien andere opties overwegen.
Jouw creativiteit en mijn credits, laten we samen Veo 3 proberen!
Wil je Veo 3 zelf (gratis!) ontdekken? Laten we samen de (on)mogelijkheden onderzoeken. Dit is mijn voorstel.
Ik heb voor 50 dollar een pakket aan Veo 3-credits gekocht. Die credits stel ik graag ter beschikking aan de ‘wetenschap’. Aan jullie dus! Jullie bedenken creatieve, interessante, spannende prompts en ik voer ze in, in Veo 3. (Zolang ik credits heb.) Het resultaat deel ik weer met jullie. Laten we samen kijken wat Veo 3 kan en ervan leren. Laten we vooral de randen opzoeken van wat er technisch mogelijk is. Met uitdagende prompts, zowel in beeld als geluid.
Hoe klinkt het achtergrondgeluid? Zijn stemmen levensecht? Wanneer gaat het systeem hallucineren? Dat soort vragen hoop ik samen te beantwoorden.
Zo werkt mijn aanbod:
- Onder dit artikel kun je in de comments jouw Veo-prompt delen.
- Dit kan ook op LinkedIn onder de post met dit bericht.
- Ik kopieer jouw prompt en plak deze 1-op-1 (!) in Veo 3.
- Ik maak video’s op lagere resolutie. Op die manier kan ik met mijn aangekochte credits zoveel mogelijk video’s maken.
- De video deel ik weer in de commentaren. Helemaal gratis. Leuk als je daarna weer reageert en aangeeft wat je bevalt aan het resultaat en wat minder.
- Geen commerciële insteken of politiek, geen merknamen. Geen ander gedoe. We houden het gezellig. Het gaat om het technische experiment.
- 1 video per persoon, leuk als zoveel mogelijk mensen dit kunnen proberen.
- En let op: het gaat om korte video’s, van slechts een paar seconden. Dus houd je prompt simpel en vooral kort.
- Zodra mijn 7.000 credits op zijn, houdt het experiment op.
Ik ben benieuwd naar jouw Veo 3-prompt! En… actie!
Afbeelding boven het artikel: gegenereerd met Veo 3