Innovatie

Midjourney v5: een stap dichterbij realistische AI-afbeeldingen

0

Het is juli 2022. Plots is daar een levensveranderende tool die afbeeldingen genereert op basis van tekst: Midjourney. Goed, het was niet de eerste tool die kunstmatige afbeeldingen geneert. Maar ineens waren daar afbeeldingen van hoge kwaliteit, in plaats van pixels. Toch waren er nog wel gebreken. Een paar dagen geleden is Midjourney v5 uitgebracht. Wat is er in zes maanden verbeterd?

In september schreef ik een uitgebreid artikel over Midjourney op Frankwatching. De kwaliteit was goed, maar toch zag je dat er iets mankeerde aan de gemaakte afbeeldingen. Handen leken nog niet echt op handen en gezichten hadden niet altijd een frisse blik. Inmiddels zijn we een half jaar verder.Hoog tijd om het programma in te duiken om te zien hoe ver Midjourney in zes maanden is gekomen.

Wat is Midjourney ook alweer?

Kort samengevat is Midjourney een openbare server op Discord. Je kunt gratis toegang krijgen tot deze server. Met je gratis account is het mogelijk om enkele tientallen tekstverzoeken in te dienen. Het programma maakt vervolgens vier afbeeldingen op basis van jouw tekst. Dat kan kort en bondig zijn, maar ook super gedetailleerd. Het is maar net wat jij wil zien.

Na een poosje zijn je tekstverzoeken op en is het mogelijk om over te gaan op een betaalde versie. Er zijn verschillende abonnementen tussen $10,- en $60,- per maand, waarmee je onbeperkt toegang krijgt tot het programma. Hoe meer je betaalt, hoe meer mogelijkheden je krijgt op het gebied van kwaliteit en snelheid. Ook is het daarmee mogelijk om je zoektermen privé te gebruiken in een eigen server.

Zo gebruik je Midjourney

  • Ga naar https://www.midjourney.com/home/
  • Klik op ‘Join the beta’
  • Maak een account aan op Discord
  • Log in
  • Selecteer één van de newbie-bots aan de linkerzijde
  • Typ /imagine en tik uit wat je wil zien

Nieuw in Midjourney v5

Afgelopen juli kregen we te maken met de eerste versie van Midjourney. Nu zijn we aangekomen bij v5. Dit zijn de grootste veranderingen in Midjourney v5, vergeleken met v4:

  • Upscalen naar een hogere resolutie is niet meer nodig. Je krijgt de gegenereerde afbeeldingen – alle vier – direct in de hoogst mogelijke resolutie.
  • Het is mogelijk om meerdere beeldverhoudingen toe te passen, zoals 3:1 of 1:4. In vorige versies was dit 1:2 of 2:1.
  • Je hebt meer controle over de allerkleinste details in je geschreven prompt.
  • Voeg meerdere afbeeldingen toe en geef aan hoeveel waarde je hecht aan iedere afbeelding in het eindresultaat. Zo geef je aan welke foto je meer wil laten terugkomen, ten opzichte van een ander.
  • Tenen en vingers lijken nu realistischer.
  • Reflecties zijn natuurlijker.

Dat klinkt allemaal goed! Daarom is het hoog tijd om die wijzigingen in de praktijk te aanschouwen. Eens kijken hoe fotorealistisch, superduper en hoogwaardig deze tool een half jaar later is.

Toepassingen van Midjourney v5

Laat ik direct maar met de deur in huis vallen: ik ben sprakeloos. In mijn artikel op Frankwatching in september, zie je resultaten van afbeeldingen die bij lange na niet in de buurt komen met wat er nu mogelijk is. Ja: de afbeeldingen toen waren vet, omdat er nog niets beters was. Ook nu besef ik weer hoe snel iets kan veranderen in korte tijd. Daarom hierbij enkele willekeurig gegenereerde afbeeldingen en bijbehorende prompts in Midjourney v5.

Afbeelding gegenereerd met Midjourney v5 van vrouw in yoga pose tijdens golden hour

(peaceful yoga school), (tranquil, serene, spiritual, harmonious), (Canon EOS R6), (Canon RF 24-105mm f/4L IS USM), (golden hour), (candid lifestyle), (Kodak Portra 400) –q 2 –v 5 –s 250

Vierluik kleurplaat van beer die een boek leest, gegenereerd met Midjourney v5

realistic cartoon style coloring page of a happy and cute bear reading a book in the woods, close up headshot, dynamic pose, upper body portrait, child coloring page, black and white, crisp lines, clean and simple line art, white background –ar v5 17:22

Afbeelding van man in de jungle, gegenereerd met AI-tool Midjourney v5

“Create an image of a man in the jungle, focusing only on his body and the surrounding environment. The man should be dressed in rugged clothing and carrying a backpack or other gear. He should be positioned in the middle of a dense jungle, surrounded by tall trees and lush vegetation. The lighting should be dim, with only small beams of sunlight piercing through the thick canopy above. The man’s body should be visible, but his face should be obscured, either by shadows or by turning his head away from the viewer. The overall mood of the image should be adventurous and mysterious, with a sense of exploration and discovery v5.

Vierluik van game setting met kerker gegenereerd door AI

game asset 16bit pixel art isometric, large dungeon, with details, items and wall, medieval fantasy

Op deze manier kan ik oneindig doorgaan. Ik kijk opnieuw met hetzelfde enthousiasme als een half jaar geleden naar het opgeschroefde niveau binnen Midjourney. De afbeeldingen die je hier ziet, zijn in enkele minuten gecreëerd. Het enige wat nu opvalt, is de teen van de dame in yoga-houding. Die voelt onnatuurlijk. Maar verder? Oordeel vooral zelf over de eindresultaten.

Midjourney v1 vergeleken met Midjourney v5

Om de vooruitgang van Midjourney nog beter te laten zien, ga ik de gebruikte zoektermen van september opnieuw invoeren. Eerst (links) plaats ik de afbeelding die Midjourney in september genereerde. Daarnaast (rechts) plaats ik het beste resultaat uit Midjourney 5. In dit geval spreken beelden meer dan duizend woorden.

De kwaliteit van de afbeeldingen is enorm gegroeid in een half jaar tijd. In deze afbeeldingen zie ik alleen dat de schrijver twee pennen vasthoudt en schrijft op een laptop. Dat voelt niet natuurlijk. Maar kijken we naar de Batman kat, dan is het eindresultaat tig keer mooier dan eerst. Wat vind jij?

Deel ik nog dezelfde mening?

Een half jaar geleden zei ik:

Midjourney is een prachtige tool om concepten mee te creëren. Designers kunnen deze tool gebruiken om schetsen mee te maken en zelf volledig naar wens te pimpen. Zo haal je het beste uit beide werelden.

En dat is nog precies dezelfde manier waarop ik naar een tool als Midjourney kijk. De snelheid waarmee de kwaliteit van deze tools omhoog gaat, is verbazingwekkend. Ik kan me niet voorstellen hoe de kwaliteit over een half jaar is, maar dat zal waarschijnlijk nog bizarder zijn.

Ik ben ervan overtuigd dat Midjourney en alle andere AI-tools, zoals ChatGPT, briljante tools zijn om de menselijke efficiëntie te verhogen. Een computer geeft jouw idee een uiting en jij brengt die uiting verder tot leven. We zijn een nieuw tijdperk ingeslagen. AI is er en zal blijven.

De gevaren van fotorealisme (controverse)

Met geavanceerde tools als Midjourney, liggen er ook gevaren op de loer. Daarover ben ik niet de eerste die er een woord aan wijdt, maar ook absoluut niet de laatste. Als iedereen toegang krijgt tot het maken van fotorealistische uitingen voor een habbekrats, dan zitten daar ook mensen met verkeerde bedoelingen tussen.

Neem het controversiële nieuwsbericht over Donald Trump van afgelopen week. Er waren AI-gegenereerde afbeeldingen, waarop Donald Trump wordt opgepakt door de politie in New York. Hartstikke nep, maar in de verkeerde handen een krachtig middel voor het verspreiden van fake news. Kijk vooral zelf naar de neppe afbeeldingen die in de rondte gingen:

Accepteer cookies

 

Regelgeving loopt achter

Ook in september had ik het al over de achterblijvende regelgeving. Zowel op het gebied van auteursrecht voor de gemaakte uitingen, maar ook in het verspreiden van op onwaarheden beruste afbeeldingen, is veel werk aan de winkel. Blijkbaar ligt de prioriteit bij de overheid hier nog niet.

Op de site van Rijksinspectie Digitale Infrastructuur van het Ministerie van Economische Zaken en Klimaat, gecontroleerd op 22 maart 2023, blijkt er nog geen enkele regelgeving te zijn over kunstmatige intelligentie (AI). Wel staat er dat ze druk bezig zijn met het signaleren van veranderingen en bijbehorende risico’s. Hoe lang het duurt voordat daar een wetsvoorstel uitrolt? Joost mag het weten.

Conclusie

Tsjah, wat moet je nu nog zeggen. Het afgelopen jaar staat bijna overal in het teken van AI en dat zal de komende tijd niet veranderen. Tools als Midjourney worden in korte tijd sneller en beter. Dat gegeven is er. AI is er en AI blijft. Zie dit artikel als een goed moment om na te denken of je er zelf iets mee kunt doen. De wereld verandert razendsnel en ik ben benieuwd hoe dat over vijf jaar zal zijn. Haak je aan op het gebied van AI of laat je het volledig langs je heengaan? De keuze is aan jou.