Mensen maken merken

Hoe Midjourney iedereen creatiever kan makenOmarm je innerlijke tovenaarsleerling

Heb je ooit gewild dat je prachtige afbeeldingen kon maken met alleen je verbeelding? Dat je een foto kon genereren van iets dat nog nooit bestaan heeft, of een schilderij kon creëren in de stijl van je favoriete kunstenaar? Of je nu een pure marketeer bent of een volbloed creatieveling: je kunt het allemaal met Midjourney. Deze door ‘generative Artificial Intelligence (AI)’ aangedreven app brengt je wildste ideeën tot leven. In deze blogpost leg ik uit hoe Midjourney werkt, wat je ermee kunt doen en wat de beperkingen zijn. Maar vooral: hoe leuk en spannend het is om met deze tech te sparren en te creëren!

 

Tovenaarsleerling

Als je jouw gedachten goed kunt verwoorden, maar geen beeldkunstenaar bent, is technologie als Midjourney een openbaring. En ben je beeldtechnisch wel goed onderlegd? Dan kan Midjourney je helpen aan nieuwe invalshoeken, frisse composities of technische uitwerkingen die jouw eigen vermogens (of budget) normaliter te boven gaan. De app nodigt je uit om je innerlijke tovenaarsleerling te omarmen. Inspirerend, maar zeker ook ook heel praktisch. Wereldwijd profiteren talloze marketeers en strategen al van de voordelen die dit soort AI-driven beeldcreatie biedt. Niet langer hoeft er voor een presentatie naar dat ene hele specifieke stockbeeld te worden gezocht of uren worden nabewerkt. Wie vloeiend prompt spreekt, weet welke vraag hij moet stellen (en hoe).

 

The elephant in the room

Hoewel dit alles prachtig klinkt, lijkt de creatieve industrie tot op het bot verdeeld over de impact van dit soort technologie. Het is ook niet niks: AI-creaties winnen links en rechts wedstrijden, schenden massaal copyrights (of toch niet?) en zouden fotografen en illustratoren werkeloos maken. Midjourney, maar ook vergelijkbare apps als DALL-E en Stable Diffusion worden beticht van alles wat je kunt aanmerken op een disruptieve, maar imperfecte technologie. Het is vergelijkbaar met de manier waarop veel schilders en tekenaars midden 19e eeuw ageerden tegen de uitvinding van de fotografie. Een deel van hen zag ook de voordelen van deze technologie door hun modellen en andere referentiematerialen vast te leggen. Weer anderen voelden zich juist bevrijd van het juk om altijd maar de realiteit te moeten vastleggen, waardoor abstracte stromingen zoals het impressionisme konden ontstaan.

Ook in onze tijd zullen er disciplines verdwijnen of minder belangrijk worden, maar er komen ongetwijfeld weer andere voor in de plaats. De angst dat generative AI ‘de grote gelijkmaker’ zou zijn, lijkt mij dan ook ongegrond. Je moet immers kundig en creatief genoeg zijn om te kunnen bepalen wát je wil vragen en of de output écht voldoet aan de eigen maatstaven.

Enkele voorbeelden van met Midjourney V5 gegenereerde beelden.

Hoe werkt Midjourney?

Midjourney maakt gebruik van een geavanceerd AI-model dat getraind is op miljoenen online afbeeldingen. Het model kan nieuwe beelden maken op basis van een tekstuele omschrijving die je invoert. Je kunt bijvoorbeeld typen: “een zwart-witfoto van Steve Jobs die een concept tekent voor de Apple Watch”. Het model zal dan proberen om zo’n foto te genereren, ook al is dit beeld nooit daadwerkelijk vastgelegd (sceptici kunnen desgewenst Steve Jobs vervangen door Ghandi of Iwan de Verschrikkelijke). Je kunt eventueel meer details toevoegen aan je omschrijving, zoals kleuren, vormen, stijlen, emoties, perspectieven, enzovoort. Hoe specifieker je bent, hoe beter het model je instructies kan volgen. Het is ook mogelijk meerdere elementen te combineren in één afbeelding, zoals “Een landschap met bergen, een meer en een kasteel in de stijl van Van Gogh”. Het model zal dan proberen om deze elementen te integreren in één schilderachtige afbeelding.

Midjourney is in principe direct in je browser te gebruiken, of via de chat-app Discord. Je hebt in dat laatste geval wel een account nodig. De Discord server is ook handige tool om inspiratie op te doen. Er zijn verschillende kanalen waar je kunt kijken naar wat andere gebruikers hebben gemaakt, je creaties kunt delen en feedback kunt krijgen.

 

Ongelimiteerde creativiteit

Met Midjourney kun je je creativiteit de vrije loop laten en allerlei soorten afbeeldingen maken. Je kunt bijvoorbeeld:

  • Foto’s en illustraties maken in verschillende stijlen en genres
  • Ideeën of concepten illustreren
  • Logo’s, moodboards of zelfs complete websites ontwerpen of verbeteren
  • Variaties maken op bestaande beelden

Dit is een droge opsomming, maar de mogelijkheden zijn echt eindeloos. Dat wil zeggen: mits je weet hoe je de juiste prompt schrijft (je kunt inmiddels ‘prompt engineering’ toevoegen aan je lijst met vaardigheden op LinkedIn). Met de komst van versie 5 zijn de mogelijkheden en de kwaliteit van de gegenereerde beelden spectaculair toegenomen. Ik kwam laatst een blogpost tegen waarin iemand alle zogenaamde ‘style modifiers’ die hij kende op een rijtje had gezet, met het effect dat ze hadden op drie verschillende afbeeldingen. Het resultaat is ronduit spectaculair te noemen. Daarnaast bieden Midjourney-prompts opmerkelijke controle over fotografische beelden. Het is mogelijk om de uitkomst te beïnvloeden door bepaalde camera’s, lenzen, sluitertijden, brandafstanden en zelfs filmsoorten te benoemen.

 

Casus: kampvuursessie op kantoor

Ik was al een tijdje de mogelijkheden van Midjourney aan het verkennen toen ik een bepaald beeld nodig had dat niet in stockfotografie te vinden was. In ons vorige blog over organisatiecultuur hadden we het over (figuurlijke) kampvuursessies op kantoor. Hoe moeilijk zou het zijn om dit vervreemdende beeld te genereren met Midjourney? Uiteindelijk leverde deze prompt na enkele herhalingen onderstaand beeld op:

De prompt was: “Cinematic image of a campfire scene in the office, racially inclusive group of office workers on office chairs around a log campfire, high quality, blurry faces, symmetrical faces, beautiful composition, ultra detailed, hd, film lighting, unreal 5 render, bokeh, shot on Canon EOS, 8K –v 5.1 –ar 16:9 –s 800 –q 2”.

Technisch gezien was het dus een minuutje werk. Maar in werkelijkheid heb ik toch een paar uur geworsteld voordat ik de juiste prompt te pakken had. Je moet niet alleen weten wat je vragen wilt, maar het ook op de juiste manier verwoorden én begrijpen hoe de app de commando’s en parameters interpreteert. Alleen door het te doen, ontdek je wat de app kan en vooral wat het niet kan. Wat mij brengt bij de…

Prompts zijn precies: er zit maar één letter verschil tussen een ‘flush toilet’ en een ‘plush toilet’… 

Beperkingen

Hoewel Midjourney een indrukwekkende app is, is hij verre van perfect. Ik merkte bijvoorbeeld dat Midjourney gaat hakkelen zodra je een grote groep gezichten in je beeld wilt laten zien. Je krijgt dan te maken met rare, onnatuurlijk uitziende vervormingen. Dus moet je daarvoor compenseren door te vragen om een grotere afstand tot het onderwerp, symmetrische gezichten en vagere gelaatstrekken. Maar daar blijft het helaas niet bij. Houd rekening met de volgende beperkingen;

  • Anders dan Google neemt de app zijn input volledig letterlijk. Wil je een ‘flush toilet’, maar typ je per ongeluk ‘plush toilet’ dan krijg je toch echt een ander resultaat
  • De app heeft soms moeite met het genereren van realistische of coherente afbeeldingen, vooral als de omschrijving te complex of te vaag is. Naast de eerdergenoemde rare gezichten is de spontane extra ledemaat wellicht het meest beruchte voorbeeld
  • Door Midjourney’s eenzijdige focus op beeld is het vooralsnog onmogelijk om teksten correct weer te geven. Hoe precies je je opdracht ook verwoordt, het wordt altijd een onleesbare tekstbrij of gewoon pure onzin. Een logo of ander design met typografische elementen vraagt dus nog om veel nabewerking
  • Het model kan ook dingen verkeerd interpreteren of over het hoofd zien
  • De app werkt alleen met Engelstalige omschrijvingen. Als je een andere taal gebruikt, zal het model waarschijnlijk geen goede resultaten geven.
  • De app heeft zelf geen ethisch besef of moreel kompas. Hoewel de app tot op zekere hoogte modereert op bepaalde woorden of beelden, kan het toch ongepaste afbeeldingen genereren
  • De app is momenteel in bèta, wat betekent dat het nog niet helemaal af is en dat er bugs of fouten kunnen optreden

Het kampvuurbeeld is weliswaar in een paar seconden gerenderd, maar daar gingen uren aan experimentatie vooraf.

Conclusie

Net zoals veel andere AI-apps is Midjourney geen creatief eindstation, maar juist een gereedschap dat kan helpen om buiten de gebaande paden te denken en te experimenteren. Ook hier geldt: matige input = matige output. Investeer er dus tijd in en je zult zien dat deze app je inspireert en uitdaagt om meer te creëren. Want één ding is zeker: Artificial Intelligence is here to stay. De uitdaging voor ons allemaal, marketeer of creatief, is hoe we het gaan gebruiken.

“AI vervangt de marketeer niet. Maar marketeers die
werken met AI,
winnen het van marketeers die dat niet doen.”
– Charida Dorder

Wil je meer weten over AI en de toepassing ervan in marketing? Op donderdag 1 juni 2023 vieren we met Buro Dirigo de opening van onze nieuwe kantoor. Ik geef dan samen met mijn collega Karlijn Kerkkamp een inspirerende mini-workshop over AI als merkversterker. Van harte welkom! Meld je hier aan.

  • Buro Dirigo
  • Hendrik Figeeweg 1-U
  • 2031 BJ Haarlem
Mensen maken merken