Manual til prompting af tekst-til-billede-AI
Undervisningsforløb i billedgenerativ AI. Fem aktiviteter som du kan lave i morgen.
Hvordan ville et kattemotiv egentlig se ud i en impressionistisk stilart?
Med generativ AI er vejen, fra spirende ide til visuelt bud, blevet kort. Vi kan stadig besøge bøger, værker, fantasien, dialogen, pensler og Google, for at visualisere vores ideer. Men det nye er at vi også kan også lade en tekst-til-billede-generator skabe et billede.
Et godt sted at starte er på Skoletube. Vi kan fx benytte Padlets tekst-til-billede-generator. Find “Jeg kan ikke tegne-funktionen” og skriv hvad du gerne vil visualisere. Dit prompt kan være helt kort, faktisk er et enkelt bogstav nok. Et godt sted at starte er dog med et subjekt eller objekt. Fx “hund/dog”. Her kan de yngste også være med.
Subjektet/emnet er den centrale idé bag billedet. Kunsten er samtidig, at tilføje et par stikord, der indfanger substantielle karakteristika ved subjektet. Hvad er det særegne ved dit subjekt? Er det noget ved udseendet, den måde den bevæger sig på? Det den gør?
Uden substantielle stikord får du det mest generiske bud. Hvis du fx har promptet “hund”, så vil det formentlig være en golden retriever, der fredfyldt kigger ind i kameraet eller løber afsted med tungen ude af munden på en solskinsdag. Med generisk menes typisk. Formentlig er der et hav af billeder af golden retrievers, som er blevet portrætteret med netop den beskæring, i det lys, med den baggrund og stemning, sådan cirka. Billeder der er blevet delt på nettet og blevet tagget “Golden retriever, running on grass”.
OBS. Padlets AI har foruddefineret stilarter og filtre. Hvis du skriver meget korte prompts, vil de fire billeder, som du får lavet, derfor have forskellige udtryk og være med forskellige hunde. Det giver en lille modvægt til det generiske.
Skaberne af Padlet beskriver selv funktionen således:
“When you write a prompt, we send it through an additional AI to augment it with even more creativity. You don’t even have to worry about writing an interesting sentence. It will also automatically provide multiple stylistic options for every prompt. You don’t need to know if you want an expressive oil painting or a playful cartoon. You can just choose what looks best (Padlet.blog)”.
Hvad er egentlig den mest “generiske hunderace”? Lav en test med klassen, hvor alle skriver “hund eller dog” og i samler resultaterne statistisk. Test først deres intuition – hvilke hunderaver er mest typiske? Samle derefter resultaterne statistisk.
De gode kategorier og stikord er kendetegnet ved at være rige på unik visuel guidning. Tænk fx på impressionismen. Begrebet ‘impressionisme’ samler ligesom en klynge af visuel betydning, der både alluderer bestemte motivvalg, teknikker, farvevalg etc. Det er derfor et godt ord at prompte med. Impressionistiske malere brugte fx typisk korte og tykke penselstrøg, hvad der skaber et særegent udtryk.
OBS. Dengang maskinen (læs diffusionsmodellen) blev trænet, var det på billeder med alt-tags. Alt-tagget er den beskrivelse, som folk tilføjer billeder, når de uploader dem på deres hjemmeside. Et Alt-tags vigtigste funktion har været at hjælpe søgemaskinerne med at kategorisere billeder. I dag spiller Alt-tagget også en rolle i generativ AI. Diffusionsmodellen har nemlig lært om forholdet mellem skriftligt sprog og visuelt udtryk gennem alt-tags. Nu kan du sikkert allerede se udfordringerne. Ord bliver brugt forkert, lemfældigt, nogle ord bruges aldrig, andre rigtig meget. Samtidig er modellerne i sig selv ikke perfekte. Du kan derfor ikke forvente, at skriftsproget vil føre til det helt rigtige visuelle udtryk. Det er den del af eksperimentet, at lære hvordan modellen visualisere vores billedsprog. Alle modeller har lidt deres egen stil og forståelse.
Du og eleverne er det kritiske human-in-the-loop, der skal have et etableret fagligt ståsted. Kun derigennem kan I evaluere tekst-til-billede-generatoren og undersøge om den overholder normerne for fx et impressionistisk maleri eller hvorvidt den overhovedet sætter ordene i spil.
Mediet og materialet har stor effekt på det visuelle udtryk. Det er dog ikke altid, at modellen ved at bruge begrebet eller vægter det særlig højt. Men prøv nu selv. Ændre mediet til et polaroid foto eller prøv en gammel trykketeknik, såsom heliografi.
Hvis resultatet ikke bliver som ønsket, så tilføj flere beskrivende ord, Tænk på det som en varieret gentagelse. Et “polaroid photo” kan suppleres med ord som “vintage”, “nostalgic”, “white frame”, “soft and warm colors”. Dermed har du skabt en klynge af ord, som knytter sig til ‘polaroid fotoet. Når du peger med fem fingre i stedet for en, så øger du sandsynligheden for at maskinen finder vej til det visuelle udtryk, som du stiler efter.
Der er gode og mindre gode diffusionsmodeller. Jamen den ikoniske hvide rammer om polaroid fotoet er jo blevet til en hvid billedramme. Åh ja. Mange ord er flertydige. Kendetegnet ved mindre gode diffusionsmodeller er at flertydigheden forvirrer maskinen. Den blander tingene uharmonisk og uelegant eller stiller tingene op ved siden uden at integrere dem på en realistisk måde. Se fx cyklen med et ananas-design.
De bedre modeller, særligt Midjourney, er bedre til at harmonisere og syntetisere, så de fire fingre der peger klart på et samlet visuelt udtryk trækker det flertydige eller lidt outreret med sig.
Det eksemplariske eksempel: Hvis du og klassen vil eksperimentere med kameratyper, kameraindstillinger, særlige trykketeknikker eller malingstyper, så hav gerne et “eksemplarisk billede” med, som I kan sammenligne med. Tal om hvordan medie og materialer påvirker det visuelle udtryk. Det er jeres grundlag for at forstå hvilken effekt, som I søger at præge maskinen med og jeres grundlag for at evaluere resultatet. Derigennem lærer i også maskinen at kende, som en model, der mere eller mindre godt, kan omsætte givne stikord til bestemte udtryk.
Belysning og farvepalet er vigtige aspekter af ethvert kunstværk, som kan specificeres ved hjælp af stikord. Fotokunsten har en særlig tæt tilknytning til belysningen. Tænk på det gode portrætfoto. Her gør den professionelle kameramand altid meget ud af objektiver, tripods (stativer), reflektorer, blitz, lysstativer og evt. filtre og fjernudløsere. I kategorierne belysning og samt medie og materialer finder du mange af disse teknikker gengivet i stikord.
Hvis i derimod vil skabe kunstværker af mere malerisk art, så indeholder særligt farve- samt stilart og kunstnerisk epoke-kategorierne relevante stikord, der låner af kunsthåndværket.
Dansk eller engelsk – eller både/og?
Det er en afvejning. Padlets AI er bedst på engelsk, men kan også omsætte stikord på dansk. Jeg fortrækker at prompte på engelsk, da den formentlig maskinoversætter dansk til engelsk. I denne oversættelse kan stikordene undergå forandring qua oversættelsen, så begrebet ikke helt matcher intentionen. Alternativet kan du mixe det op. Fx skriver jeg ofte de engelske ord i parentes. Det fungerer overraskende godt.
Fik du allerede en ide til en aktivitet med Padlets AI? Fedt, fyr den af. Du kan også supplere og få flere ideer med Tankespirerne. DOWNLOAD BOOKLET.