Påbegynd eksperimentet med tekst-til-billede generatorer på Skoletube

13. august 2023
I den billedgenerative-journal finder du ideer til aktiviteter, som du kan bruge i skolearbejdet.
fluorescerende kamera

(OBS. Indlægget er ved at gennemgå en længere bearbejdning. Formentlig færdigt i slutningen af maj-måned)

Her skribles noter ned, her gemmer jeg de sjove og finurlige prompts og leger med motiver og tekniske specifikationer. Dette er ikke et slutprodukt, men en trådstarter, hvor jeg løbende tilføjer og redigerer…

Jeg har ikke fokus på at skabe super lækre billeder, men på at udvikle elevernes foto- og billedkunstsprog samt udviklingen af en mere fleksible strategibrug i mødet mellem ønske, opgave og den billedgenerative AI.

Jeg bruger Padlets billedgenerative AI, da den er tilgængelig på Skoletube. Midjourney og Stable diffusion giver brugeren flere valgmuligheder i prompting-processen. Og de yder foto- og billedkunstens sprog mere betydning i promptet, men de er desværre ikke tilgængelige i grundskolen. Det handler derfor om at få det bedste ud af det værktøj vi immervæk har at arbejde med.

Undervisningsforløb i billedgenerativ AI. Fem aktiviteter som du kan lave i morgen.

Billedgenerator AI på Skoletube

Padlet er den del af Skoletubes programpakke. Padlet har tilføjet en billedgenerativ kunstig intelligens og derfor har du og eleverne nu mulighed for at skabe billeder med AI i skoletiden.

I skal blot finde og bruge: “Jeg kan ikke tegne”-funktionen, når I laver en fælles Padlet.

Vejledning til Padlet AI

Vejledning til at finde den billedgenerative AI i Padlet

Nu kan eleven skrive en forespørgsel (læs: prompt) og Padlets AI vil herefter generere fire forskellige billeder, der på hver sin måde afspejler promptet mere eller mindre godt. .

Skaberne af Padlet beskriver selv funktionen således:

“When you write a prompt, we send it through an additional AI to augment it with even more creativity. You don’t even have to worry about writing an interesting sentence. It will also automatically provide multiple stylistic options for every prompt. You don’t need to know if you want an expressive oil painting or a playful cartoon. You can just choose what looks best (Padlet.blog)”.

I modsætning til Midjourney og andre mere avancerede prompting-værktøjer, så stiller Padlets AI ikke så høje krav til promptingen. Det kan både betragtes som et plus og et minus.

Positivt

Negativt

(1) Eleverne kan let skabe et fint motiv og dermed et lykketræf.

(2) Eleverne kan fokusere på selve motivet og stadig for et varieret stilistisk udtryk.

(3) Low floor.

(1) Skabelsen af billedet er i høj grad fjernstyret og fratager promptet betydning for skabelsen.

(2) Manglende incitament til at dyrke den sproglige nuancering.

(3) Manglende ‘high celling’.

 

Heldigvis vil stilistiske og mere tekniske specifikationer stadig påvirke billedskabelsen. Det betyder fx at hvis eleven skriver “i stil med et oliemaleri”, så vil de fleste eller alle fire billeder delvist eller helt imitere et billede, som er skabt med oliemaling. Billedskabelsen er dermed ikke så fjernstyret, at dele af eller hele prompting-teksten er uden betydning for billede-outputet, men det er i høj grad op til en fælles undersøgelse, hvad, hvordan og i hvor høj grad, at man kan påvirke billedskabelsen med sit prompt.

Jeg kender ikke Padlets tekst-til-billede AI

Med nogle få guidelines og lidt viden om prompting, så kan du hurtigt igangsætte aktiviteter med eleverne. Det kan være aktiviteter som supplere eller udvider et undervisningsforløb og det kan være aktiviteter, som direkte peger på tekst-til-billede AI som en teknologi. Du vil finde forslag til begge aktivitetstyper i blogindlægget, men lad os først få styr på basisfagligheden i billede-prompting. Med lidt stikord og en god prompting-struktur, kan du nemlig stilladsere elevernes billede-produktion, så de opnår langt bedre resultater og ikke fortaber sig i mislykkede prompting-forsøg. Med de få guidelines, kan I virkelig gå på opdagelse sammen og skabe mere frit.

Du skal blot vide lidt om:

(1) Vide lidt om hvordan man kommunikere sin hensigt (prompt-struktur)

(2) Vide lidt om det sprog, som kan bruges til at beskrive et motiv og hvordan det er blevet frembragt (prompt-stikord). Hvis du allerede er billedkunstlære eller har en dybere interesse i billedskabende kunstarter, så vil mange af begreberne være velkendte.

(3) Bruge tekst-til-billede AI på en måde, som faktisk lader jer få et meningsfuldt output i relation til en faglig opdagelsesrejse.

Den findes ikke en entydig skabelon for den gode prompt-struktur

Men vi kan liste en række kategorier, som ofte vil være repræsenteret i et godt prompt. Med din ide og dit ønske vil du derfra handler det om intuition, fornemmelse for sammenhænge og samspil og evnen til at udvælge den helt rette kombination af kategorier og stikord.  Det er i høj grad iterativt. Men vi kan lave et katalog over de kategorier, som du og eleverne kan jonglere med.

Det skal samtidig bemærkes, at et typisk tekst-til-billede prompt er væsentligt kortere end tekst-til-tekst prompts. Et godt prompt bruger desuden få nøgleord (tænk Google-søgning) snarere end fuldstændige sætninger. Du vil desuden placere det vigtigste i starten af promptet, da det vægtes højere end det, der skrives længere henne i promptet.

Men jeg skriver da mega lange prompts til ChatGPT! Ja, det kan du snildt. Det er forbi, der er en model, der omskriver dit prompt, før det bruges af Dall-E. Det vil forkorte og udvælge nøgleordene for dig. Open AIs platform er altså en undtagelse fra reglen.

Emnet er den centrale idé bag billedet. Du kan referere til subjekter, objekter, landskaber sågar abstrakte begreber og gøre det til det centrale element i billedet. Kunsten er samtidig at tilføje et par stikord som indfanger substantielle detaljer ved dit subjekt, som ligesom farve hele persona.

Mediet, der blev brugt til at levere kunstværket. Mediet har en stærk effekt, fordi et enkelt nøgleord alene kan ændre stilen dramatisk. Nogle eksempler kan være illustration, oliemaleri, 3D-rendering, fotografering, filmisk skud osv. I den ovennævnte demonstration brugte vi mediet “fotografi”.

Den kunstneriske stil, som du ønsker at fange, for eksempel impressionistisk, surrealistisk, gotisk, art deco osv. I den ovennævnte demonstration brugte vi stilen “hyperrealistisk”. Bemærk, at vi også kan nævne flere stilarter i prompts og eksperimentere med at blande og matche forskellige stilarter. Du kan også referere direkte til en kunstner, fx ‘i stil med Andy Warhol’.

Belysning og farvepalet er vigtige aspekter af ethvert kunstværk, som kan specificeres ved hjælp af fraser som surrealistisk belysning, mørk belysning, dæmpet farvepalet, levende, mættet osv.

Yderligere detaljer såsom navne på kameraer, navne på renderingsteknikker, renderingsmotorer og opløsning kan også inkluderes afhængigt af kunstnerens vision.

 

De følgende aktivitetsforslag gør undervisningen til en fælles afsøgning af den nye teknologi. Du og aktiviteterne skaber rammerne, mens i sammen opbygger jeres forståelse gennem afprøvningen af og refleksionen over den kunstige intelligens.

 

(1) Undersøg forholdet mellem prompt og billede

For at mestre brugen af en kunstig intelligens, skal man lære dens biases at kende, man skal i nogen eller høj grad mestrer foto- og billedkunstens sprog og så skal man kende til prompting-genren og være fleksibel i sine strategivalg.

Enhver kunstig intelligens er lidt sin egen og dens model af verden er unik. På den måde minder det også om at lære et nyt menneske at kende.

Selve promptingen er oftest en iterativ proces, hvor man vil afprøve forskellige begreber og deres synonymer, flytte rundt på indholdet, nedtone eller optone, tilføje eller fjerne tekst-elementer i forsøget på at skabe det billede, som man ønsker.

Det er derfor vigtigt, at have et skarpt blik for (1) Hvor der er overensstemmelse mellem prompt og billede? (2) Hvor der står noget i promptet, som ikke fremgår af billedet? (3) Hvor der er indlejret noget i billedet, som ikke er skrevet ind i promptet?

Det er denne analyse som kan danne grundlag for de redaktionelle overvejelser og omskrivninger af promptet.

GØR:

(1) Skriv et prompt og skab et billede.

(2) sammenlign promptet med billedet og tilføj stikord om motivet, stilistiske træk og tekniske specifikationer i en af de tre analytiske kategorier.

(3) Beskriv hvordan billedet “faktisk” burde se ud, hvis det var i overensstemmelse med promptet.

(4) Forsøg evt. at tilnærme jer den faktiske intention med promptet gennem gen-prompting.

De tre analytiske kategorier, som åbner for samtalen om forholdet mellem prompting-teksten og billedet.

 

Find aktiviteten i undervisningsmaterialet – Billedgenerativ AI – 5 aktiviteter

 

(2) Samle og kombiner – det store syntetiseringseksperiment

Kunstnere har altid indsamlet og ladet sig inspirere af forskellige ideer og sammensat dem i nye konstellationer. Der er selvfølgelig mere til kreativitet end at sætte ideer og teknikker sammen på nye måder, men det er en væsentlig del af skabelsesprocessen.

De nye diffusionsmodeller som Midjourney, Dall-E og Stable Diffusion er som skabt til at kombinere og samle de mest forskelligartede ideer og konceptualisere det i billeder. Du kan derfor eksperimentere med alskens billedsprog og begreber i det hele taget og skaber nye motiver.

GØR:

(1) Udvælg et begrebsligt fokus. Se fx prompting oversigten. Du kan fx syntetisere abstrakte begreber, såsom retfærdighed, fordomme og undertrykkelse. Gad vide hvordan et billede ser ud, når det er under hensyntagen til alle tre begreber?

(2) Du har valgt et billedsprogligt fokus. Eleverne skal nu prompte billeder. Kan eleverne genfinde begreberne i motivet? Er begreberne repræsenteret i lyset, farverne, den artistiske stil, i motivet, i handlingerne, i miljøet? Dominerer et af begreberne? Kan motivet rumme alle begreberne på en kohærent måde? Er det en god repræsentation af begreberne?

(3) Lad eleverne dele deres fund med andre grupper, fx gennem en gætteleg. Deres billeder kan samtidig bruges i en multimodal produktion eller som et stillads til undersøgelsen af billedsproget.

Promptingen er ikke bare sådan lige. For at kunne prompte fleksibelt og målrettet må eleverne 1. Kende til billedsproget og hvordan det konkret udtrykker sig. 2. Have klare ønsker og mål for deres prompting. 3. Det må være muligt at lykkes nogenlunde med projektet. Test derfor altid din ide først.

Her følger et eksempel med cykel-designs inspireret af frugter

 

Eller eksperimenter med materialer, fx kan du skabe ting i forskellige danske stentyper.

Sandsten (sandstone), flintsten (flint), kalksten (limestone), amfibolit (amphibolite), knejs (gneiss), kvartsit (quartzite), granit (granite), basalt (basalt), porfyr (porphyry)

“made out of”

 

I kan fx opbygge begrebskort til de prompting-kategorier i vil arbejde med…

 

 

(3) Har vi et match?

Hvordan vælge mellem de seks forskellige motiver, som Padlets kunstige intelligenser har skabt ud fra promptet?

En mulighed kunne være at finde og udvælge det motiv, som stemmer bedst overens med vores prompting-tekst. Efterlever billedet teksten?

Eleverne kan selvfølgelig opdage, at et helt andet billede er mere interessant og stemmer bedre overens med deres intention. Men det sætter vi parentes om i denne aktivitet.

GØR:

(1) Skriv et prompt med flere specifikationer.

(2) Lav en grovsortering og udvælg de 2-3 bedste billeder.

(3) Har vi et match eller skal vi arbejde videre med promptet? (brug evt. skemaet fra opg. 1)

Garfield. Nu som frøen Garfield.

 

Observation: Padlets AI har svært ved at skelne mellem forskellige kategorier af specifikationer. Den vil ofte blande dem sammen eller dobbeltgøre det.

I prompting-teksten er “frø” indlejret i “frøperspektiv”. Begrebet tilhører kategorien ‘kameraviklingen’. I billede 6 er “frøperspektiv” blevet til et ‘frø’-motiv. Det sker ofte at begrebet dobbeltgøres og AI ikke skelner mellem kategorierne, her ‘motiv-beskrivelsen’ og ‘kameravinklingen’.

Eksempel 2: Fx skulle mine elever prompte en “hotdog” på en hvid t-shirt. Resultatet var at der ofte både indgik en hotdog (nærmere bestemt en ristet hotdog) og en hund i motivet.

En ristet hotdog og en hot dog.

 

(4) Kan vi nærme os vores intention? – Lad os udvikle nogle fleksible strategier

Nu flere strategier eleverne kan vælge i mellem, nu større mulighed for succes. Når eleverne ydermere har dannet sig et intuitivt eller ekspliciteret forhold til hvad der er muligt/ikke-muligt at prompte sig til med den respektive billedgenerative K.I.

Med denne aktivitet afprøver i forskellige strategier til at skabe et match mellem intention og det billedgenerative motiv. Der skal altså ikke nødvendigvis være overensstemmelse mellem prompt og billede, men mellem intention og billede. På sin vis handler det om at finde de små tips og tricks, når man prompter. Genvejene til det ønskede billede.

Lad os se på seks strategier og se om de kan hjælpe os med vores Garfield-throw up på ladeporten:

  1. Flyt rundt på leddene – “Frøperspektiv, Graffiti throw up af Garfield på ladeport, aftenlys”.
  2. Skift et eller flere ord ud (som ikke har den ønskede effekt) – “Graffiti Piece af Garfield på ladeport, frøperspektiv, aftenlys”.
  3. Hver nuanceret og konkret i motivbeskrivelsen – “Graffiti throw up på ladeport sf sulten Garfield på sofa, frøperspektiv, aftenlys”.
  4. Brug (flere) billedtekniske specifikationer – “Graffiti throw up på ladeport af sulten Garfield i varm orange tone med sorte striber, 2D-tegnestil, frøperspektiv, aftenlys”.
  5. Lån bias fra en kendt stilart eller kunstner – “Graffiti throw up på ladeport af Garfield i tegneseriestilen fra Jim Davis, frøperspektiv, aftenlys”.
  6. Write the prompt in English – “Graffiti throw up of Garfield the cat on barn door, evening light”.

Strategi 1

Flyt rundt på leddene

Strategi 2

Skift et eller flere ord ud

Strategi 3

Hver konkret og nuanceret

Strategi 4

Billedtekniske specifikationer

Strategi 5

Lån fra kunstner eller stilart

Strategi 6

Write the prompt in English

 

Observation: Det er en kunst, at beskrive billedet med få ord. Billedgenerativ AIs er generelt dårlige til at håndtere længere beskrivelser. Se fx billede 3. I fagligt sprog forholder AI sig til få Tokens – betegnelsen for en tekstlig enhed, som AI bruger til at forstå promptet. Det hjælper derfor ikke at skrive alenlange specifikationer. Tværtimod. Man skal ligesom opspore de få gyldne udtryk, som bærer alle ens mere konkrete ønsker med sig. Og så må den foreløbige konklusion være, at det billedgenerative AI ikke mestrer Jim Davis Garfield-tegnestil.

DEL 2: Kunsten, at udvikle en strategi, kræver at man almengøre noget konkret i en operationel regel. Det er en øvelse, som man kan gøre med eleverne. Nu er det dem der skal almengøre deres tips og tricks, så deres klassekammerater eller andre børn, unge eller voksne kan bruge disse tips og tricks til at skabe billeder, som matcher deres intention.

Eleverne kan lave en manual i alskens medier og modaliteter. Fx som et blogindlæg på Studiesites eller som en video med Screencast Skoletube.dk

 

(5) Ekspressionisme – Kort kunsthistorie nu med AI

De fleste kender Fru Billedkunst. Hun laver nogle fantastiske forløb til billedkunstfaget. Intet mindre. De følgende aktiviteter er tænkt som en (AI)-udvidelse til hendes serie af forløb – kort kunsthistorie 1-13. Fru Billedkunst forløb er tiltænkt undervisningen i en bestemt kunst- eller stilperiode.

Fru Billedkunsts introduktionshæfter kan købes separat på BubbleMinds for 29 kr. per stk. I de følgende aktivitetsforslag støtter jeg mig til – Kort kunsthistorie 8 Fauvisme og ekspressionisme.

For at kunne efterligne en stilart har man brug for at kende stilartens ‘stikord’. Disse stikord kan enten være meget specifikke eller mere almene og de kan knytte sig til forskellige elementer i billedet og billedskabelsen. Hvis man prompter med mere almene begreber eller kunstnernavne, så overgiver man samtidig de mere konkrete motivbeskrivelser til den kunstige intelligens.

Observation: Der vil formentlig være et dyr i motivet, hvis du skriver “i stil med Franz Marc“, fordi han er kendt for sine dyremotiver. Det mere almene begreb (her kunstnernavn) kommer altså med en bestemt konkret bias, som ofte vil være afstemt med kunstnerens typiske farvevalg, motivvalg, penselstrøg etc. Det er selvfølgelig kun tilfældet, hvis den kunstige intelligens er trænet på nok “Franz Marc”-billeder til at kunne forbinde navnet med en kunstnerisk stil. Fx vil du ikke kunne lave denne opgave med Storm P. Padlets AI har ikke noget begreb om kunstneren. Test derfor først om Padlets AI har et begreb om kunstneren.

Prompting-kunsten består derfor bl.a. i at få den kunstige intelligens til at bevare/bruge de elementer fra kunstnerens æske af motiv- og stilistiske valg, som du gerne vil benytte. Og samtidig udskifte et eller flere af disse træk, alt efter hvad du ønsker at skabe. Som du kan se af nedenstående eksempel, vil biasen og dit “nye” input blande sig på intrikat vis.

Den kunstige intelligens skaber typiske Franz Marc dyremotiver.

 

Det Franz-Marc-typiske dyremotiv er stadig fremherskende i flere af billederne, selvom jeg har valgt et et andet motiv.

 

Fx vil det mest almene begreb simpelthen være ekspressionisme.

En anden strategi er at henvise til bestemte kunstnere, som i særlig grad identificeres med en bestemt stilretning. Det kunne være Kirchner, Edvard Munch eller Franz Marc.

(2) Lav en serie af billeder. Nogle er faktisk billeder fra kunstperioden, mens andre er AI-skabte. Kan parallelklassen eller andre kategorisere dem korrekt?

 

Indlægget fortsættes løbende…

(6) Tidsrejsen i billeder – teknikker fra de gode gamle dage

De gamle kameraer, værktøjer, teknikker er længe forsvundet fra skolen og bliver kun brugt og husket af de få, hvis de da overhovedet stadig er i anvendelse. Men de er ikke helt bortgemt, for de gemmer sig i tags og metabeskrivelser af de billeder, som den kunstige intelligens er trænet på. På en måde er de blevet vækket til live igen. Vi skaber dog ikke med dem for det de var, håndelag og teknik. Nej, vi prompter med dem og lader den generative AI skabe med de tegn, som den har sporet på hvordan en skabelse ville se ud med de værtkøjer, teknikker og remedier. De er altså kommet halvt til live, som noget vi kan lade en kunstig intelligens kan skabe med…

Fx brug af printeteknikker, som blev brugt i den givne periode. Undersøge remedier, medie, printteknikker osv., for at kunne skabe et billede, sådan som det så ud i det gode gamle dage…

 

(7) Søg og find-billeder

I skal i gang med et nyt emne eller I skal samle op på et emne. Du har udvalgt nogle begreber. De kan både være konkrete og abstrakte og kan være inden for forskellige kategorier. Eleverne skal nu gætte, hvilke begreber som er indlejret i billedet. De skal selvfølgelig ræsonnere med jeres forløb.

Giv evt. hints, fx kan du fortælle hvilken kategorier, som begreberne er inden for og hvor mange de skal finde.