Aum Golly & Aum Golly2
Jukka Aalho, GPT-3, ChatGPT
Basam Books 2021, Kertojan ääni 2023
72 s.
Illustratör: Midjourney
Konetta kokemassa
Kaksi tekijää, kaksi teosta, kaksi kriitikkoa, kaksi kritiikkiä. Jukka Aalho on kirjoituttanut tekoälyllä runoteokset Aum Golly ja Aum Golly². Teemu Korpijärvi pohtii kritiikissään yllätysten mahdollisuutta, Tuuli Hongisto puolestaan tarkentaa tekijyyden kysymyksiin.
Tekoälyn runoja kuin ihmisen kynästä
Keinotekoinen äly ja tietoisuus ovat ikivanhoja teemoja ihmiskunnan legendoissa, ja ne läpäisevät hyvän osan modernista tieteiskirjallisuudesta. Ajatus kiehtoo meitä ehkä ennen kaikkea siksi, ettemme kykene vieläkään täysin selittämään omaa tietoisuuttamme, sen syntyä ja luomisvoimaa. Käytännöllisen tekoälyn riskeistä ja mahdollisuuksista on puhuttu 2000-luvun ensimmäisillä vuosikymmenillä paljon, mutta keskustelu on useimmiten keskittynyt sen mahdollisiin vaikutuksiin turvallisuuden, talouden ja yksilönvapauksien kentillä. Viime vuosina keskusteluun on kuitenkin tullut mukaan myös tekoälygeneraattoreiden avulla synnytetty taide eri muodoissaan. Aihetta on käsitelty esimerkiksi William Gibsonin Idorussa (Viking 1996) ja Sami Tissarin Krysassa (Aula & Co 2022). Idorussa taidetta tekee synteettinen persoona, tekoälypoppari Rei Toei. Krysassa taas esiintyvät krysat, ainoastaan tietoverkossa ja tilastoissa elävät keinoihmiset, joilla on sisäsyntyinen tarve luomiseen.
Siinä missä Gibsonin Rei Toei on varsin kehittynyt tekoäly, luova ja itsenäinen toimija, Tissarin krysat muistuttavat enemmän jo olemassa olevia malleja, kuten Aum Gollyen luomisessa käytettyjä ChatGPT- ja Midjourney-generaattoreita. Rei Toein tietoisuutta voi arvuutella, krysat on ohjelmoitu ajattelemaan, että ne ovat ihmisiä, kun taas Jukka Aalhon käyttämät generaattorit ovat edelleen selvästi tiedon haalijoita ja järjestäjiä ihmisen asettamien ehtojen puitteissa. Aalhon ”kirjoittajakumppani” GPT-3 kertoo olevansa ”tekoäly, joka luotiin automatisoimaan prosessi, jota ihmiset hoitivat ennen” (s. 7). Voi kuitenkin perustellusti kysyä, missä määrin tämä luonnehdinta pitää paikkansa.
Aum Golly ja Aum Golly² herättävät kysymyksiä tekoälyn mahdollisuuksista runouden horisonttien laajentamiseksi. Ne ovat menetelmällistä runoutta, joka hyödyntää modernin teknologian mahdollisuuksia ja spekulatiivisen fiktion elementtejä. Ennen kaikkea ne ovat ihmisen dialogia omien tuotostensa kanssa.
Kaikki runous rakentuu jonkin aiemman – kirjoittajan kokemusmaailman ja aiemman runouden – pohjalle, mutta voiko runoilijan pelkistää tekstin raaka-aineen kokoajaksi ja järjestäjäksi? Kun GPT-3 laatii annettujen parametrien puitteissa runoja tai Midjourney kuvia, kyse on eräänlaisesta keskiarvoistamisesta, josta uupuu inhimillisen luovuuden kipinä. Silloin tällöin teksteissä on havaittavissa virkistävää epätasaisuutta, mutta lopulta luova prosessi kaventuu tausta-aineiston määrään, sen keräämiseen ja järjestämiseen. Yksi ensimmäisen kirjan runoista, joka vetosi minuun, kuuluu näin: ”tämä yksinkertainen runo ihmisyydestä sai minut kyyneliin // minä olen yösydän / tähtien lapsi / auringon kuiskaus // valon ilo / minä olen / tuulentuivertaman kuun kasvot” (s. 60). Lihavoitu säe on generaattorille tarjottu syöte. Kiinnostavaa runossa on tapa, jolla GPT-3 on syötteen tulkinnut. Itseäni runo ei liikuttanut kyyneliin, mutta sen elementit ovat esteettisiä ja kiehtovia.
GPT-3 ei tee mitään todella itsekseen. Itse asiassa se olisi ajatuksenakin mullistava. Ihminen asettaa syötteen ja parametrit, järjestää tuloksen säkeiksi ja valikoi, mitä julkaistaan. Kiinnostavaa onkin pohtia, mitä on jätetty ulkopuolelle, painamatta. Helpoin rinnastus Aum Gollyille löytyy näin ollen menetelmällisestä kirjallisuudesta ja runoudesta. Ehkäpä jossakin tulevaisuudessa runoilijan tehtävänä on mielenkiintoisten ja yllättävien syötteiden keksiminen ja stilisointi poeettiseen asuun?
Aum Golly ja Aum Golly² eroavat toisistaan muutamilla tavoilla. Ensimmäinen kokoelma on generoitu 24 tunnissa ja jälkimmäinen 12:ssa. Molemmat on jaettu kolmeen osaan. Varsinaisten runojen syötteissä ei ole merkittäviä eroja, ja sisällöllisesti kumpikin kertoo käsittelevänsä ihmisyyttä. Ensimmäisen kokoelman kaikki osat rakentuvat inhimillisille tunteille: onnellisuudelle, rakastettuna olemiselle ja merkityksellisyyden kokemukselle. Toisen kokoelman kaksi ensimmäistä osaa käsittelevät ihmisyyden kokemusta sekä rakkauden haasteita ja voittoa, kun taas kolmas tarkastelee ehkä hiukan teemasta sivuun astuen luonnon kauneutta ja voimaa.
Aum Golly²:n on kuvittanut Midjourney-kuvageneraattori, ja ainakin arvostelukappaleen mukana tuli yksilöity runo ja siihen kytkeytyvä kuva. Kuvituksen generointiin on käytetty kulloistakin runoa. Generaattori-puhuja pyrkii ikään kuin järjestelemään sitä, mitä ihminen itse on aiemmin lausunut noista aiheista.
Aallon kehittämä metodi runouden luomiselle tekoälyavusteisesti on kiinnostava ja herättää kysymyksiä tällaisen metodirunouden mahdollisuuksista tulevaisuudessa, mutta se on ennen kaikkea metodi – tekoäly ei ole itsenäinen toimija. Kiinnostavaa onkin se, kykeneekö tekoäly kokoamisen ja järjestämisen lisäksi jossain vaiheessa synnyttämään jotakin uutta ja yllättävää. Runokokoelmat jättävät kaipaamaan jotain, mikä murtaa inhimillisten kirjoittajien jo käyttämiä kielikuvia, vertauksia ja rakenteita ja synnyttää uskottavan illuusion jostakin ennennäkemättömästä ja edelleen julkaisemisen arvoisesta.
Teemu Korpijärvi
Synteettinen pannukakku
Aum Golly ja Aum Golly² ovat runokokoelmia, joiden keskeisenä markkinointivalttina on kanssakirjoittajana toimiva laaja kielimalli GPT. Tästä kielivät alaotsikot ”tekoälyn runoja ihmisyydestä” – ideana on selvästi herättää kiinnostusta kielimallin kykyihin. Laajat kielimallit ovat ohjelmia, jotka voivat muokata, tuottaa, tiivistää ja kääntää tekstiä. Niiden toiminta pohjautuu neuroverkkoihin, jotka treenataan suurella määrällä dataa, josta ne tunnistavat lainalaisuuksia ja todennäköisyyksiä. Koska tekijyys on näin suuressa roolissa, sitä täytyy tarkastella perusteellisemmin. Kenen ja minkä tuotoksia Aum Gollyt oikeastaan ovat?
Runokokoelmissa Jukka Aalhon ja kielimallin yhteistyö tehdään läpinäkyväksi alkusanoissa. Aalho vastaa kielimallille annettavista kehotteista, joko antamalla sille runon ensimmäisen säkeen tai kuvailemalla, millaisen runon hän toivoo kielimallin tuottavan. Lisäksi hän on muokannut runojen asettelua, säejakoa sekä välimerkkejä. Kielimallin rooli on tuottaa tekstiä kehotteiden perusteella. Kehotteiden lihavointi on läpi teoksen jatkuva typografinen muistutus osapuolten työnjaosta. Aalhon panos säejakoon ja välimerkkien muokkaamiseen jää sen sijaan näkymättömiin.
Mitä tulee itse runoihin, yhteistyö ei ole tuottanut erityisen kiinnostavaa tulosta. Aalho vaikuttaa lähestyneen runoteoksen tekoa testailuperiaatteella. Kehotteet vaihtelevat laidasta laitaan. Aum Golly²:ssa Aalho pyytää kielimallia esimerkiksi kirjoittamaan ”jotain modernin proosarunouden kaltaista”, ”luontorunoja, jotka näyttävät hyvältä jääkaappimagneetissa” sekä ”naurunkippuroita aiheuttavan onelainerin ihmisyyden kokemuksesta”. Joidenkin kehotteiden kanssa onnistaa paremmin kuin toisten, ja ajoittain runoissa on hauskoja ja oivaltavia hetkiä. Kokonaisuutena molemmat teokset ovat kuitenkin epäkiinnostavalla tavalla hajanaisia. Kehotteet poukkoilevat tunnelmasta ja teemasta toiseen, mutta tuloksena on tähän nähden tyyliltään ehkä yllättävänkin latteita säkeitä ja puhkikuluneita kielikuvia.
Ihmisen ja ohjelman yhteistyön ei tarvitsisi johtaa tällaisiin tuloksiin. Ohjelmaa kanssakirjoittajana voisi hyödyntää menetelmällisesti siten, että saadaan aikaan yllättäviä assosiaatioita hieman samaan tapaan kuin lehtileikkeistä kootuissa Tristan Tzaran dadarunoissa. Näin toimii yksi varhainen konetuotettu kaunokirjallinen teksti, Theo Lutzin Stochastische Texte (1959), jossa järjestellään Kafkan Linnan sanastoa runomuotoon. Verrattuna tähän ja moniin muihin aikaisempiin runogeneraattoreihin laaja kielimalli kanssakirjoittajana tuottaa haasteita, koska sen toiminta perustuu todennäköisyyksiin – yllättävyyden tai omaperäisyyden tavoittelu voi olla vaativaa, kun ohjelma pyrkii mahdollisimman konventionaaliseen kielenkäyttöön sekä imitoimaan (ja väitetysti jopa plagioimaan[1]) lähdemateriaaliaan.
Konetuotetussa runoudessa on leikitelty tekijyydellä esimerkiksi kutsumalla lukija osaksi teosta, kierrättämällä ja muokkaamalla runogeneraattoreiden lähdekoodia ja hyödyntämällä digitaalisia alustoja generoitaessa loppumattomia runoja. Keskeistä on se, että kiinnostavaa konetuotettua kirjallisuutta syntyy, kun ensisijaisena päämääränä on taideteoksen luominen, ei ohjelman ominaisuuksien testailu. Tässä Aum Golly -teoksilla olisi parantamisen varaa.
Tekijyyttä pohtiessa on mahdotonta olla tuomatta esiin, ettei Aalho suinkaan ole ainoa ihminen, jonka panoksella on vaikutusta kokoelman sisältöön. GPT-3:n takana on OpenAI, jonka joka portaalla tehtävät päätökset vaikuttavat ohjelman toimintaan. GPT-3:a on harjoitettu valtavalla määrällä tekstejä, joiden kirjoittajat ovat osallisia siinä, millaista tekstiä malli tuottaa. Sama periaate koskee Aum Golly²:n kuvittanutta Midjourney-ohjelmaa. Midjourney-yrityksen perustaja on auliisti myöntänyt ohjelman käyttäneen yli sataa miljoonaa kuvaa luvatta ohjelman treenaamiseen, ilman että kuvien alkuperäisillä tekijöillä on mahdollisuutta jättäytyä pois prosessista[2]. Tämä on luonnollisesti aiheuttanut vastustusta kuvittajien parissa ja tekee Aum Golly²:n kuvien tunnelmoinnin ainakin itselleni eettisesti hankalaksi. Aiempien teosten hyödyntäminen ja yhdistely on aina ollut osa taiteen tekemistä, mutta kun kuvaan astuvat suuryhtiöt, joilla on valtaa vaikuttaa kokonaisten ammattikuntien työllistymiseen, puhutaan jo varsin erilaisista realiteeteista.
Aum Golly², s. 61.
Ensimmäisen Aum Gollyn ilmestyessä 2021 kielimallit eivät olleet vielä suurimittaisesti saatavilla. Tuolloin ”tekoälyn runot ihmisyydestä” olivat kiinnostavia kielimallien toimintaan tutustumisen näkökulmasta. Vuonna 2023 tilanne on jo erilainen. On suhteellisen helppoa testata itse runojen tuottamista esimerkiksi ChatGPT:n avulla sen sijaan, että lukisi läpi jonkun toisen kokeiluja. Koska nimenomaan ”tekoäly” kanssakirjoittajana on teosten keskeinen valttikortti, ChatGPT:n suosio ja laaja saatavuus murentavat teosten houkuttavuutta. Näin ei välttämättä olisi, jos teoksissa olisi muutoin tarpeeksi kiinnostavaa sisältöä.
Tuuli Hongisto
1 Lee, Le, Chen & Lee 2023. Do Language Models Plagiarize? WWW ’23. Proceedings of the ACM Web Conference 2023. Austin: ACM.
2 Rob Salkowitz 2022. Midjourney Founder David Holz On The Impact Of AI On Art, Imagination And The Creative Economy. Forbes 16.9.2022.
Teemu Korpijärvi & Tuuli Hongisto
Teemu Korpijärvi on helsinkiläinen kirjoittaja ja kriitikko, joka etsii tarinoita ja päätyy silloin tällöin arvostelemaan runoutta. Tuuli Hongisto on helsinkiläinen väitöskirjatutkija, joka tutkii konetuotettujen tekstien tekijyyttä ja lukijuutta.