Kunstig intelligens i akademisk skriving
Kunstig intelligens, enten det er språkmodeller eller andre former for komputering, kan ikke brukes til å skrive akademiske tekster, eller til å veilede personer som skriver dem. Den høyden vil jeg dø på, uansett hvor mange lokale studier som forteller at studentene opplever det som til dels nyttig. Men før jeg eventuelt dør, vil jeg gjerne forklare hvorfor. Så jeg vil bruke denne første bloggposten til å legge litt ut om det.
1. Akademisk skriving og evner
Akademisk skriving handler om å overbevise et fagfellesskap om at ens eget bidrag til en samtale de allerede har seg imellom, er gyldig og troverdig på de premissene akkurat det fagfellesskapet har blitt enige om. Akademisk skriving er med andre ord ikke først og fremst definert av et sett med forhåndsbestemte kriterier for disposisjon eller formuleringer. Det handler om selvforståelse, tekstens formål, og den spesifikke situasjonen og pågående samtalen mellom fagpersoner.
Dette er å forstå akademisk skriving i et retorisk perspektiv, og i tråd med den prosess- og dialogorienterte skriveveiledningen som underbygger alle skrivesentrene som har dukket opp ved universitetene de siste tiårene (akkurat som min egen bok Studieferdigheter og dens gode kompanjong Skriv og skriv begge, uten å si så mye om det, bygger på klassisk retorikk).
I boken Skriveren og teksten skriver en av de norske foregangspersonene i denne utviklingen, Ingerid Straume, at en prosessorientert skriveveileder…
…unngår enten/eller-tenkning (godt/dårlig, kan/kan ikke, korrekt/ukorrekt, osv)
…unngår å skrive om på studentens tekst, fordi dette kan svekke studentens tillit til prosessen de er i
…inntar en rolle som interessert leser, heller enn en sensor med fasitsvar
…er på utkikk etter uforløst potensiale, idéer som trenger å vokse og utvikles, fremfor å påpeke hvor teksten ikke møter eksterne krav
…forestiller seg hva teksten kan bli, heller enn å beskrive hva den er
…forestiller seg hva som ligger bak teksten, heller en det som er umiddelbart synlig
…hjelper studenten å utvikle sin personlige stil, i bruk av metaforer, humor, flertydighet, og språklig (sanselig) rytme, heller enn å lede dem inn i en streng form
…lytter etter underliggende spørsmål studenten kanskje ikke er oppmerksom på selv, fremfor å kun møte det første behovet studenten selv klarer å artikulere
…veileder i selve skriveprosessen, de vanene som er knyttet til lesing/skriving/hvile/datainnsamling, osv., heller enn å fokusere på produktet
Både det å skrive akademiske tekster, og å veilede dem som skal skrive dem, krever altså bestemte evner. Vi kan sammenfatte tre av dem slik:
For det første: akademisk skriving krever en evne til å forestille seg og forvente responser fra både kjente og ukjente fagfeller, og legge inn forbehold om disse responsene i både strukturering av teksten, ordvalg, vekting, tone, og så videre. Man må kunne se seg selv og sitt eget arbeid som fra utsiden, slik andre ser det. Med andre ord: For å mestre akademisk skriving må vi øve på evnen til å gjøre perspektivskifter.
For det andre: akademisk skriving krever at man kan forstå fagfellenes motivasjoner og intensjoner, slik at man kan redegjøre for deres tekster og bruke det i min egen tekst på en måte som representerer dem riktig. Med andre ord: For å mestre akademisk skriving må vi øve på evnen til å spekulere om bakenforliggende årsaker, eller det vi kan kalle hvorfor-tenkning.
For det tredje: akademisk skriving krever en evne til å bli oppmerksom på unntak fra regelen, og å kunne se for seg hvilke endringer man kunne gjort hvis noen av premissene for den faglige samtalen plutselig endret seg, eller hvis det oppsto nye faktorer man visste lite om fra før. Med andre ord: For å mestre akademisk skriving må vi øve på på evnen til kontrafaktisk tenkning, eller det vi kan kalle hva-om-tenkning.
2. Hjernen og nevronenes operasjoner
Disse tre evnene – perspektivskifte, hvorfor-tenkning, og hva om-tenkning – bunner i bestemte operasjoner hjerner og nervesystemer kan gjøre, og de er helt sentrale i vår utvikling som art.
For omtrent 500 millioner år siden svømte masse små organismer rundt i gørra. De drev målløst hit og dit, skumpet tilfeldig borti hverandre, og spiste eller ble spist. Omtrent på denne tiden dukker det opp noen nye aktører: Nevroner. De introduserte noe helt nytt i verden – intensjon. Og de gjorde det ved hjelp av to ulike operasjoner.
Den ene operasjonen nevronene gjorde var å registrere og lagre informasjon fra omgivelsene. De begynte å ta inn signaler fra verden rundt seg, og tolke disse som enten/eller: enten er det mat der, eller så er det ikke mat der. En annen måte å si det på er at de gjenkjente mønstre, og dannet seg inntrykk av hva som var mulig, gitt informasjonen de allerede har lagret. Når disse nevronene tok imot signaler utenfra, beregnet de en sannsynligvis korrekt respons basert på alle tidligere signaler de hadde mottatt og lagret. De gjorde det vi kan kalle komputerende operasjoner. De lagret og prosesserte input, og omsatte det til output.
Disse nevronene skulle etter hvert danne det som ble den visuelle korteksen i hjernen. Denne visuelle korteksen er som en slags komputer, en maskin som komputerer, altså som gjør logiske beregninger (enten/eller) på grunnlag av informasjon den har lagret i et minne.
Men å vite at det er mat i nærheten, eller at man er i ferd med å bli noen andres mat, det er ikke nok for å overleve. Nevronene trengte en annen type operasjon i tillegg til komputering. De trengte å kunne generere handlinger i lav-data-situasjoner. De trengte å kunne gjøre unnamanøvre som kunne overraske et rovdyr med mer informasjon om omgivelsene enn dem selv. De trengte å kunne gjøre retningsvalg i situasjoner med for lite informasjon til å gjøre velinformerte overveielser, og å eksperimentere og justere seg underveis. De trengte å kunne forvente intensjonene til andre levende organismer, inkludert de som tilhørte samme art. De trengte å kunne kombinere handlinger i nye sekvenser, slik at de kunne utvikle nye handlingsmønstre, nye måter å oppføre seg på, når de plutselig var ute av sitt vante miljø. De trengte evnen til å gjøre en slags langtidsplanlegging med kortsiktig fleksibilitet. De trengte å kunne registrere brudd med mønsteret, både egne handlingsmønstre og mønstre i omgivelsene, og aktivt forsterke disse bruddene for å skape noe uten presedens.
Disse nevronene skulle senere bli det vi kaller hjernens motoriske barkområde. I dag har de dannet nettverk som gjør at vi kan forestille oss hva som kunne ha skjedd, foregripe begivenheter før de skjer, og spekulere om underliggende årsaker til tidligere hendelser. Det er disse motoriske nevronene som er det biologiske grunnlaget for evnene vi beskrev som perspektivskifte, hvorfor-tenkning, og hva-om-tenkning.
Dette er noe helt annet enn enten/eller-logikk eller komputering av lagrede data. Motoriske nevroner venter ikke alltid på input fra omgivelsene. De kan også fyre opp forslag til handling blindt og ikke-intensjonelt og i sitt eget tempo. Denne mulige ikke-intensjonelle nerve- og hjerneaktiviteten er ekstremt nyttig i usikre, ustabile situasjoner der vi ikke har nok data til å regne oss frem til en korrekt løsning. Det gjør det mulig å prøve ut nye ting, og justere etter hvert, i omgivelser der vi mangler presedens. Dette er en type operasjoner som gjør at vi kan se for oss karakterer, i verdener, hendelser i årsaksforhold, spekulerer om fremtidig utvikling osv. Derfor mener noen forskere at operasjonene de gjør minner mer om fortellinger enn om komputering, og kaller dem narrative operasjoner.
500 millioner år senere gjør fremdeles nevroner begge disse to typene operasjoner. Den ene typen (narrative) gjør at vi kan forestille oss andres perspektiv og motivasjon, spekulere om årsaker til hvorfor noe har hendt, eller gjette hva som kunne ha skjedd hvis noe i verden var annerledes. Den andre (komputerende) gjør at vi kan gjenkjenne mønstre, lagre informasjon fra omgivelsene, og beregne sannsynligvis korrekte løsninger ved hjelp av logiske resonnementer.
3. “Kunstig intelligens” vs. ekte nevroner
Så langt har jeg sagt at akademisk skriving ikke handler om forhåndsbestemte kriterier, men om tre helt sentrale evner, som er perspektivskifte, hvorfor-tenkning (årsakstenkning), og hva-om-tenkning (kontrafaktisk tenkning). Så har jeg knyttet alle disse tre evnene til én av operasjonene som nevronene i kroppen gjør, nemlig det vi kalte narrative operasjoner – som jeg satte i kontrast til det vi kan kalle komputerende operasjoner. Nevroner gjør begge deler.
Hva så med såkalt “kunstig intelligens” eller “KI”? Er vi nå snart ved et veiskille der også KI kan gjøre begge typer operasjoner? Ut fra begeistringen i medier og ledermøter skulle man nesten tro det.
Begrepet kunstig intelligens stammer fra midt i forrige århundre. Da visste man ikke så mye om hjernens ulike operasjoner. Man trodde hjernen var en ren informasjonsprosessor, og definerte begrepet intelligens deretter.
En typisk intelligenstest fra den tiden ville derfor teste hjernens evne til å prosessere lagret informasjon ved hjelp av logiske enten/eller-beregninger. Som eksempel kan vi se på denne oppgaven:
Under streken her har vi rekker med nummererte, meningsløse symboler. Det representerer data vi allerede har lagret. Over streken er et “prompt”, en serie symboler som sammen danner et mønster. Oppgaven består i å gjenkjenne mønsteret, og finne det eller de lagrede symbolene som med størst sannsynlighet samsvarer med mønsteret i promptet. Dette er et klassisk eksempel på logisk komputering. Symbolene har ikke noe meningsinnhold. Det er ren mønstergjenkjenning, sannsynlighetsberegninger, og logisk enten/eller-beregning av eksisterende data.
Dette er forøvrig et greit bilde på hva en KI-språkmodell gjør. Forskjellen er at i chatbot-grensesnittet bruker vi symboler som for oss er gjenkjennelige som meningsfulle bokstaver og setninger. Men for språkmodellen er ikke symbolene meningsfulle. De bare følger hverandre i mer eller mindre sannsynlige serier, beregnet ut fra de eksemplene som allerede er lagret. (Forestillingen om “prompt engineering”, hvis det betyr at chatboten skal kunne forstå beskjeder om hvordan den skal oppføre seg eller løse oppgaver hvis man bare prompter den på riktig måte, er selvbedrag på grensen til det uforsvarlige).
I dag vet vi at denne typen komputerende operasjoner kun er én av typene operasjoner hjernen gjør. Men den gangen, for nesten hundre år siden, trodde man at hjernen kun gjorde dette. At alt det andre den gjorde var å regne som støy, utrykk for en begrenset evne til å lagre data, eller svake analyseevner. Så når man klarte å lage maskiner som gjorde komputerende operasjoner bedre enn mennesker, så begynte man å snakke om at man var i ferd med å skape kunstige hjerner, kunstige intelligenser, som langt overgikk menneskenes kapasitet.
Det er absolutt tilfelle at datamaskiner, inkludert KI, kan utføre én type operasjoner hjernen gjør, mye bedre enn hjernen. De kan lagre mye mer informasjon, og mye mer presist og avansert prosessere den med logiske regneregler (enten/eller), enn noen hjerne. De kan gjenkjenne mye mer avanserte mønstre, i mye større datasett. De kan ikke bare etterligne, men langt overgå, den ene typen operasjoner som nevroner gjør (det skal også nevnes at hjernen er utrolig svak til akkurat dette. Å huske masse løsrevet informasjon, eller tenke logiske enten/eller-beregninger, er veldig krevende, og ikke noe hjernen er konstruert for å gjøre. Den er kort og godt ikke utviklet primært for det).
Men at maskiner kan være fabelaktige til å komputere betyr ikke at de kan etterligne nevroner som sådan. Nevroner gjør både komputerende og narrative operasjoner; komputerende maskiner gjør kun komputering. Og de kan ikke bruke komputerende operasjoner til å gjøre ting som krever narrative operasjoner.
Dette er det mange som synes er unødvendig påståelig. Er det ikke bedre å være litt åpen for at noe er mulig, selv om det ikke finnes akkurat nå? Undervurderer jeg ikke nå hvor komplekst og avansert KI faktisk har blitt, og hvor fort utviklingen går? Hva om komputerende maskiner også kunne utføre narrative operasjoner hvis de bare hadde lagret mer data og ble bedre til å prosessere dem? Hva om man ikke egentlig trenger narrative operasjoner, hvis man bare har enda mer komputering? HAR JEG PRØVD SELV???!!
Vel, det vennligste jeg kan si er at muligheten for at mer komputerende operasjoner skal kunne føre til narrative operasjoner er så liten at det er ansvarsløst å ta høyde for den. Det ville være som å innrømme at jorda muligens likevel er flat – en påstand så direkte i strid med alle kjente naturlover at den ikke er verdt å ta alvorlig. Det er ikke “nyansert”, det er magisk tenkning og sekterisk mirakel-svada. Dette handler ikke om kompleksitet, men om at nevroner og maskiner er laget av forskjellig materiale, og har ulike energikilder. Dette ligger til grunn for hva de kan gjøre.
Alle komputerende maskiner, inkludert de vi kaller kunstig intelligens, har transistorer som sender elektroniske signaler på felles strømkrets. Det er derfor de må ha så enorme eksterne energikilder, og må avkjøles hele tiden. De elektriske signalene er enten/eller, av eller på. Nevroner, derimot, er totalt selvdrevne. Hvert enkelt nevron har sin egen mitokondriske energigenerator, noe som setter dem fri til å lage spontane koblinger med andre nevroner hvor som helst i hjernen, uavhengig av hverandre, uten noe mønster, også på steder der de ikke har vært før. De er også analoge, sammenlignet med transistorenes binære av/på-bryter.
Koblingene mellom nevroner, som kalles synapser, er ikke elektroniske, men fysiske. De har en bestemt retning. Dette er det biologiske grunnlaget for at vi kan tenke på lange årsaksrekker der en handling eller hendelse fører til en ny handling eller hendelse. Koblingene i synapsene er på en måte som en pil, mens en elektronisk transistorkobling er som et likhetstegn. Nevroner kan tenke i tid, mens komputering kun opererer med en tidløs logikk.
En annen måte å si dette på er at komputering kun kan si noe om korrelasjon, men ingenting om årsaksforhold. Komputering kan si at temperaturen i lufta rundt oss er 25 grader samtidig som gradestokken viser 25 grader, men vi trenger narrative operasjoner for å forstå hvilken av dem som fører til den andre. Når det høres helt rart ut for oss at en komputer ikke kan vite om gradestokken setter temperaturen eller omvendt, er det fordi vi tenker og føler med nevroner som kan gjøre begge typer operasjoner. Transistorer kan kun gjøre én av dem.
Disse forskjellene betyr at det er villedende å snakke om «nevrale nettverk» i maskiner. Hvis maskiner faktisk skulle være bygget på en måte som ligner et organisk nervenettverk, ville det bety at hver eneste lille del av hver minste microchip måtte ha sin egen organiske energigenerator som gjorde at den kunne operere uavhengig av alle de andre, spontant bryte mønstre uten input, og oppleve seg selv som i levende bevegelse mellom fortid og fremtid.
Den materielle forskjellen mellom nevroner og transistorer er grunnlaget for forskjellen i operasjonene de er i stand til å gjøre. Det betyr at uansett hvor mye data, uansett hvor mye lagringskapasitet, uansett hvor mye prosesseringskraft en stor språkmodell eller en annen komputerende maskin har, så vil det aldri kunne kompensere for den kvalitative forskjellen mellom narrative operasjoner og komputerende operasjoner.
KI og akademisk skriving/skriveveiledning
I lys av hvordan komputeringsmaskiner fungerer sammenlignet med nevroner, må vi erkjenne at KI ikke har eller noen gang kan utvikle noen av de tre grunnleggende evnene som kreves for å skrive akademiske tekster eller veilede noen som skriver dem. Perspektivskifter, årsakstenkning og kontrafaktisk tenkning krever narrative operasjoner, og komputering kommer ikke i nærheten en gang.
Hvis vi likevel insisterer på å bruke “KI” enten til å skrive akademiske tekster, eller til å veilede skrivere, så vil det være et brutalt og ugjenkallelig brudd med det prosessorienterte perspektivet de fleste skrivesentere og studieverksteder i dag er bygget opp på. Da må vi forkaste perspektivet der tilegnelse av ferdigheter gjennom utprøving og justering i møte med konkrete og unike lesere og situasjoner er det sentrale. Her har skriveverkstedene (kanskje uforvarende) gått i motsatt retning enn resten av utdanningssystemet. De er små lommer der individuelle prosesser og ferdighetsutvikling fremdeles prioriteres over generiske og ferdige produkter. Det ville være en tragedie å ofre dette på et så dustete alter.
Komputerende skrivemaskiner er kun relevante og nyttige hvis akademisk skriving handler om at det ferdige produktet må møte et sett med forhåndsbestemte og universelle kriterier om struktur, formuleringer, osv. Det ville bety å prioritere produktet over prosessen, og målbar kvantitet over studentens gryende selvforståelse. Det ville være å prioritere tekstens korrekte overflate over studentens latente faglige stemme. Det ville gjøre det ikke bare umulig å unngå at tekster blir skrevet utelukkende av chatbot’er - det ville gjøre det helt meningsløst å tolke dette som et problem. For hvis det ferdige produktet er viktigere å evaluere enn prosessen, så spiller det til syvende og sist ingen rolle hvordan produktet blir til.
Man kan heller ikke erstatte en liten del av prosessen med en chatbot. Den kan ikke være dialogpartner, sparringpartner, idémyldrer, eller noe slikt. Å bruke chatboter til noe nesten ethvert annet menneske ville være bedre rustet til, er til syvende og sist et symptom på underbemanning i utdanningssektoren. Det er ikke “effektivisering”, det er kapitulasjon.
At chatboter kan bestå eksamener forteller oss mer om eksamener enn om chatboter. Det er ikke overraskende at det kan skje, hvis utdanningssystemet er mest fokusert på ferdige produkter - eksamensbesvarelser, standardiserte tester, rubrikker, portprøver, ferdige tekster. Hvis vi tester komputeringsevner (evne til å huske informasjon, analysere med enten/eller-beregning, og avgi svar i “korrekt” format i henhold til en standardisert sensorveiledning), så vil alltid komputeringsmaskiner overgå våre evner. Her representerer implementeringen av KI i utdanning en hodeløs maksimering av det største problemet vi allerede har: et overdrevent fokus på standardisert testing av komputeringsevner.
Det samme gjelder når forskere bruker chatbot’er til å skrive standardiserte tekster som skal gjennom publiseringsnåløyet. I slike tilfeller er det største problemet at vi har et publiseringssystem der vi premierer tekster som møter overfladiske formelle kriterier, uavhengig av om de har reell effekt på en pågående samtale blant forskere. Som i utdanningssystemet, både avslører og forsterker implementeringen av “KI” et allerede eksisterende problem: overfloden av formelt “korrekte” tekster uten virkning.
Poenget med å i det hele tatt sette studenter til å gjøre akademisk skriving er at de skal prøve seg frem for utvikle sin egen stemme som fagperson, øve på å se for seg responser fra fagfellesskapet, og ta forbehold om disse i struktur, formuleringer og metaforer, ta imot tilbakemelding fra interesserte lesere for å se sin egen tekst fra deres (begrensede, subjektive) perspektiv, og kontinuerlig justere sin egen skrivepraksis i forhold til disse skiftende og alltid situasjonsbestemte og unike rammevilkårene.
Poenget med prosessorientert skriveveiledning er at skriveveilederen skal bistå i prosessen ved å gå inn i en rolle som interessert kollega, forestille seg hva teksten kan bli, dyrke frem studentens selvrefleksjon og bevissthet på egen faglig identitet, være oppmerksom på underliggende spørsmål studenten har men ikke ennå kan artikulere, og være på utkikk etter uforløst potensiale.
Bak den brukervennlige fronten til KI-chatboter foregår det fremdeles bare prosessering av lagrede data med logiske enten/eller-beregninger. Slike logiske beregninger kan ikke registrere kontekstavhengig meningsinnhold, og langt mindre vurdere innholdets relevans til en samtale som pågår ute i verden. De kan ikke se for seg den fremtidige responsen til spesifikke kolleger, eller justere struktur og formuleringer etter det disse kan tenkes å misforstå i teksten. Den kan ikke registrere eller spekulere om mulige bakenforliggende årsaker eller motiver, kan ikke forestille seg andres perspektiv, kan ikke finne på nye metaforer, eller tilpasse formuleringer for å overbevise kolleger som har sine egne subjektive kjepphester, blindflekker eller særinteresser.
Ergo: Maskiner som komputerer kan ikke skrive akademiske tekster. Og de kan ikke være prosessorienterte skriveveiledere.