Kunstig intelligens
Vil la KI sensurere eksamen
En KI-modell skal vurdere eksamensbesvarelser ved Universitetet i Oslo. Man skal være forsiktig med å ta den for god fisk, mener student.
– Det er skremmende hvis KI kan ha makten til å stryke noen.
Det sier statsvitenskapstudent Theodor Bredal-Thorsen (24). Ved Universitetet i Oslo (UiO) er et nytt forskningsprosjekt i gang med å finne ut om kunstig intelligens (KI) kan reprodusere karakterene som menneskelige sensorer satte på eksamen i Anvendt statistikk i statsvitenskap høsten 2025.
Bredal-Thorsen er blant dem som har gitt tillatelse til at hans gamle eksamensbesvarelse inngår i prosjektet.
Mindre bias
Prosjektet kommer i kjølvannet av at regjeringens utvalg for bruk av kunstig intelligens i høyere utdanning, Malthe-Sørenssen-utvalget, før jul anbefalte at universiteter og høyskoler bør teste KI-modeller til eksamensvurderinger
Bredal-Thorsen stiller seg som utgangspunkt positiv til at KI tas i bruk som beslutningsstøtte i eksamenssensuren, men frykter at man som sensor kan komme til å lene seg for mye på KI-modellens vurdering:
– Man skal være forsiktig med å ta den for god fisk.
Motsatt er man alltid overlatt til sensors tilfeldigheter og biaser dersom man ikke bruker KI, mener han.
– En datamaskin har kanskje færre tilbøyeligheter enn et menneske – hvis man tror på det.
Blir ikke påvirket av sult
Statsvitenskapsstudenten får støtte av lederen av prosjektet og førsteamanuensis ved ISV, Håvard Strand. Han mener at KI i sensurarbeidet kan øke kvaliteten på den samlede sensurprosessen.
«KI kan være mer objektiv og mindre påvirket av forskjellen mellom sensorer, forskjellen mellom hvor i bunken man ligger og forskjellen mellom før og etter lunsj», skriver Strand i en e-post til Universitas.
– Hvordan sikrer dere at KI ikke systematisk favoriserer bestemte skrivemåter? Med tanke på studenter som svarer kreativt eller utradisjonelt.
«Fra egen praksis som sensor så vet jeg jo at jeg lar meg påvirke av språk. Før var det også et spørsmål om håndskrift, det har vi heldigvis lagt bak oss. Hvis vi skal bruke KI som sensor, må vi ha solid forskning i bunn, og her må mange ulike stemmer fra ulike miljøer bidra for å få fram et bredt bilde».
Begrenset bruksområde
Førsteamanuensis ved Høgskolen i Østfold, Kristin Hagemann, har tidligere uttalt seg kritisk om fraværet av språkvitere og humanister i Malthe-Sørenssen-utvalget. Hun frykter at vi risikerer å overse språkets kobling til kritisk tenkning og kunnskapsutvikling dersom vi lener oss for mye på KI. Det gjelder også bruken av KI til sensurering:
«Det vi gjør sjeldent blir vi dårlige til. Jeg bekymrer meg for at vi ikke er klar over hva vi mister når vi outsourcer deler av aktiviteten vår, og at vi dermed ikke kan overskue konsekvensene det kan få», skriver hun i en e-post til Universitas.
Hun poengterer at sensuren av et fag som anvendt statistikk nok er bedre egnet til KI-støtte enn en eksamen som innebærer lengre tekstsvar.
Bredal-Thorsen er enig i at prosjektet har valgt riktig emne å teste KI-sensur på.
– Eksamen har ganske skjematiske oppgaver og sensuren blir fort matematisk, mener han.
Prosjektleder Strand forklarer at de vil bruke KI til å sette karakterer på hver deloppgave og så gå inn og se nøye på de deloppgavene der det er stort avvik.
«Fra tidligere forskning er det grunn til å tro at KI kommer til å gi færre topp- og bunnkarakterer. I vår sammenheng er det da interessant å se hvilke oppgaver KI ikke greier å gi full uttelling for», innvender Strand.
Begrenset av loven
Beslutningsprosessen ved UiO rundt bruk av KI i undervisning er på nåværende tidspunkt begrenset av Universitets- og høgskoleloven §11-7, som forbyr automatisert sensur.
Strand avviser derfor at det er snakk om å overlate sensurarbeidet fullstendig til KI, men at man kan forestille seg at det i fremtiden åpnes for nye eksamenshybrider der KI i større grad tar seg av sensuren av standardiserte oppgaver, og menneskelige sensorer vurderer svar som krever større tolkningsrom.
– Kan du forestille deg at dere tar i bruk KI i sensur av eksamener som krever lengre tekstsvar i besvarelsene?
«Absolutt», svarer han.
Alternative former for testing
Det er imidlertid viktig at man ikke låser seg i en bestemt oppfatning av hva eksamen er, påpeker Strand. Han trekker frem et tenkt scenarie der KI spiller rollen som eksaminand, og studenten som sensor som skal vurdere KI-modellens prestasjon. Her er det studentens evne til å stille relevante oppfølgingsspørsmål som gir uttelling. Til slutt vil studenten få karakter av en menneskelig sensor.
Han mener at bruken av KI i sensur kan gjøre at nye måter å tenke på blir mer realistiske.
KI kan frigjøre ressurser til undervisningsaktiviteter der læring faktisk skjer
«Det overordnede målet med prosjektet er mer og bedre læring. KI kan frigjøre ressurser til undervisningsaktiviteter der læring faktisk skjer».
UiOs forskningprosjekt skal gjøre bruk av UiO GPT, en modell levert av det amerikanske selskapet OpenAI. Strand understreker at eksamensbesvarelser er å anse som gule data i personvernøyemed, og at besvarelsene ikke vil kunne brukes til trening av OpenAIs modeller generelt.