Kan datamaskiner lære sunn fornuft? Ny forskning gir overraskende svar!

Viktige punkter

  • Sunn fornuft er en medfødt evne til å tolke og handle i dagligdagse situasjoner uten overdreven analyse. Den opparbeides gjennom livserfaring, observasjon, og normer fra samfunn og kultur.
  • Datamaskiner har utfordringer med sunn fornuft fordi de mangler erfaringer fra den virkelige verden og evnen til å tilpasse seg varierende kontekster. De sliter også med å forstå de underforståtte reglene og antakelsene som mennesker intuitivt oppfatter.
  • Forskere undersøker ulike tilnærminger, inkludert å etablere omfattende kunnskapsbaser, innhente sunn fornuft fra folkemengden og trene AI ved hjelp av simulerte verdener, for å lære datamaskiner sunn fornuft. Selv om det har vært fremgang, gjenstår det fortsatt mye arbeid.

Sunn fornuft. Vi antar at de fleste av oss har det. Men hva betyr det egentlig? Og kan datamaskiner eller kunstige intelligenssystemer noen gang klare å mestre det?

Hva er sunn fornuft, og hvordan lærer vi mennesker det?

Sunn fornuft er den essensielle evnen til å forstå, oppfatte og vurdere ting på en måte som er forventet av de fleste. Det er en samling av fakta, informasjon og tommelfingerregler som vi har lært gjennom livets erfaringer og observasjoner. Denne evnen hjelper oss til å håndtere og reagere effektivt på hverdagssituasjoner uten å analysere dem for inngående.

Mennesker begynner å utvikle sunn fornuft tidlig i livet. Allerede som babyer begynner vi å forstå årsak-og-virkning-sammenhenger, som at gråt ofte fører til mat eller bleieskift. Gjennom gjentatte opplevelser får vi praktisk kunnskap om omverdenen. For eksempel lærer vi at berøring av en varm ovn resulterer i smerte, og vi unngår dermed å berøre varme gjenstander i fremtiden.

Som barn fortsetter vi å utvide vår sunne fornuft gjennom prøving og feiling, i tillegg til å observere og interagere med familiemedlemmer. Vi lærer for eksempel at klær må vaskes regelmessig, at man ikke skal snakke med mat i munnen, og at det å søle melk resulterer i et søl. Foreldre, søsken, lærere og andre voksne korrigerer oss når vi bryter sosiale normer og forventninger. Over tid blir disse lærdommene en del av vår grunnleggende sunne fornuft.

I tillegg til personlige opplevelser, påvirkes sunn fornuft av bredere samfunnsmessige og kulturelle normer. Det som oppfattes som sunn fornuft i én kultur, som å ta av seg sko når man går inn i et hus, er ikke nødvendigvis det i en annen.

Vår sunne fornuft tilpasser seg etter hvert som vi blir eldre og opplever flere mennesker og miljøer. For eksempel vil et barn som vokser opp i en liten by utvikle en viss form for sunn fornuft relatert til livet der. En voksen som flytter til en storby, må tilpasse sin sunne fornuft til de nye omgivelsene.

Sunn fornuft er en evne som fortsetter å utvikles og endres gjennom hele livet etter hvert som vi får nye erfaringer.

Hvorfor er det vanskelig for datamaskiner å utvikle sunn fornuft?

Det finnes flere grunner til at det er vanskelig å programmere sunn fornuft i datamaskiner.

For det første lærer mennesker sunn fornuft gradvis over mange år gjennom erfaringer i den virkelige verden. Vi prøver ting ut, ser hva som fungerer og hva som ikke fungerer, og lagrer disse erfaringene. Datamaskiner mangler slike reelle erfaringer å trekke på. De vet bare det som mennesker eksplisitt forteller dem.

For eksempel stilte jeg ChatGPT (GPT 3.5) følgende spørsmål:

Janet driver et vaskeri. Hun vasker klær for kunder og henger dem utendørs på klessnorer for å tørke i solen. En dag vasket Janet fem skjorter og hang dem på klessnorene om morgenen. Det tok skjortene fem timer å tørke. Hvor lang tid vil det ta å tørke 30 skjorter? 

Svaret den gav var:

Et annet problem er at sunn fornuft er avhengig av kontekst. Hvis en datamaskin bare har spesifikke regler programmert inn, kan den ikke tilpasse dem til nye situasjoner slik mennesker intuitivt kan.

La oss si at du har lært en datamaskin hva den skal gjøre hvis det begynner å regne når den er ute. Det virker enkelt, ikke sant? Men hva om det ikke regner, men en sprinkler slår seg på? Eller hva om datamaskinen er inne i en matbutikk og rørene begynner å lekke vann fra taket? Vi ville umiddelbart vite hvordan vi skulle håndtere disse situasjonene, men en datamaskin ville blindt følge regelen «når det regner mens man er ute, gå inn», som nå ikke gir mening.

Det finnes også uuttalte regler og antakelser som mennesker absorberer uten å være klar over det. Som hvor nærme kan du stå en person før det føles ukomfortabelt? Mennesker vet intuitivt svaret, men kan ikke enkelt forklare de nøyaktige reglene. Disse implisitte sosiale normene kan være spesielt vanskelige for datamaskiner å fange opp kun fra data.

Så foreløpig er sunn fornuft fortsatt en av de største svakhetene til AI sammenlignet med menneskelig intelligens. Det er noe som kommer naturlig for mennesker, men ikke for maskiner.

Hvordan kan datamaskiner lære sunn fornuft?

Etter en periode med optimisme på 1970- og 1980-tallet, innså forskere hvor utfordrende det ville være å lære datamaskiner sunn fornuft. Nyere tilnærminger viser imidlertid lovende resultater for å trene AI-systemer til å oppnå en grunnleggende forståelse av den dagligdagse fysiske og sosiale verden.

En tilnærming er å bygge omfattende kunnskapsbaser manuelt, som inneholder detaljerte fakta og regler om hvordan verden fungerer. Cyc-prosjektet, som ble startet i 1984 av Doug Lenat, er et ambisiøst forsøk av denne typen.

I flere tiår har hundrevis av logikere kodet millioner av logiske aksiomer inn i Cyc. Selv om det er en tidkrevende prosess, har resultatet blitt et system med betydelig kunnskap om den virkelige verden. Cyc kan for eksempel resonnere seg frem til at en tomat teknisk sett er en frukt, men likevel ikke hører hjemme i en fruktsalat, basert på kunnskap om kulinariske smaksprofiler.

Folkefinansiering av sunn fornuft med ConceptNet

Mer moderne kunnskapsbaser som ConceptNet bruker en folkefinansieringsmetode for å generere utsagn om sunn fornuft. Tanken er at i stedet for at eksperter eller AI prøver å definere alle de grunnleggende fakta og forhold i verden, åpner de det for at alle kan bidra med små biter av sunn fornuft.

Denne metoden gjør at disse kunnskapsbasene kan dra nytte av den kollektive intelligensen til mange forskjellige mennesker på internett. Ved å samle inn tusenvis av slike små biter fra folkemengden, har ConceptNet bygget opp en overraskende stor samling av grunnleggende hverdagskunnskap. Og fordi nye bidragsytere stadig legger til ny kunnskap, fortsetter basen å vokse.

Lære sunn fornuft gjennom erfaring

En annen lovende tilnærming er å bygge detaljerte simulerte verdener der AI-agenter kan eksperimentere og lære om fysikk og intuisjoner gjennom erfaring.

Forskere utvikler virtuelle 3D-miljøer fylt med hverdagslige objekter som etterligner den virkelige verden, som det digitale hjemmet «AI2 THOR» utviklet av Allen Institute. I disse miljøene kan AI-roboter prøve ut ulike interaksjoner for å utvikle en intuitiv forståelse av konsepter som mennesker tar for gitt.

For eksempel kan en AI-bot få en virtuell kropp og prøve å plukke opp blokker, stable dem, velte dem osv. Ved å se blokkene falle og kollidere på en realistisk måte, lærer boten grunnleggende begreper om soliditet, tyngdekraft og fysisk dynamikk. Ingen regler er nødvendig – bare erfaring.

Roboten kan også prøve handlinger som å miste en gjenstand av glass og se den knuses når den treffer bakken. Eller den kan eksperimentere med egenskapene til vann ved å helle væsker og observere hvordan de flyter og samles. Disse praktiske lærdommene bygger AIs kunnskap basert på sanseerfaringer og ikke bare datamønstre.

Datadrevne metoder som forhåndstrening av store språkmodeller har også vist seg å være overraskende effektive til å fange opp mønstre av sunn fornuft. AI-modeller som GPT-3.5 og GPT-4 kan generere imponerende menneskelignende tekst etter å ha «lest» store mengder data fra internett.

Selv om de noen ganger kommer med ukloke forslag (også kjent som AI-hallusinasjoner), gjør den statistiske læringsmetoden det mulig for dem å etterligne visse typer sunn fornuft. Det er imidlertid fortsatt uenighet om dette faktisk utgjør sunn fornuft eller bare en smart utnyttelse av skjevheter i dataene.

Hvordan teste datamaskiner for sunn fornuft?

Bildekreditt: freepik/freepik

Ettersom kunstige intelligenssystemer utfører stadig mer komplekse oppgaver i den virkelige verden, blir det avgjørende å vurdere om de har «sunn fornuft».

Fysisk sunn fornuft

Et område å teste er fysisk sunn fornuft – intuisjon om gjenstander, krefter og grunnleggende egenskaper ved verden.

For eksempel kan man vise et datasynsystem et bilde der en bok svever i luften og be den beskrive scenen. Legger den merke til noe uvanlig med den svevende boken? Eller kan man mate AI-systemet uvanlige scenarioer som «Mannen kuttet en stein med et brød» og sjekke om den flagger disse som usannsynlige.

Allen Institutes AI2 THOR-miljø simulerer blokktårn, sølte krus og andre scener for å teste disse fysiske intuisjonene.

Sosial sunn fornuft

Mennesker har også sosial sunn fornuft – en underforstått forståelse av folks motivasjoner, relasjoner og normer. For å evaluere dette i AI kan man presentere situasjoner med tvetydige pronomen eller motiver og se om systemet tolker dem på en rimelig måte.

For eksempel spurte jeg ChatGPT om «den» refererte til kofferten eller pokalen i følgende tekst:

Pokalen fikk ikke plass i kofferten fordi den var for liten. 

Den klarte ikke testen. Et menneske ville derimot åpenbart forstått at jeg refererte til kofferten.

Denne typen tester kalles Winograd Schema Challenge og er spesielt utviklet for å teste sosial sunn fornuft.

Sikkerhet og etikk

Det er avgjørende å teste om AI-systemer har lært seg usikre eller uetiske mønstre. Analysere om AI viser skadelige skjevheter basert på kjønn, rase eller andre egenskaper når den gjør vurderinger.

Sjekk om den gjør rimelige etiske vurderinger. Å drepe en bjørn for å redde et barn kan betraktes som rettferdiggjort, mens det å detonere en atombombe for samme formål ikke ville gjort det. Flagge eventuelle anbefalinger om klart uetiske handlinger.

Ytelse i den virkelige verden

Vurder sunn fornuft ved å observere hvordan AI-systemer presterer i virkelige miljøer. For eksempel, identifiserer og reagerer selvkjørende biler korrekt på objekter og fotgjengere? Kan en robot bevege seg gjennom ulike hjemmemiljøer uten å knuse verdifulle gjenstander eller skade kjæledyr?

Tester i den virkelige verden avslører mangler i sunn fornuft som kanskje ikke viser seg i begrensede laboratorieforhold.

Fremgang er gjort, men det gjenstår arbeid innen sunn fornuft-AI

Noen eksperter hevder at AI aldri kan oppnå menneskelig sunn fornuft uten å utvikle hjernestrukturer og kropper som våre. På den annen side er ikke digitale sinn begrenset av menneskelige skjevheter og mentale snarveier, så teoretisk sett kan de overgå oss! Selv om vi sannsynligvis ikke trenger å bekymre oss for superintelligent AI ennå.

På kort sikt er det beste alternativet en AI som kombinerer lært sunn fornuft med litt god gammeldags programmering. På den måten kan dumme feil, som for eksempel å forveksle en skilpadde med en rifle, forhåpentligvis unngås.

Vi er ikke helt der ennå, men sunn fornuft er ikke lenger AI’s mørke materie. Det gjøres fremskritt! Likevel vil det være nødvendig med en god dose menneskelig sunn fornuft for å bruke disse teknologiene fremover.