ChatGPT Kodetolk: Gjør AI til en ekte assistent!

ChatGPT har virkelig tatt verden med storm, og imponert mange med sin evne til å samtale på en måte som minner om mennesker. Men selv om den er svært kraftig, har den sine begrensninger. ChatGPT kan finne løsninger på kompliserte problemer, men den kan ikke selv sette disse løsningene ut i praksis. Code Interpreter er OpenAIs forsøk på å transformere ChatGPT fra en ren idégenerator til en AI-agent som selv kan implementere ideer for å løse problemer.

Denne nye funksjonaliteten har store konsekvenser. Her er det du bør vite om ChatGPTs kodetolk og hvorfor den er så viktig.

Hva er egentlig ChatGPTs kodetolk?

Kjernen i Code Interpreter er et sikkert Python-programmeringsmiljø inne i ChatGPT. Her kan du utføre et bredt spekter av oppgaver ved å kjøre Python-kode. Dessverre blir denne funksjonen ofte oversett eller misforstått, nettopp fordi den er knyttet til koding og programmering. Selv om den kalles «Code Interpreter» og bruker programmeringsspråket Python for å utføre oppgaver, er den ikke eksklusiv for de med programmeringskunnskaper. Noe programmeringskompetanse kan hjelpe deg med å utnytte funksjonen bedre, men du trenger ingen kodeerfaring for å bruke den.

For å forstå hva kodetolk-funksjonen gjør, kan det være nyttig å se på det fra et operasjonelt synspunkt.

Før kodetolk-funksjonen og andre ChatGPT-plugins ble introdusert, måtte problemene du ønsket at ChatGPT skulle løse, være av en art der løsningen kunne uttrykkes i tekst. Ville du at ChatGPT skulle forklare hva generativ AI er? Det kan løses ved å generere tekst. Hva med å bruke ChatGPT til å oversette en tekst til et annet språk? Det kan også løses med tekstgenerering. I slike tilfeller kan svaret gis som tekst.

Men hva om du ønsker å løse et problem som å lage en kompleks graf, redigere et bilde eller finne fargeverdien fra et bilde? Dette er problemer der løsningene ikke kan representeres som tekst. De krever spesifikke handlinger. Uten plugins som Code Interpreter, kunne ChatGPT kun beskrive hvordan du skulle løse problemet. Kodetolken fungerer som et verktøy under panseret. Den tar ChatGPTs beskrivelse av hvordan problemet skal løses og implementerer det ved hjelp av Python-kode. Men hvordan fungerer dette i praksis?

Hvordan fungerer ChatGPTs kodetolk?

Code Interpreter kombinerer en kraftig språkmodell med Python-programmering. Dette gjør at ChatGPT kan være mye mer enn en ren tekstgenerator. Disse to komponentene er viktige for å forstå hvordan kodetolkefunksjonen fungerer. La oss si at du vil at ChatGPT skal dele et bilde i to like deler og invertere fargene i den ene delen, før den setter dem sammen igjen. Hvordan ville ChatGPT gjort dette?

Slik vil det sannsynligvis foregå: Med sin GPT-språkmodell vil ChatGPT ha en idé om hvordan problemet kan løses, nemlig ved hjelp av Python-programmering. ChatGPT vil da generere et Python-skript som kan dele bildet i to, invertere fargene i den ene delen, og deretter sette dem sammen igjen – akkurat slik du ba om.

Siden Code Interpreter er et Python-miljø som kan kjøre Python-kode, gir ChatGPT Python-skriptet til Code Interpreter. Etter at skriptet er utført, returnerer det resulterende bildet til ChatGPT. Problemet er løst. Det er som å ha en programmerer som skriver et program for å løse hvert problem du beskriver i sanntid.

Hvorfor er kodetolken så viktig?

Selv om lanseringen av kodetolk-funksjonen ikke skapte så mye oppmerksomhet som dens potensielle effekt tilsier, kan den vise seg å være den viktigste enkeltfunksjonen i ChatGPT-systemet på lang sikt, bortsett fra selve den underliggende modellen. Det er så viktig den er.

Selv om de nåværende egenskapene ikke reflekterer dens fulle potensial, vil kodetolk-funksjonen, eller i det minste dens driftsmodell, trolig være fremtiden for ChatGPT AI-chatboten. Hvordan det?

Dagens versjoner av store språkmodeller, inkludert GPT-3.5- og GPT-4-modellene som driver ChatGPT, har grunnleggende begrensninger. Som nevnt tidligere, kan de beskrive hvordan et problem skal løses, men deres evne til å faktisk utføre de foreslåtte trinnene er begrenset. Det er derfor LLM-drevne AI-chatbots ennå ikke har blitt virkelige AI-assistenter.

For å gi et klarere bilde, ta Google Assistant som et eksempel. Du kan be Google Assistant om å ringe noen, sende en SMS, eller kanskje bestille en time hos tannlegen. I motsetning til dagens chatbot-modeller, vil ikke Google Assistant bare fortelle deg hvordan du skal gjøre ting; den kan faktisk gjøre det.

Google Assistant er kanskje ikke et perfekt eksempel, men det er et mikrokosmos av hvordan dagens versjoner av ChatGPT kan utvikle seg takket være kodetolk-funksjonen. Du vil kunne be ChatGPT om å trekke ut bilder av alle kattene i en videofil og sende dem til e-postadressen din. Eller kanskje gjennomsøke Twitter og finne alle tweets som nevner deg. Eller nesten alt du kan tenke deg som kan gjøres programmatisk, og ChatGPT vil starte kodetolken og skrive et program som utfører oppgaven, kjøre det og returnere resultatet i løpet av sekunder. Denne evnen til å produsere resultater i den virkelige verden gjennom kodetolken er det som gjør funksjonen så viktig.

Selv om det er umulig å forutsi teknologiens utvikling nøyaktig, er det lett å se for seg at andre AI-selskaper som Google tar i bruk lignende tolkningsmodeller for sine AI-chatbots. Tilsvarende kodetolkere implementert i andre store AI-chatbots kan være katalysatoren som gjør AI-chatbots til et mer praktisk og allsidig verktøy.

En modell for AI-chatbots

ChatGPTs kodetolk innleder et nytt paradigme for AI-chatbots. Ved å legge til evnen til å tolke instruksjoner, skrive kode og kjøre programmer, har OpenAI gitt ChatGPT muligheten til å produsere reelle resultater bare gjennom samtale. Dette er en praktisk modell andre AI-chatbots kan benytte seg av for å gå fra å være informasjonsleverandører til å bli AI-assistenter som kan utføre handlinger.

Code Interpreter-modellen er uten tvil en viktig utvikling som vil gjøre ChatGPT og andre AI-chatbots som benytter seg av lignende modeller langt mer kompetente og nyttige.