Avslør AI-plagiat: Manuelle tips & effektive verktøy

0 Shares

Hvordan avsløre AI-generert tekst: En komplett guide

AI-drevne chatroboter, som ChatGPT, er ikke lenger bare svarmaskiner. De er blitt dyktige til å komponere tekster som etterligner menneskelig skrift, inkludert e-poster, søknadsbrev, essays, poesi, blogginnlegg og mye mer.

Denne evnen til å imitere gjør at AI-generert innhold kan smelte sammen med annen skrift, slik at det blir vanskelig å skille dem fra hverandre. Det gjør det dessverre svært utfordrende å avgjøre om en tekst er skrevet av en AI eller en ekte person. Selv om det er mulig å bruke deduksjon, som Sherlock Holmes, krever det tid og innsats som mange ikke har.

Tenk om jeg fortalte deg at avsnittet over var skrevet av en AI? Jeg ba YouWrite om å lage en kort introduksjon til denne artikkelen, og dette var resultatet. Overbevisende, ikke sant? Det er nettopp problemet – det er så overbevisende at hvem som helst kan presentere det som sitt eget verk for å dra nytte av det.

AI-er bare omformulerer ikke innhold, de lærer om temaet og presenterer det på en naturlig måte ved hjelp av forsterkningslæring fra menneskelig tilbakemelding (RLHF). Dette betyr at det genererte innholdet verken føles robotaktig eller kan sammenlignes med data som allerede finnes på nettet for å fange opp plagiat.

Å avsløre AI-generert innhold er en vanskelig oppgave, og jeg skal ikke gi deg falske forhåpninger om at det er mulig å gjøre dette med 100 % nøyaktighet. Men med litt detektivarbeid og ved hjelp av verktøy for å detektere AI-skriving, er det mulig å avsløre det meste av AI-generert innhold.

Nedenfor presenterer jeg både manuelle metoder for å avsløre AI-plagiat, samt noen automatiske verktøy.

Manuell avsløring av AI-plagiat 🕵️

ChatGPT er ikke det eneste problemet når det gjelder AI-plagiat. Det finnes mange alternative verktøy basert på samme GPT-3-teknologi som er spesielt utviklet for å skrive. Disse er svært avanserte og er laget for å skape menneskelignende innhold som er vanskelig å avsløre.

Automatiske verktøy for gjenkjenning kan variere i effektivitet avhengig av innholdstype, lengde og kompleksitet. For øyeblikket er det best å analysere innhold manuelt for å finne ut om det er AI-generert eller ikke.

Nedenfor lister jeg opp noen vanlige kjennetegn du kan se etter for å avsløre AI-generert innhold.

#1. Utdatert informasjon

ChatGPT og andre GPT-3-baserte AI-er har kunnskap som er begrenset til slutten av 2021. Selv om noen AI-roboter har en innebygd søkemotor for å finne ny informasjon, bruker de fortsatt gamle data for å skrive lengre tekster som essays eller blogginnlegg.

Hvis du oppdager at teksten ofte bruker utdaterte data, spesielt fra før 2021, kan det tyde på at den er AI-generert.

I skjermbildet nedenfor spurte jeg YouWrite om å fortelle meg om det nylige FIFA verdensmesterskapet, og dette var svaret:

AI-en snakker om VM 2018 i stedet for det nylige VM 2022. Selv om verktøyet er oppdatert for å omtale nylige hendelser som VM 2022, bruker det fortsatt de utdaterte dataene det er bygget på for å skrive lengre innlegg.

#2. Samme setningsstruktur for beskrivelser

Når en AI skriver beskrivelser av flere produkter eller apper, bruker den ofte den samme setningsstrukturen og redigerer den for å passe til det aktuelle produktet. Beskrivelsene begynner ofte med det samme ordet, som «Den», «Det», «En» eller navnet på produktet. Beskrivelsene har også et spesifikt fokus som gjentas.

For eksempel ba jeg ChatGPT om å skrive om «nettsteder for dataregistrering». Du kan se at alle beskrivelsene starter med «En» og har et tydelig fokus:

Jeg stilte også YouChat det samme spørsmålet, og det gjorde det samme, gjentok navnet på hver nettside i starten og formulerte om beskrivelsene på en lignende måte.

Hvis en tekst du analyserer har lignende beskrivelser, er det et godt tegn på at den kan være AI-generert.

#3. Bruk av korte setninger

I de fleste tilfeller vil AI bruke korte setninger med maks ett komma. Det kan være et forsøk på å minimere risikoen for feil, men de unngår som regel lange setninger som kan kreve bruk av kolon, semikolon eller tankestreker.

Dette er kanskje ikke det mest åpenbare tegnet, men det kan være nyttig for å bekrefte mistanken din.

#4. Kan gi feilaktige opplysninger

Ved komplekse spørsmål som krever en form for instruksjon, kan AI misforstå intensjonen og gi feil informasjon. Det er ikke snakk om utdatert informasjon, men AI-en kan selvsikkert presentere feil informasjon hvis den ikke forstår emnet.

For eksempel spurte jeg YouWrite om å fortelle meg «hvordan rote en Android-telefon uten PC». AI-en presenterte metoder som inkluderte bruk av PC.

#5. Legger ikke til en personlig mening

Når en AI snakker om et emne, refererer den bare til kjente fakta. I motsetning til mennesker vil den ikke dele sin personlige erfaring. Selv om AI kan bli bedt om å skrive en praktisk beskrivelse, vil den som regel unngå dette som standard.

Hvis teksten bare inneholder kjente fakta, er det stor sannsynlighet for at den er skrevet av en AI. For eksempel vil en AI, når den beskriver en app, fokusere på funksjonene i stedet for brukervennlighet eller personlig bruk.

#6. Korte forklaringer

Siden AI-er er begrenset av kunnskapen de har tilgang til, skriver de gjerne korte forklaringer og beskrivelser. I min erfaring, når de beskriver et spesifikt tema, som for eksempel Android-rooting, holder de forklaringen innenfor 2-3 avsnitt. For apper eller produkter overskrider beskrivelsen som regel ikke ett avsnitt.

Mennesker kan skrive mer detaljert om et emne, inkludert funksjoner, begrensninger, personlig erfaring og priser. AI-er fokuserer derimot på hovedtrekkene eller høydepunktene, noe som fører til kortere tekster. Hvis instruksjonen ber om mer detaljer, øker sjansen for feilinformasjon betraktelig.

#7. Sjekk forfatterens tidligere arbeid

Som lærer eller webmaster, hvis du har tilgang til forfatterens tidligere arbeider, kan det være nyttig å sammenligne dem med den mistenkelige teksten. Det er usannsynlig at en forfatter vil ha en lignende skrivestil som en AI. Selv om AI-er kan endre tone, er stilen de velger ofte generisk, og de kan ikke kopiere din egen personlige tone.

Ta for eksempel det AI-genererte avsnittet i innledningen til denne artikkelen. Alle som har lest mine tidligere artikler, vil se at min skrivestil er annerledes.

Bare ved å lese 2-3 tidligere arbeider fra forfatteren, kan du se om de samsvarer med skrivestilen til den mistenkelige teksten.

Verktøy for å avsløre AI-plagiat

Det finnes mange verktøy som kan avsløre AI-generert innhold. Nøyaktigheten varierer imidlertid, og de kan slite med visse typer innhold og lengder.

Jeg testet disse verktøyene med innhold generert av ChatGPT, GPT-3 Playground, WriteSonic, Rytr og YouWrite. De klarte å avsløre alle typer innhold fra ChatGPT og GPT-3 Playground.

Resultatene for dedikerte skriveverktøy varierte. Interessant nok klarte ikke alle å avsløre YouWrite. Jeg antar at det er fordi YouWrite med hensikt gjør menneskelignende feil for å unngå oppdagelse.

Jeg anbefaler å bruke disse verktøyene sammen med manuell analyse av innholdet. Analyser først innholdet med et verktøy, og sjekk deretter manuelt etter ledetråder for å bekrefte mistanken.

Nedenfor lister jeg opp verktøyene som ga best resultater og er enklest å bruke:

Merk: I demonstrasjonsøyemed bruker jeg tekst fra WriteSonic om «Fordeler med mango».

#1. Content At Scale

Jeg opplevde at AI-innholdsdetektoren fra Content At Scale var mest nøyaktig i de fleste testene. Den lar deg skanne opptil 2500 tegn per skanning og gir en prosentvis prediksjon som viser om innholdet sannsynligvis er ekte eller falskt.

Innhold som har en falsk tetthet på over 60 % er sannsynligvis skrevet av en AI. I skjermbildet nedenfor ser du at 96 % av innholdet er falskt, og det ble generert fullstendig av en AI.

#2. GPTZero

Hvis du vil se nøyaktig hvilken del av innholdet som er generert av en AI, er GPTZero et godt alternativ. GPTZero gir ikke en poengsum, men fremhever innholdet som sannsynligvis er generert av en AI.

Den gir også en «forvirring» og «utbrudds» score for å gi en idé om tilfeldigheten i teksten. Det viktigste er at den støtter 5000 tegn per skanning og kan laste opp filer. Skanning av lengre innhold bidrar til å forbedre nøyaktigheten.

#3. GPT-2 Output Detector

Skaperne av ChatGPT tilbyr også en egen detektor for å avsløre sitt eget arbeid. Siden GPT-2 og GPT-3 kun er forskjellige i mengden data som brukes til trening, fungerer denne GPT-2-detektoren bra for GPT-3-baserte AI-er.

Det er ingen begrensning på hvor mye innhold den kan skanne, så den er perfekt for å avsløre svært lange AI-genererte tekster. Jeg opplevde også at nøyaktigheten var god, særlig for innhold generert av ChatGPT. Resultatene er imidlertid ikke alltid like pålitelige, så du bør vurdere dem hvis det er mer enn 50 % falskt innhold.

#4. Writer AI Content Detector

Resultatene fra Writer AI Content Detector er tvilsomme når det gjelder å avsløre innhold fra AI-skriveverktøy, men den fungerer utmerket for ChatGPT-generert innhold. Du kan skanne 1500 tegn per skanning, og til og med legge til URL-en til innholdet hvis det allerede er publisert.

I min test hevdet den at 94 % av den AI-genererte teksten var skrevet av mennesker, noe som er ganske dårlig sammenlignet med andre verktøy. Likevel er den fortsatt nyttig for å avsløre ChatGPT-innhold, spesielt hvis det allerede er publisert.

#5. Draft & Goal

Et enkelt, men effektivt verktøy for å avsløre AI-skriving. I min erfaring ga Draft & Goal lignende resultater som Content At Scale, men den har ikke noen grense for antall ord, slik at du kan skanne lange tekster. Skanningstiden øker imidlertid med lengden på innholdet.

For eksempelteksten min konkluderte den med at 94 % av teksten var AI-generert.

Mine tanker 💭

Jeg tror personlig at AI-hjelp er en god måte å overvinne skrivesperre, samle informasjon og finne inspirasjon. Det bør imidlertid aldri erstatte menneskelig skriving, da AI er begrenset av den kunnskapen som allerede eksisterer.

Du kan også utforske noen av de beste verktøyene for plagiatkontroll for å forhindre kopiering.