Hva er en Deepfake, og bør jeg være bekymret?
Vi har en tendens til å stole på innholdet i video- og lydopptak. Men med AI kan ansiktet eller stemmen til hvem som helst gjenskapes med presis nøyaktighet. Produktet er en deepfake, en etterligning som kan brukes til memes, feilinformasjon eller porno.
En titt på Nicholas Cage deepfakes eller Jordan Peeles dypfalske PSA gjør det klart at vi har med merkelig ny teknologi å gjøre. Selv om disse eksemplene er relativt ufarlige, reiser de spørsmål om fremtiden. Kan vi stole på video og lyd? Kan vi holde folk ansvarlige for handlingene deres på skjermen? Er vi klare for deepfakes?
Deepfakes er nye, enkle å lage og vokser raskt
Deepfake-teknologien er bare noen år gammel, men den har allerede eksplodert til noe som er både fengslende og foruroligende. Begrepet «deepfake», som ble laget på en Reddit-tråd i 2017, brukes til å beskrive gjenskapingen av et menneskes utseende eller stemme gjennom kunstig intelligens. Overraskende nok kan omtrent hvem som helst lage en deepfake med en elendig PC, litt programvare og noen timers arbeid.
Tro det eller ei, bildet til venstre er deepfake.
Som med all ny teknologi, er det litt forvirring rundt deepfakes. «Drunk Pelosi»-videoen er et utmerket eksempel på denne forvirringen. Deepfakes er konstruert av AI, og de er laget for å etterligne mennesker. «Dunk Pelosi»-videoen, som har blitt referert til som en deepfake, er faktisk bare en video av Nancy Pelosi som har blitt bremset ned og tonehøydekorrigert for å legge til en sløret taleeffekt.
Dette er også det som gjør deepfakery forskjellig fra for eksempel CGI Carrie Fisher i Star Wars: Rogue One. Mens Disney brukte massevis av penger på å studere Carrie Fishers ansikt og gjenskape det for hånd, kan en nerd med noe deepfake-programvare gjør den samme jobben gratis på en enkelt dag. AI gjør jobben utrolig enkel, billig og overbevisende.
Hvordan lage en Deepfake
Som en student i et klasserom, må AI «lære» hvordan man utfører den tiltenkte oppgaven. Det gjør dette gjennom en prosess med brute-force prøving og feiling, vanligvis referert til som maskinlæring eller dyp læring. En AI som er designet for å fullføre det første nivået i Super Mario Bros, for eksempel, vil spille spillet om og om igjen til det finner ut den beste måten å vinne på. Personen som designer AI-en må gi noen data for å få ting i gang, sammen med noen få «regler» når ting går galt underveis. Bortsett fra det, gjør AI alt arbeidet.
Det samme gjelder deepfake ansiktsrekreasjon. Men å gjenskape ansikter er selvfølgelig ikke det samme som å slå et videospill. Hvis vi skulle lage en deepfake av Nicholas Cage som vert for Wendy Williams-showet, her er det vi trenger:
En destinasjonsvideo: Per nå fungerer deepfakes best med klare, rene destinasjonsvideoer. Det er derfor noen av de mest overbevisende deepfakes er av politikere; de har en tendens til å stå stille på et podium under jevn belysning. Så, vi trenger bare en video av Wendy som sitter stille og snakker.
To datasett: For at munn- og hodebevegelser skal se nøyaktige ut, trenger vi et datasett av Wendy Williams ansikt og et datasett med ansiktet til Nicholas Cage. Hvis Wendy ser til høyre, trenger vi et bilde av Nicholas Cage som ser til høyre. Hvis Wendy åpner munnen, trenger vi et bilde av Cage som åpner munnen.
Etter det lar vi AI gjøre jobben sin. Den prøver å skape deepfake om og om igjen, og lærer av sine feil underveis. Enkelt, ikke sant? Vel, en video av Cages ansikt på Wendy Williams