Hvordan fungerer ansiktsgjenkjenning?

De fleste er komfortable med ansiktsgjenkjenning for bruken i Instagram-filtre og Face ID. Men denne relativt nye teknologien kan føles litt skummel. Ansiktet ditt er som et fingeravtrykk, og teknologien bak ansiktsgjenkjenning er kompleks.

Som med all ny teknologi, er det ulemper med ansiktsgjenkjenning. Disse ulempene blir mer tydelige ettersom militæret, politiet, annonsører, og deepfake-skapere, finne utspekulerte nye måter å dra nytte av programvare for ansiktsgjenkjenning.

Nå, mer enn noen gang, er det viktig for folk å forstå hvordan ansiktsgjenkjenning fungerer. Det er også viktig å vite begrensningene ved ansiktsgjenkjenning og hvordan den vil utvikle seg i fremtiden.

Ansiktsgjenkjenning er overraskende enkelt

Før du går inn på de mange forskjellige mediene for ansiktsgjenkjenning, er det viktig å forstå hvordan prosessen med ansiktsgjenkjenning fungerer. Her er tre applikasjoner for programvare for ansiktsgjenkjenning, og en enkel forklaring på hvordan de gjenkjenner eller identifiserer ansikter:

Grunnleggende ansiktsgjenkjenning: For Animoji- og Instagram-filtre «leter» telefonkameraet etter de definerende egenskapene til et ansikt, spesielt et par øyne, en nese og en munn. Deretter bruker den algoritmer for å låse seg til et ansikt og bestemme hvilken retning det ser, om munnen er åpen osv. Det er verdt å nevne at dette ikke er ansiktsidentifikasjon, det er bare programvare som leter etter ansikter.
Face ID og lignende programmer: Når du konfigurerer Face ID (eller lignende programmer) på telefonen din, tar den et bilde av ansiktet ditt og måler avstanden mellom ansiktstrekkene dine. Deretter, hver gang du går for å låse opp telefonen din, «ser» den gjennom kameraet for å måle og bekrefte identiteten din.
Identifisere en fremmed: Når en organisasjon ønsker å identifisere et ansikt for sikkerhets-, reklame- eller politiformål, bruker den algoritmer for å sammenligne det ansiktet med en omfattende database med ansikter. Denne prosessen er nesten identisk med Apples Face ID, men i større skala. Teoretisk sett kan enhver database brukes (ID-kort, Facebook-profiler), men en database med klare, forhåndsidentifiserte bilder er ideell.

  Slik endrer du Google Stadia-brukernavnet og -avataren

Ok, la oss komme inn på det tøffe. Fordi den «grunnleggende ansiktsgjenkjenningen» som brukes for Instagram-filtre er en så enkel og ufarlig prosess, kommer vi til å fokusere helt på ansiktsidentifikasjon, og de mange forskjellige teknologiene som kan brukes til å identifisere et ansikt.

Mest ansiktsgjenkjenning er avhengig av 2D-bilder

Som du forventer, er det meste av programvare for ansiktsgjenkjenning helt og holdent avhengig av 2D-bilder. Men dette er ikke gjort fordi 2D ansiktsavbildning er supernøyaktig, det er gjort for enkelhets skyld. Det overveldende flertallet av kameraene tar bilder uten dybde, og offentlige bilder som kan brukes til ansiktsgjenkjenningsdatabaser (for eksempel Facebook-profilbilder) er alle i 2D.

Hvorfor er ikke 2D-ansiktsavbildning supernøyaktig? Vel, fordi et flatt bilde av ansiktet ditt mangler identifiserende funksjoner, som dybde. Med et flatt bilde kan en datamaskin måle pupillavstanden din, og bredden på munnen din, blant andre variabler. Men den kan ikke fortelle lengden på nesen din eller hvor fremtredende pannen din er.

I tillegg er 2D ansiktsavbildning avhengig av det synlige lysspekteret. Dette betyr at 2D ansiktsavbildning ikke fungerer i mørket, og det kan være upålitelig under funky eller skyggefulle lysforhold.

Det er klart at veien rundt noen av disse manglene er å bruke 3D-ansiktsavbildning. Men hvordan er det mulig? Trenger du spesialutstyr for å se et ansikt i 3D?

IR-kameraer gir dybde til identiteten din

Mens noen ansiktsgjenkjenningsapplikasjoner utelukkende er avhengige av 2D-bilder, er det ikke uvanlig at ansiktsgjenkjenning også er avhengig av 3D-bilder. Faktisk involverer din erfaring med ansiktsgjenkjenning sannsynligvis en klype 3D.

Dette oppnås gjennom en teknikk kalt lidar, som ligner på ekkolodd. I hovedsak sprenger ansiktsskanningsenheter, som din iPhone, en ufarlig IR-matrise mot ansiktet ditt. Denne matrisen (en vegg av lasere) reflekteres deretter av ansiktet ditt og blir fanget opp av et IR-kamera (eller ToF-kamera) på telefonen din.

Hvor skjer 3D-magien? Telefonens IR-kamera måler hvor lang tid det tar før hver bit av IR-lys spretter av ansiktet ditt og går tilbake til telefonen. Naturligvis vil lyset som reflekteres fra nesen din ha en kortere reise enn lyset som reflekteres fra ørene dine, og IR-kameraet bruker denne informasjonen til å lage et unikt dybdekart over ansiktet ditt. Når den brukes sammen med grunnleggende 2D-bilder, kan 3D-bildebehandling øke nøyaktigheten til programvare for ansiktsgjenkjenning betydelig.

  Slik kobler du Apple AirPods Pro med en hvilken som helst enhet

Lidar-avbildning er et merkelig konsept som kan være vanskelig å vikle hodet rundt. Hvis det hjelper, prøv å forestille deg at IR-nettverket fra telefonen din (eller en annen ansiktsgjenkjenningsenhet) er en pin-board leketøy. Som en pin-board-leke etterlater ansiktet ditt en fordypning i IR-nettet, der nesen din er merkbart dypere enn for eksempel øynene dine.

Termisk bildebehandling lar ansiktsgjenkjenning fungere om natten

En av manglene med 2D ansiktsgjenkjenning er at den er avhengig av det synlige lysspekteret. I lekmannstermer fungerer ikke grunnleggende ansiktsgjenkjenning i mørket. Men dette kan løses ved å bruke et termisk bildekamera (ja, som i Tom Clancy).

«Vent litt,» kan du si, «er ikke termisk bildebehandling avhengig av IR-lys?» Ja det gjør det. Men termiske kameraer sender ikke ut eksplosjoner med IR-lys; de oppdager ganske enkelt IR-lyset som sendes ut fra objekter. Varme gjenstander avgir tonnevis med IR-lys, mens kalde gjenstander avgir en ubetydelig mengde IR-lys. Dyre termiske kameraer kan til og med oppdage subtile temperaturforskjeller over en overflate, så teknologien er ideell for ansiktsgjenkjenning.

Et synlig lysspekterbilde, et termisk bilde og et sammensatt termisk bilde.

Det finnes en håndfull forskjellige måter å identifisere et ansikt med termisk bildebehandling. Alle disse teknikkene er utrolig kompliserte, men de deler noen grunnleggende likheter, så vi skal prøve å holde ting enkelt med en liste:

Flere bilder er nødvendig: Et termisk kamera tar flere bilder av et motivs ansikt. Hvert bilde fokuserer på et annet spektrum av IR-lys (lange, korte og middels bølger). Vanligvis gir det lange bølgespekteret de fleste ansiktsdetaljene.
Blodkarkart er nyttige: Disse IR-bildene kan også brukes til å trekke ut dannelsen av blodkar i ansiktet til en person. Det er skummelt, men blodkarkart kan brukes som unike ansiktsfingeravtrykk. De kan også brukes til å finne avstanden mellom ansiktsorganer (hvis typisk termisk bildebehandling gir skumle bilder) eller til å identifisere blåmerker og arr.
Motivet kan identifiseres: Et sammensatt bilde (eller datasett) lages ved hjelp av flere IR-bilder. Dette sammensatte bildet kan deretter sammenlignes med en ansiktsdatabase for å identifisere motivet.

  Hva er Mirai Botnet, og hvordan kan jeg beskytte enhetene mine?

Selvfølgelig brukes termisk ansiktsgjenkjenning vanligvis av militæret, det er ikke noe du finner på Khols, og det er ikke noe som kommer med din neste mobiltelefon. I tillegg fungerer ikke termisk bildebehandling godt på dagtid (eller i generelt godt opplyste miljøer), så det har ikke mange potensielle bruksområder utenfor militæret.

Begrensninger for ansiktsgjenkjenning

Vi har brukt mye tid på å snakke om manglene ved ansiktsgjenkjenning. Som vi har sett fra IR og termisk bildebehandling, er det mulig å overvinne noen av disse begrensningene. Men det er fortsatt noen problemer som ikke er funnet ut ennå:

Hindring: Som du forventer, kan solbriller og annet tilbehør snuble i programvaren for ansiktsgjenkjenning.
Posisjoner: Ansiktsgjenkjenning fungerer best med et nøytralt, forovervendt bilde. En vipping eller vri på hodet kan gjøre ansiktsgjenkjenning vanskelig, selv for IR-basert gjenkjenningsprogramvare. I tillegg kan et smil, oppblåste kinn eller en annen positur endre hvordan en datamaskin måler ansiktet ditt.
Lys: Alle former for ansiktsgjenkjenning er avhengig av lys, enten det er synlig spektrum eller IR-lys. Som et resultat kan rare lysforhold redusere nøyaktigheten av ansiktsidentifikasjon. Dette kan endre seg, ettersom forskere for tiden utvikler seg ekkoloddbasert ansiktsgjenkjenningsteknologi.
Databasen: Uten en god database kan ikke ansiktsgjenkjenning fungere. På de samme linjene er det umulig å identifisere et ansikt som ikke har blitt identifisert riktig tidligere.
Databehandling: Avhengig av størrelsen og formatet til en database, kan det ta en stund før datamaskiner identifiserer ansikter riktig. I noen situasjoner, som politi, begrenser begrensninger i databehandling bruken av ansiktsidentifikasjon for hverdagsapplikasjoner (noe som sannsynligvis er en god ting).

Per nå er den beste måten å omgå disse begrensningene å bruke andre former for identifikasjon i forbindelse med ansiktsgjenkjenning. Telefonen din vil be om et passord eller et fingeravtrykk hvis den ikke klarer å identifisere ansiktet ditt, og kinesiske myndigheter bruker ID-kort og sporingsteknologi for å lukke feilmarginen som finnes i ansiktsgjenkjenningsnettverket.

I fremtiden vil forskere sikkert finne en måte å komme seg rundt disse problemene på. De kan bruke ekkoloddteknologi sammen med lidar for å lage 3D-ansiktskart i alle miljøer, og de kan finne måter å behandle ansiktsdata på (og identifisere fremmede) på utrolig kort tid. Uansett har denne teknologien et stort potensial for misbruk, så det er verdt å følge med.

Kilder: Universitetet i Rijeka, Electronic Frontier Foundation