Alt om ansiktsgjenkjenning for bedrifter

Ansiktsgjenkjenning er ikke begrenset til informatikk. Den har solide forretningsapplikasjoner.

Et av de hotteste moteordene i dette tiåret er ansiktsgjenkjenning.

Det er den delen av anvendt maskinlæring som kan oppdage og identifisere menneskelige ansikter, et problem som har vært notorisk vanskelig for datamaskiner til nå. Og dette har åpnet en helt ny verden av spennende muligheter og utfordringer for både bedrifter, myndigheter og enkeltpersoner.

Hvis du er en bedriftsleder og har lurt på hva oppstyret handler om og om det er noe nytte i denne nye utviklingen, har vi dekket deg. I denne artikkelen skal vi se på historien til ansiktsgjenkjenning, dens utvikling, nåværende bruk, kontroverser, distribusjon og mange flere fasetter.

Mot slutten av det, vil du ha en solid forståelse av hva ansiktsgjenkjenningsteknologi handler om og hva dens implikasjoner er for bedrifter.

La oss komme i gang!

Utvikling av ansiktsgjenkjenning

Teknologien har eksistert en stund for all hypen og mediedekningen rundt ansiktsgjenkjenning. Det første seriøse algoritmiske arbeidet med å oppdage ansikter var Viola-Jones Object Detection Framework publisert i 2001. Selv om det var et rammeverk for generell bruk for å identifisere objekter i bilder, ble det raskt brukt på ansiktsgjenkjenning med meget god suksess. Hovedårsaken til denne algoritmens popularitet var hastigheten; mens treningsprosessen var uutholdelig treg, var gjenkjenningsprosessen ekstremt rask.

Så tidlig som i 2001/2004 var den gjennomsnittlige stasjonære datamaskinen som kjørte denne algoritmen i stand til å behandle en 300px X 300px-ramme på 0,07 sekunder (mer her). De nøyaktighetsgradermen ikke sammenlignbare med hva mennesker kan oppnå, var imponerende med 90 %.

Reelle fremskritt ble imidlertid ikke gjort før tiåret 2010-2020, da Konvolusjonelle nevrale nettverk dukket opp som den beste metoden for å utføre ansiktsdeteksjon. Årsaken var tilgjengeligheten av rå prosessorkraft og gigantiske systemminner gjort tilgjengelig gjennom cloud computing av Infrastructure-as-a-Service (IaaS)-leverandører. For første gang i historien slo datamaskiner konsekvent mennesker for å gjenkjenne ansikter, spesielt når et stort antall tilfeldige ansikter var involvert.

Kilde: medium.com

Hvordan fungerer ansiktsgjenkjenning?

Ansiktsgjenkjenning er en flertrinnsprosess med flere spesialiserte undersystemer involvert.

Her er hva de ulike stadiene betyr:

Deteksjon / sporing: Denne delen av forbehandlingsfasen er ansvarlig for å identifisere og spore ansikter i det gitte bildet eller videofilen. Når denne prosessen er fullført, vet vi med sikkerhet at det er et ansikt i den gitte inngangen, og den kan behandles videre. Sporingsfasen er også ansvarlig for å spore visse deler, spesielle funksjoner eller uttrykk i et ansikt, hvis det skulle være nødvendig.

Justering: Problemet med ansiktsgjenkjenning er forsterket fordi ansikter i et gitt bilde eller video ikke følger noen retningslinjer. Personen kan være zoomet inn eller ut, kikke bak et tre, eller være til stede i en sideprofil, noe som gjør problemet med ansiktsgjenkjenning enda vanskeligere. Det er her ansiktsjustering kommer inn: den forteller oss hvor i det gitte bildet/videoen ansiktslinjene er, og hva er konturene for ansiktstrekk.

Kilde: csc.kth.se

Funksjonsekstraksjon: Som navnet antyder, i løpet av denne fasen av prosessen (vi er nå i gjenkjennelsesstadiet), trekkes de individuelle trekkene i ansiktet, som øyne, nese, hake, lepper osv. ut i formen som algoritmer kan bruke i neste trinn. På dette stadiet har datamaskinen samlet nok komplekse data til å skille et ansikt unikt.

Funksjonsmatching/klassifisering: I dette stadiet blir inputene mottatt fra funksjonsutvinningen matchet mot den gitte databasen for å utlede personens identitet. Denne fasen er også kjent som en klassifisering fordi algoritmen kan være nødvendig for å kategorisere ansikter i stedet for å identifisere dem individuelt.

Når denne prosessen er over, vet vi med sikkerhet om det gitte ansiktet er en del av databasen vi sammenlignet med eller ikke. Den endelige utgangen kan også inneholde tagging, slik vi er vant til å se på Facebook.

Kilde: towardsdatascience.com

Implementeringshensyn: Server-side kontra klient-side

Ansiktsgjenkjenning kan fungere både på serveren og enheten brukeren samhandler med. For eksempel, når du laster opp et bilde til Facebook, kjøres algoritmene på serversiden; på den annen side må et ID-system som bruker ansiktet ditt til å låse opp enheten kjøre på klientsiden. Så hvilken er bedre?

Ærlig talt, det handler ikke om hvilken som er best. Både server- og klientsiden har sine styrker; i praksis implementerer bedrifter et hybridsystem. Den anbefalte praksisen er å trene modellene dine på serversiden, hvor treningsdata og prosesseringsressurser er ubegrensede. Når modellene er opplært, kan disse pakkes og distribueres på klientsiden, noe som forbedrer systemets hastighet samt opprettholder brukerens personvern.

  Slik bruker du iPad som en sekundær Mac-skjerm uten sidevogn

Å sende alt til serveren introduserer en forsinkelse, som kan være dårlig eller uakseptabel i visse tilfeller. Samtidig vil det å holde alt på klientsiden resultere i svakere modeller.

Hvor nøyaktig er ansiktsgjenkjenning?

Nøyaktighet er ikke et veldig veldefinert begrep innen ansiktsgjenkjenning. Hovedårsaken er at det er et uklar problem med alle slags rotete innganger (lavt lys, ansikt delvis dekket av hår, kamerakvalitet osv.) og til og med villedende innganger (mer om dette senere!). Som et resultat må de nevrale nettverkene som er involvert i ansiktsgjenkjenning justeres for problemet som er for hånden, noe som begrenser omfanget. Så selv om et industrielt ansiktsgjenkjenningssystem kan skryte av 100 % nøyaktighet (noe som ofte er tilfellet), kan det hende at det samme systemet ikke engang er 20 % nøyaktig når det blir bedt om å identifisere ansikter i et overfylt bilde.

I en undersøkelser, var en spesiell type ansiktsgjenkjenningsalgoritme i stand til å oppnå 98,52 % nøyaktighet, høyere enn den menneskelige nøyaktigheten på 97,53 % oppnådd i samme test. I en annen studere utført i rettsmedisin, ga kombinasjonen av menneskelig dømmekraft og algoritmer de beste resultatene i noen tilfeller.

Bunnlinjen – for fokuserte, veldefinerte applikasjoner er ansiktsgjenkjenning det beste verktøyet vi har.

Hvor brukes ansiktsgjenkjenning?

Selv i den korte perioden levedyktige algoritmer har blitt utviklet, har ansiktsgjenkjenning funnet utrolig nyttige og spennende applikasjoner. Noen av disse er iøynefallende, men noen er så subtilt og grunnleggende innvevd i hverdagen at vi nesten ikke stopper opp for å tenke på hva som er under.

Facebook er kanskje det vanligste eksemplet på moderne ansiktsgjenkjenningssystemer på jobb. Så snart du laster opp et bilde, er det sosiale nettverket i stand til å oppdage ansikter. Mens du for en tid siden ble bedt om å tagge venner, kan Facebook nå gjøre det på egen hånd.

Kilde: labnol.org

En kul ny applikasjon fra Facebook er funksjonen til informere brukere når bilder som inneholder ansiktene deres lastes opp av noen, selv om de ikke er merket i disse bildene.

Snapchat bruker mye ansiktsgjenkjenning og gjenkjenning for mange av funksjonene, spesielt de morsomme filtrene som er så rasende.

Kilde: gistreel.com

For at disse filtrene skal fungere, må konturene og funksjonene til motivets ansikt gjenkjennes perfekt, ellers vil ikke overleggene se realistiske ut. Det samme gjelder Face Swap, en annen populær funksjon på Snapchat. Hvis du er interessert i å dykke dypere inn i Snapchats evner innen ansiktsgjenkjenning, se her.

Uber har kjempet mot personvern og sikkerhetsproblemer en stund nå, og det nyeste våpenet i selskapets arsenal er ansiktsgjenkjenning. Selskapet har rullet ut en ny funksjon hvor identiteten til sjåførpartnerne bekreftes av bruker ansiktene deres. Selskapet sier på bloggen sin at etter å ha testet flere teknologileverandører for ansiktsgjenkjenning, slo de seg på Microsoft Face API for dens høye kvalitet. Interessant nok fungerer denne sanntids ID-sjekken godt under dårlige lysforhold og er i stand til å oppdage briller.

Med ansiktsgjenkjenning som har vist seg å være vellykket i naturen, er det lett å forutsi at det snart kan erstatte andre identifikasjonsmetoder ved utdanningsinstitusjoner, sykehus, biblioteker osv.

Forebygging av kriminalitet i detaljhandelen er en naturlig forlengelse av bruken av ansiktsgjenkjenning. Detaljhandelen taper et estimat 45 milliarder dollar hvert år til butikktyver og annen detaljforbrytelse, med svært lite å motvirke det med. Nå liker selskaper FaceFirst hjelper forhandlere å bruke ansiktsgjenkjenning for å oppdage tidligere lovbrytere og varsle sikkerhetsoffiserer.

Politiovervåking begynner å utnytte ansiktsgjenkjenning som alle andre institusjoner der ute. For eksempel, i Storbritannia, bruker politiet i Sør-Wales kameraer montert på varebiler for å lage overvåkning av folkemengder lettere.

Kilde: theconversation.com

Mens denne nyvunne supermakten i politiets hender har utløst heftige offentlige debatter om individets personvern, tror politiet at det vil hjelpe dem å begrense forbrytere bedre. Som Richard Lewis, nestleder i Sør-Wales politi, fortalte Financial Times:

Hvis du identifiserer noen som har begått et lovbrudd [previously]du sier i utgangspunktet: vi vet at du er her, vær så snill å oppfør deg.

Healthcare hadde nylig en uventet søknad, der ansiktsgjenkjenning hjalp til med å oppdage en sjelden genetisk lidelse kalt DiGeorge Syndrome.

DiGeorge-syndromet vises hos omtrent 1 av 6000 barn og resulterer i misdannelser i flere kroppsdeler. Helseproblemet, i dette tilfellet, er mer alvorlig for fattigere land, som ikke har ressurser til å gå for dyre diagnosemetoder. Som sådan, ansiktsgjenkjenning, med en forbløffende nøyaktighet på 96,6 %, gir nytt håp for ofre for DiGeorge syndrom.

  Hvordan installere Ubuntu Server 21.04 via USB

I flyselskapsbransjen øker bruken av ansiktsgjenkjenning, og det vil snart erstatte de konvensjonelle boardingkortene. Foreløpig er det begrensede, men lovende resultater i å hjelpe identifisere passasjerer når de forlater landet. Faktisk har Transport Security Administration (TSA) i USA lagt ut en plan for utbredt bruk av ansiktsgjenkjenningsbasert biometri.

Kontroversiell bruk av ansiktsgjenkjenning

Teknologi styrker oss, selv om god eller dårlig bruk er opp til oss. Ingen tvil om at noe så potent og radikalt som ansiktsgjenkjenning blir tatt i bruk på en måte som vekker bekymring for grunnleggende menneskerettigheter og etikk.

Det mest fremtredende eksemplet på kontroversiell bruk av ansiktsgjenkjenning er Kinas enorme overvåkningssystem som bruker anslagsvis 200 millioner kameraer for å holde øye med sine 1,4 milliarder innbyggere.

Kilde: sbs.com

Systemet sporer folk og evaluerer handlingene deres, og oppdaterer stadig en beregning kalt borgerscore. Selv om det er en viss verdi i å ha et kraftig statskontrollert overvåkingssystem (for eksempel sporing av gjeldsmisligholdere), ser de fleste på det som ankomsten til den dystopiske fremtiden George Orwell forestilte seg. Det er en fremtid der regjeringer har ubegrenset makt over individet, og personvern er ikke-eksisterende.

Det andre eksemplet på diskutabel bruk av ansiktsgjenkjenning kommer også (ikke overraskende?) fra Kina. Denne gangen tar skolesystemet i bruk ansiktsgjenkjenning for å sikre at elevene er «oppmerksomme» i timene. Det nye ansiktsgjenkjenningssystemet, selv om det ikke er utbredt ennå, erstatter ID-kort, lånekort, oppmøtesystemer osv., og bruker studentens ansikt for identifikasjon.

Kilde: businessinsider.com

Men det skumle er at dette systemet overvåker elevenes oppmerksomhetsnivåer, bruk av mobiltelefoner osv., og varsler læreren når en viss terskel krysses.

Selv om videoovervåking drevet av ansiktsgjenkjenning ikke er eksklusivt for Kina, har USA vært det gjør innsats å bruke den til å dempe våpenvold i skolene – det er Kina som ser ut til å ta dette lenger enn noe annet land.

Når det gjelder å bruke ansiktsgjenkjenning, hvilke alternativer har du? I denne delen skal vi se på hva som er i vanlig bruk, og hvordan de ulike løsningene står opp mot hverandre.

Før vi begynner, men: en påminnelse om at disse API-ene utvikler seg raskt, og du vil sannsynligvis komme over blogginnlegg som sier at denne API-en mangler denne eller den funksjonen. Ikke ta avgjørelsene dine basert på det. Analyser bedriftens behov først, sjekk nøye funksjonene som tilbys, gå for en sti, og først deretter bestemme deg.

OpenCV

AI-forskning er et synkehull uten bunn. Å trene og perfeksjonere et ansiktsgjenkjenningssystem er vanskelig og overlates best til konglomerater med dype lommer og en hær av forskere. Men hvis dine behov er enkle og du liker å ha full kontroll – og selvfølgelig er klar for vedlikehold av et lite/lite ingeniørteam –OpenCV kanskje bare fungere for deg.

Det er et åpen kildekode Computer Vision-bibliotek som er bemerkelsesverdig nøyaktig og tilgjengelig for alle programmeringsplattformer. Her er en hårreisende eksempel om hvordan du kan spinne opp et ansiktsgjenkjenningssystem med Python og OpenCV i 25 linjer med kode!

Nå kan du komme over noen blogger som sier at OpenCV ikke har ansiktsgjenkjenning. Vel, det er en fullstendig løgn, og her er det bevis. Alt i alt kan OpenCV være et godt valg for din bedrift hvis behovene er enkle og spesifikke.

Amazon-gjenkjenning

Anerkjennelse er et kraftig tilbud fra en av de største skyleverandørene der ute – AWS. Det er en fullt administrert, kraftig tjeneste for AWS-plattformen, og hvis du allerede bruker AWS for utrulling, er nok Rekognition det beste valget.

Noen av de oppsiktsvekkende funksjonene som tilbys av Rekognition er:

  • Sanntidsanalyse (når du laster opp et bilde eller en video til S3)
  • Omfattende ansiktsanalyse (kjønn, hårfarge, ansiktsuttrykk, åpne øyne eller ikke, etc.)
  • Patting (fanger opp stier til identifiserte objekter i videoer)
  • Scene- og aktivitetsdeteksjon (innendørs/utendørs, «spille fotball» osv.)
  • Moderere usikkert innhold (f.eks. nakenhet)

Det største plusset med Rekognition er også det største minuset – du vil virkelig slite med å bruke det med tjenester som ikke er AWS til det punktet hvor du bare må gi opp.

Kairos

I skarp kontrast til anerkjennelse, Kairos gir deg AI over et API (rimet er utilsiktet, vi sverger!), og lar deg ta full kontroll over dataene og serverne dine. Kairos presenterer seg selv som en personvern-først-tjeneste, og er ekstremt kritisk av Amazon og andre selskaper som samarbeider med myndighetene (det er også ACLUforresten).

  Hvordan laste ned Google Meet

Kairos fungerer både på bilder og videoer og har alle de fine funksjonene du kan forvente av en moderne ansiktsgjenkjennings-API. Det gjør noen av de forbløffende funksjonene som finnes i Rekognition, men hvis du ikke trenger dem og allerede administrerer dataene dine, hvorfor bry deg?!

Kairos har en lokal distribusjon for de som er paranoide når det gjelder personvern og ikke engang ønsker å sende data over ledningen for behandling, Kairos har lokal distribusjon, prisene avhenger av din brukssituasjon og kan være ganske bratte.

Google Cloud Vision

Google har valgt å skille mellom sine ansiktsgjenkjenningstjenester for bilder og videoer. Bilde-APIet er kjent som Cloud Visionmens den videofokuserte tjenesten kalles Videointelligens.

Mens den bildefokuserte tjenesten er ganske lik det AWS har å tilby, har videotjenesten en fin funksjon for katalogisering og søking. Dette vil være nyttig for selskaper som har store videoarkiver de kanskje vil analysere eller søke gjennom.

Når det er sagt, mangler Video Intelligence ansiktsgjenkjenningsfunksjoner i skrivende stund, og disse ser ut til å tilbys kun i Cloud Vision. Objektsporing og tekstgjenkjenning er også i beta, noe som legger det mye bak Amazons tilbud.

Azure Face API

Med Microsoft tar skytilbudene deres mer seriøst enn de stasjonære (endelig), den Azure Face API er et herlig tilbud. Den har alle de interessante funksjonene du kan forvente (deteksjon, identifikasjon, ansiktsgruppering, lignende ansiktssøk, følelser osv.), og fungerer like godt med videoer.

Nå er ikke dette strengt knyttet til ansiktsgjenkjenning, men det er verdt å nevne at Azure også tilbyr en kundedatasyn. servicesom lar deg bruke inngangene dine og trene modeller i henhold til dine behov.

Akkurat som Googles tjeneste, er det en lekeplass tilgjengelig rett på hjemmesiden, noe som gjør testing av API-en veldig gøy!

Er det betydelige forskjeller mellom de toppadministrerte ansiktsgjenkjenningstjenestene? Ikke egentlig. Det er intens konkurranse på feltet akkurat nå, og nye funksjoner rulles ut raskere enn pizza. Hvis du allerede er knyttet til et bestemt økosystem, er det fornuftig å bruke deres egen ansiktsgjenkjenningstjeneste. Ellers kan det være lurt å velge en annen leverandør hvis behovene dine er spesifikke (kontrollere dine egne data, bare trenger vanlig deteksjon osv.).

Anti-ansiktsgjenkjenningssystemer

Akkurat som noen forskere har viet livet til å perfeksjonere ansiktsgjenkjenningsteknologi, er andre opptatt med å utvikle teknikker for å lure dem. En slik interessant utvikling er Motstridende brillersom ellers ser normale ut for mennesker, men som har lurt ekspertansiktsgjenkjenningssystemer.

Kilde: digitaltrends.com

Når det er sagt, er disse brillene ikke tilgjengelige på markedet ennå, selv om forskerne sier at disse enkelt kan 3D-printes.

En annen interessant utvikling var lanseringen av ekō briller på Kickstarter. Selv om produktet nå er kansellert, fungerte det på en bemerkelsesverdig enkel idé: vanlige, hverdagslige solbriller for $45 som rett og slett reflekterte lyset, noe som fikk kameraer og videoovervåkingsenheter til å gå gale.

Akkurat som cybersikkerhetsdomenet, låser «hackere» og forskere horn i ansiktsgjenkjenning for kappløpet mot perfeksjon. I rundt 2014 så vi populariteten til kamuflasje sminke som ga usynlighet mot ansiktsgjenkjenning, men som ikke er levedyktige lenger. Vil det være en AES-kryptering av ansiktsgjenkjenning? Bare tiden vil vise!

Er ansiktsgjenkjenning noe for deg?

Den typen virksomhet som kan dra nytte av ansiktsgjenkjenning er den som involverer mennesker – ja, noe som betyr alle virksomheter der ute! Selv om den nåværende bruken av ansiktsgjenkjenning ser ut til å bli forkjempet av myndigheter, store bedrifter eller teknologiske oppstarter, er det ingen grunn til at bedriften din ikke kan dra nytte av det.

Mulighetene er virkelig uendelige når vi kombinerer litt kreativ tenkning – hilse og identifisere kunder på et hotell, finne vennen din i et hav av mennesker, finne personer med lignende ansikter (kanskje for å bli brukt som skuespillere), oppdage personligheter for jobben intervjuer (igjen, vi lar bare fantasien løpe løpsk her; det er kanskje ikke noe vesentlig i en slik studie), tilpasser bankopplevelsen når en kunde med høy verdi kommer inn . . . Det er uendelige måter å bruke ansiktsgjenkjenning på små og store nivåer for å få bedriften til å prestere bedre.

Konklusjon

Ganske snart vil ansiktsgjenkjenning bli så utbredt og så vanlig at vi ikke en gang vil legge merke til det (som mobiltelefoner?). Den underliggende teknologien er nesten perfeksjonert, men i den virkelige verden handler det ikke bare om å oppdage ansikter – det handler om hva vi kan gjøre med den evnen.

Høres det fascinerende ut og interessert i å lære mer? Sjekk ut dette strålende kurs om datasyn.