Introduktion af en tilpasset softwareløsning til ansigtsgenkendelse

Innowise har udviklet en avanceret ansigtsgenkendelsesløsning for at øge sikkerheden og effektivisere identifikationsprocesserne.

Kunde

Industri
Region
AU
Kunde siden
2022

Vores kunde er en australsk softwareudviklings- og it-konsulentvirksomhed, der har specialiseret sig i at levere skræddersyede it-løsninger til detailbranchen. Med en stærk track record har de med succes konceptualiseret, designet og lanceret digitale løsninger på tværs af forskellige detailkategorier, herunder general merchandise, tøj og dagligvarer.

Virksomheden opererer på globalt plan - lige fra multinationale detailkoncerner til uafhængige butiksejere - og tilbyder en række meget skalerbare produkter og tjenester.

Udfordring

Forbedring af ansigtsgenkendelsens nøjagtighed for detailbranchen

Til at begynde med virkede opgaven ligetil: at udvikle en ansigtsgenkendelsesløsning, der pålideligt kunne identificere personer i realtid i detailhandelsmiljøer. Men alle, der kender til videofeeds fra den virkelige verden, ved, at de sjældent er perfekte.

Den største udfordring var inkonsekvent videokvalitet. Indstillingerne i detailhandlen er uforudsigelige - kameraerne optager ofte i dårlig belysning, fra akavede vinkler og i konstant bevægelse. Derfor fremstod ansigter slørede, skyggede eller forvrængede, hvilket gjorde det vanskeligt for systemet at registrere og justere kritiske ansigtstræk som øjne, næse og mund.

I nogle tilfælde skjulte ujævn belysning ansigtsdetaljer, mens kombinationen af sløring og skygger i andre tilfælde gjorde traditionelle genkendelsesmetoder ineffektive. Det var ikke lejlighedsvise problemer - det var de daglige forhold, vores team skulle håndtere.

For at overvinde dette havde vi brug for mere end avancerede algoritmer. Vores ingeniører var nødt til at designe et system, der kunne behandle ufuldkomne, rodede input - udtrække meningsfulde data fra inkonsekvent video af lav kvalitet for at levere klare og brugbare resultater. Kort sagt skulle den tilpassede softwareløsning til ansigtsgenkendelse arbejde med udfordringer fra den virkelige verden, ikke kæmpe imod dem.

Løsning

Øget sikkerhed og effektivitet i detailhandlen med et ansigtsgenkendelsessystem

Vores teams tilgang til udvikling af brugerdefineret ansigtsgenkendelsessoftware fokuserede på tre kritiske mål: nøjagtighed, realtidsbehandling og tilpasningsevne til input af lav kvalitet.

Pålidelig ansigtsregistrering og -genkendelse

I kernen af løsningen har vi integreret avancerede deep learning-algoritmer for at sikre præcis ansigtsregistrering og -genkendelse, selv under krævende forhold som dårlig belysning, usædvanlige vinkler og input i lav opløsning.

Registrering og justering af ansigter

Vi brugte RetinaFace på grund af dets hastighed og nøjagtighed i ansigtsgenkendelse, som især udmærker sig i billeder med lav opløsning og udfordrende lysforhold. Vi valgte MediaPipes detektion af ansigtets pejlemærker til at identificere og justere kritiske træk som øjne, næse og mund. Som følge heraf kunne systemet håndtere forskellige input med større stabilitet og nøjagtighed. Dette muliggjorde en konsekvent forbehandling af ansigter, selv under forkert justering eller usædvanlige vinkler.

Præcise modeller til ansigtsgenkendelse

Til ansigtsgenkendelse brugte vi ArcFace-teknikken, der er kendt for sin stærke præstation i at generere diskriminerende ansigtsindlejringer. For at optimere nøjagtigheden i detailmiljøer finjusterede teamet backbone-modellen ved hjælp af domænespecifikke data med målrettede udvidelser, herunder simuleret sløring og vinkelforvrængning. Som et resultat opnåede systemet 85-90% nøjagtighed i ansigtsgenkendelse under udfordrende forhold og opretholdt over 95% nøjagtighed med input af høj kvalitet.

Forbedringer af billednøjagtighed og systemets ydeevne

Overvågningsoptagelser har ofte fejl, så som en del af vores udviklingsydelser til ansigtsgenkendelse har vi udviklet en robust billedforarbejdningspipeline til at rense input før genkendelse.

Et af de vigtigste gennembrud, vi bragte ind, var øjenlokalisering. Integrationen af MediaPipe-pipelines forbedrede systemets evne til at registrere øjnenes pupilcentre. Det forbedrede i høj grad ansigtsjusteringen og stabiliseringen, så vi kunne filtrere de billeder fra, der enten var dårligt optaget eller forkert justeret. På den måde gik kun rene billeder af høj kvalitet til genkendelse, hvilket forbedrede den samlede systemnøjagtighed.

Effektiv batch-billedbehandling

Vi havde brug for at håndtere store mængder videodata, så vi skabte et batch-billedbehandlingsmodul ved hjælp af PyTorch og MediaPipe.

Vi udviklede også et modul til at udtrække og behandle billeder fra videofeeds i bulk, hvilket sparer tid og reducerer den manuelle indsats. Det optimerede system håndterer store datamængder problemfrit, selv i travle detailmiljøer.

Integration med et CCTV-system

Integrationen af brugerdefineret ansigtsgenkendelsessoftware med et CCTV-system (closed-circuit television) indebærer, at man kombinerer avanceret ansigtsgenkendelsesteknologi med den eksisterende overvågningsinfrastruktur. Denne integration omkonfigurerer overvågningskapaciteten og giver mulighed for præcis identifikation i realtid af personer i butikker eller lagerbygninger. Et sådant system skærper sikkerhedsforanstaltningerne mod uautoriseret adgang og optimerer medarbejderstyringen gennem sporing af fremmøde og overvågning af arbejdsadfærd. Med en sådan holistisk tilgang bliver miljøet i enhver detailforretning meget mere sikkert og effektivt.

Nu får den tilpassede ansigtsgenkendelsesløsning adgang til live video-feeds fra CCTV-kameraer og anvender PyTorch- og MediaPipe-baserede algoritmer til at registrere og analysere unikke ansigtstræk, som f.eks. formen på øjne, næse og mund.

Ved hjælp af modeller til genidentifikation af personer (Re-ID) sporer systemet personer fra et kamera til et andet, selv med okklusion eller mens de bevæger sig fra en zone til en anden. Kombineret med streamet behandling på rammeniveau drevet af PyTorchs inferensfunktioner understøtter systemet også genkendelse i realtid med en latenstid på under 200 ms, selv på tværs af flere livestreams.

Teknologier

AWS (Kinesis Video Streaming, EC2, EKS, ECR, S3, Glue)
GitHub-handlinger, Kubernetes, Nginx
PyTorch, MediaPipe

VCS

Git, GitHub

Proces

Vi begyndte med intensive workshops for at forstå projektmålene og de aktuelle udfordringer - som at håndtere dårlig videokvalitet, muliggøre realtidsbehandling og sikre, at systemet kunne skaleres. Vores team udførte en detaljeret revision af kundens CCTV-opsætning og vurderede kameratyper, billedhastigheder og videokvalitet for at sikre, at den tilpassede ansigtsgenkendelsessoftware ville fungere pålideligt under virkelige forhold.

Planlægning af systemdesign og arkitektur

Dernæst designede vores team en skalerbar, distribueret arkitektur, der kunne behandle flere livestreams samtidigt. Hver del af systemet - ansigtsregistrering, forbehandling og genkendelse - blev bygget som en uafhængig komponent, hvilket sikrede et jævnt dataflow og fejltolerance. Vi kortlagde også integrationspunkter for at forbinde løsningen med kundens eksisterende CCTV-netværk.

Udvikling og implementering

Vi fulgte en agil udviklingstilgang, hvor vi leverede resultater i etaper og indsamlede regelmæssig feedback for at forbedre systemet. Her kan du se, hvordan vi tacklede hvert enkelt kritisk område:

  • Registrering og justering af ansigter: Vores ingeniører byggede og optimerede detektionspipelinen for at stabilisere indgående video og håndtere udfordringer som inkonsekvent belysning, usædvanlige vinkler og bevægelse.
  • Forbehandling af billeder: Vores team forbedrede videobilleder med filtrering og stabilisering og sikrede, at kun rene, brugbare billeder blev sendt videre til genkendelse.
  • Genkendelsesmodeller: Ved hjælp af virkelige videoeksempler finjusterede vi genkendelsespipelinen, så den præcist kunne identificere ansigter, selv under ekstreme vinkler eller delvise forhindringer.
  • Optimering af batchbehandling: For at håndtere store videomængder effektivt har vi optimeret workflows til batchbehandling af arkiverede optagelser og samtidig reduceret belastningen på realtidsoperationer.

Ved hvert sprint gennemførte vi grundig testning og overvågning af ydeevnen for at løse flaskehalse og understøtte ensartet fremgang.

Testning og validering

Vores QA-specialister sætter systemet på prøve for at validere dets ydeevne under virkelige forhold. forhold:

  • Funktionel afprøvning: Hvert modul blev testet individuelt og som en del af den samlede pipeline.
  • Stresstest: Vores team evaluerede systemets evne til at behandle flere kamerastrømme under store belastninger.
  • Validering i den virkelige verden: Ved hjælp af faktiske videofeeds fra detailhandlen bekræftede vi, at systemet leverede ensartede resultater selv med dårlig belysning, bevægelsessløring eller lav opløsning.
  • Test af kanttilfælde: Vores team testede udfordrende scenarier som delvise ansigter og ekstreme vinkler for at garantere robusthed og pålidelighed.

Under hele testen sporede vi præstationsmålinger - nøjagtighed, hastighed og afvisning af billeder - og finjusterede systemet for at opnå optimale resultater.

Udrulning og integration

Da den tilpassede ansigtsanalysesoftware var klar, implementerede vores team den i kundens produktionsmiljø produktionsmiljø med minimal afbrydelse. Systemet blev konfigureret til at behandle live videostrømme og integrere ubesværet med den eksisterende CCTV-infrastruktur. For at sikre en problemfri udrulning leverede vi også træningssessioner og detaljeret dokumentation til kundens team.

Vedligeholdelse og support efter udrulning

Som en del af vores rolle som virksomhed, der udvikler software til ansigtsgenkendelse, leverer vi løbende opdateringer og support for at forbedre systemets effektivitet og skalerbarhed.

Hold

1

Forretningsanalytiker

1

Projektleder

1

ML Engineer

1

QA

1

Backend-udvikler

1

Front-end udvikler

Resultater

Forbedret sikkerhed og strømlinet ansigtsidentifikation

Vores team leverede et ansigtsgenkendelsessystem, der med succes håndterede vigtige udfordringer i den virkelige verden, herunder lav opløsning, dårlig belysning og bevægelsessløring. Gennem omhyggeligt design og optimering forbedrede vi driftseffektiviteten med 70% og reducerede medarbejdernes verifikationstid fra 20 sekunder til under 5 sekunder pr. person.

Vores ingeniører sørgede for, at systemet kunne håndtere krævende arbejdsbyrder ved at implementere effektive behandlingspipelines. Resultatet er, at det nu behandler tusindvis af ansigter i sekundet på tværs af flere videostrømme. Ved at bruge GPU-optimeret AWS-infrastruktur og finjustere ydeevnen var vi i stand til at holde tingene kørende og konsistente, selv i spidsbelastningsperioder.

Vores indsats har også styrket sikkerhedsresultaterne. De advarselsmekanismer i realtid, som vores team har udviklet, gør det muligt for systemet at generere øjeblikkelige meddelelser om uautoriserede personer. Som følge heraf faldt sikkerhedsresponstiderne med 40%, hvilket gjorde det muligt for teams på stedet at handle hurtigere og forbedre den overordnede situationsbevidsthed.

Pålidelighed var et centralt fokus i hele projektet. Vores teams optimeringer sikrede 99,9% oppetid og sørgede for uafbrudt drift af kritiske processer som adgangskontrol og liveovervågning. Problemfri integration med kundens eksisterende systemer bidrog yderligere til en reduktion på 20-25% i sikkerhedsrelaterede hændelser og hjalp detailhandlere med at skabe sikrere og bedre administrerede miljøer.

Alt i alt viste løsningen sig at være hurtig, præcis og skalerbar. Den optimerede ikke kun sikkerheden, men forenklede også fremmødehåndteringen og forbedrede de daglige arbejdsgange, hvilket gav håndgribelige resultater i detailhandlen.

Projektets varighed
  • Maj 2022 - oktober 2022
99.8%
verifikationer under 200 ms pr. billede på GPU-optimerede AWS-instanser
85-90%
Nøjagtighed i ansigtsgenkendelse i svag belysning eller bevægelsessløring

50%

Færre manuelle indgreb med pålidelig automatisk identifikation

    Kontakt os

    Book et opkald eller udfyld formularen nedenfor, så vender vi tilbage til dig, når vi har behandlet din anmodning.

    Send os en talebesked
    Vedhæft dokumenter
    Upload fil

    Du kan vedhæfte 1 fil på op til 2 MB. Gyldige filformater: pdf, jpg, jpeg, png.

    Ved at klikke på Send accepterer du, at Innowise behandler dine personlige data i henhold til vores Politik for beskyttelse af personlige oplysninger for at give dig relevante oplysninger. Ved at indsende dit telefonnummer accepterer du, at vi kan kontakte dig via taleopkald, sms og beskedapps. Opkalds-, besked- og datatakster kan være gældende.

    Du kan også sende os din anmodning
    til contact@innowise.com

    Hvad sker der nu?

    1

    Når vi har modtaget og behandlet din anmodning, vender vi tilbage til dig for at beskrive dine projektbehov og underskriver en NDA for at sikre fortrolighed.

    2

    Når vi har undersøgt dine ønsker, behov og forventninger, udarbejder vores team et projektforslag med forslag med arbejdets omfang, teamstørrelse, tids- og omkostningsoverslag.

    3

    Vi arrangerer et møde med dig for at diskutere tilbuddet og få detaljerne på plads.

    4

    Til sidst underskriver vi en kontrakt og begynder at arbejde på dit projekt med det samme.

    pil