Přeskočit na obsah

Systém pro rozpoznávání tváře

Z Wikipedie, otevřené encyklopedie
Vlastní tvář (AT&T).

Systém na rozpoznávání tváře (či systém pro rozpoznávání obličeje) je počítačový program na identifikaci osob z fotografií či videí. Rozpoznávání tváří se provádí podle geometrických charakteristik obličeje a porovnává se s databází. Lze určovat i pohlaví a odhadovat věk osob.[1] Automatické rozpoznávání tváří však nefunguje stoprocentně a lze jej zmást.[2][3] Pomocí speciálně navržených brýlí se lze vydávat za někoho jiného.[4] Systém rozpoznávání tváře je používán i bez vědomí uživatelů.[5] Fotografie lze ale upravit tak, aby rozpoznávání tváře selhalo, a to díky speciálnímu softwaru, který obrázek jemně zkreslí, aniž by to pouhé lidské oko rozpoznalo.[6]

Regulace ohledně rozpoznávání se ve skutečnosti úplně nedodržuje.[7] Evropský inspektor ochrany údajů (EDPS) navrhuje úplný zákaz této technologie k obecným účelům.[8]

Historie rozpoznávání obličejů sahá až do 60. let 20. století, kdy byly první pokusy o automatické zpracování obličejů prováděny ručně. V roce 1964 začal výzkum na poli rozpoznávání obličejů, kde byly použity geometrické metody k analýze tváří. Významný pokrok přišel v 90. letech 20. století, kdy začaly být zaváděny pokročilé statistické metody a strojové učení. Tyto metody se staly základem pro dnešní algoritmy, které umožňují rozpoznávání obličejů i za složitějších podmínek.[9]

Základní principy technologie rozpoznávání obličeje

[editovat | editovat zdroj]

Technologie rozpoznávání obličejů zahrnuje několik kroků, které společně zajišťují úspěšnou identifikaci nebo ověření identity na základě obrazu obličeje. Tento proces lze rozdělit do čtyř hlavních fází: detekce obličeje, předzpracování obrazu, extrakce rysů a klasifikace.[10]

Haar Funkce, která vypadá podobně jako hřbet nosu, je aplikována na tvář.

Detekce obličeje je první a nejdůležitější fází systému rozpoznávání obličejů, která určuje, zda se na obrázku nebo videu nachází obličej.[11] Tato fáze obvykle využívá algoritmy pro zpracování obrazu, které identifikují rysy typické pro obličej, jako jsou oči, nos a ústa. Algoritmy jako Haarův kaskádový klasifikátor nebo modernější metody založené na hlubokém učení (například konvoluční neuronové sítě) hrají roli v detekci obličeje i v dynamických podmínkách, například na přeplněných veřejných místech.[12]

Předzpracování obrazu zahrnuje techniky, které připravují obraz pro další analýzu. Techniky zahrnují normalizaci, která transformuje obrazy různých velikostí a měřítek do jednotné podoby, a zarovnání obličeje, které lokalizuje body, jako jsou oči, nos a ústa, pro standardizaci orientace obličeje.[10]

Další důležitou částí předzpracování je vylepšení obrazu, což zahrnuje odstraňování šumu a zvyšování kontrastu pro zlepšení kvality. Například osvětlení může ovlivnit jasnost a detaily obrazu, což může vést ke špatné identifikaci. Použití histogramové ekvalizace nebo Gaborových filtrů pomáhá tyto problémy řešit. Tyto techniky zajišťují, že obraz obličeje je optimální pro další analýzu.[10]

Extrakce rysů je proces, při kterém jsou z obrazu obličeje získávány charakteristiky, které reprezentují identitu jednotlivce. Cílem je redukovat velké množství dat na menší sadu informací, které jsou dostatečné pro klasifikaci. Klíčové metody zahrnují analýzu hlavních komponent (PCA) a lokální binární vzory (LBP), které zdůrazňují jedinečné rysy, jako je textura kůže nebo geometrie obličeje.[12]

Klasifikace rysů je závěrečným krokem, kde jsou extrahované rysy porovnávány s databází známých obličejů. Algoritmy jako k-nejbližší soused, podporované vektorové stroje (SVM) nebo konvoluční neuronové sítě (CNN) přiřazují obraz k příslušné třídě na základě minimální odchylky nebo pravděpodobnosti shody. Tato fáze zahrnuje jak ověřování identity (ověření jednoho obličeje), tak identifikaci (porovnání obličeje s více obrazy v databázi).[12]

Faktory ovlivňující rozpoznávání obličeje

[editovat | editovat zdroj]

Navzdory pokrokům v technologii rozpoznávání obličejů čelí systémy mnoha problémům, zejména v reálných a nekontrolovaných podmínkách. Tyto výzvy zahrnují osvětlení, variace póz, výrazy obličeje, plastické operace, stárnutí, nízké rozlišení a zakrytí obličeje, což často vede k nesprávné identifikaci.[10]

Osvětlení může způsobit, že obličej vypadá na snímku jinak, i když se jedná o stejnou osobu. Stíny a změny kontrastu ztěžují systémům správné rozpoznání.[11] Řešení zahrnují histogramovou ekvalizaci, 3D modely a extrakci rysů pomocí Gaborových filtrů. Přesto osvětlení zůstává jedním z hlavních problémů v nekontrolovaných podmínkách.[10]

Rozdílné úhly pohledu, například při otáčení hlavy, mohou způsobit, že systém selže. Řešením je využití 3D modelů nebo databází s různými pózami, které umožňují lepší trénink algoritmů.[13] Výrazy obličeje mění geometrii obličeje a komplikují identifikaci. Moderní přístupy využívají hluboké učení a extrakci stabilních geometrických rysů, například vzdáleností mezi klíčovými body.[13]

Plastické operace, jako je facelifting nebo úprava nosu, dramaticky mění vzhled obličeje, což ztěžuje rozpoznání.[14] Algoritmy využívající Gaborovy filtry a texturální rysy pomáhají tento problém zmírnit, ale další výzkum je stále potřeba.[12]

Stárnutí mění strukturu obličeje a vzhled vrásek, což ovlivňuje přesnost rozpoznání. Databáze, jako FGNET a MORPH, slouží k tréninku algoritmů odolných vůči stárnutí.[12] Moderní metody, například auto-enkodéry, umožňují lépe modelovat proces stárnutí a identifikovat stabilní rysy.[12]

Nízké rozlišení snímků, například z bezpečnostních kamer, vede ke ztrátě detailů obličeje, což snižuje přesnost. Metody super-rozlišení nebo přizpůsobení algoritmů nízko-rozlišovacím datům mohou tento problém částečně řešit.[9]

Metody v rozpoznávání obličejů

[editovat | editovat zdroj]

Metody a algoritmy v rozpoznávání obličejů se vyvíjely od tradičních přístupů až po moderní techniky založené na hlubokém učení. Tradiční metody, jako PCA a LDA, byly klíčové v raných fázích výzkumu.[10] Zatímco moderní algoritmy, například CNN, přinesly zásadní pokroky v přesnosti a robustnosti v reálných podmínkách.[12]

Analýza hlavních komponent (PCA) byla jednou z prvních technik použitých pro redukci dat při rozpoznávání obličejů. Metoda zdůrazňuje klíčové rysy, které umožňují klasifikaci, a její efektivita spočívá v jednoduchosti a rychlosti. Nicméně, PCA není schopna dostatečně dobře řešit komplexní variace v obrazech, což omezuje její použitelnost v reálném světě.[9]

Lineární diskriminační analýza (LDA) na rozdíl od PCA klade důraz na odlišnost mezi jednotlivými třídami. Tato metoda je ideální pro rozpoznávání obličejů v prostředích, kde je potřeba vysoká přesnost klasifikace. LDA však naráží na omezení při vysoké variabilitě vstupních dat, což vyžaduje její kombinaci s jinými metodami.[9]

Konvoluční neuronové sítě (CNN) jsou považovány za nejvýkonnější metodu v rozpoznávání obličejů. Automaticky extrahují klíčové rysy, což eliminuje nutnost manuálního výběru. Díky své flexibilitě zvládají širokou škálu scénářů, například rozpoznání při různých úhlech nebo osvětlení.[13]

Lokální binární vzory (LBP) poskytují efektivní reprezentaci textur a jsou často využívány v kombinaci s jinými algoritmy. Díky své jednoduchosti a nízkým výpočetním nárokům se LBP hodí pro aplikace, kde je klíčová rychlost.[12]

Nezávislá komponentní analýza (ICA) umožňuje odhalit nezávislé struktury v datech, což zlepšuje schopnost systému analyzovat obličejové rysy v prostředích s vysokou variabilitou. Tato metoda je účinná zejména tam, kde PCA selhává.[12]

Lineární reprezentace (LRC) využívá lineární kombinaci tréninkových vzorků k reprezentaci testovacího vzorku a následně určují příslušnost k třídě na základě minimální odchylky (rezidua). Tyto metody zahrnují tři kroky: kódování, při kterém se počítají koeficienty lineární kombinace, aproximaci podprostoru, kde se analyzují příslušnosti k jednotlivým třídám, a klasifikaci, která přiřazuje vzorku třídu s nejnižší odchylkou.[15]

  1. Microsoft age-estimate tool unleashed real-time virality. techxplore.com [online]. [cit. 2020-02-03]. Dostupné online. (anglicky) 
  2. Brýle pro milovníky soukromí. www.osel.cz [online]. osel.cz [cit. 2020-02-03]. Dostupné online. 
  3. VR rendering software used to trick facial security systems. techxplore.com [online]. [cit. 2020-02-03]. Dostupné online. (anglicky) 
  4. Who are you looking at? Glasses fool face recognition software. techxplore.com [online]. [cit. 2020-02-03]. Dostupné online. (anglicky) 
  5. ČTK. Facebook urovnal 550 miliony USD žalobu kvůli rozpoznávání tváří. ITBiz.cz [online]. Nitemedia, 2020-02-02 [cit. 2020-02-03]. Dostupné online. 
  6. Image cloaking tool thwarts facial recognition programs. techxplore.com [online]. [cit. 2020-08-05]. Dostupné online. (anglicky) 
  7. https://www.lupa.cz/clanky/rozpoznavani-obliceju-na-papire-regulace-praxe-je-ale-kontroverznejsi/ - Rozpoznávání obličejů: na papíře regulace, praxe je ale kontroverznější
  8. https://www.ceskenoviny.cz/zpravy/edps-technologie-rozpoznavani-obliceje-by-mela-byt-v-eu-zakazana/2027166 - EDPS: Technologie rozpoznávaní obličeje by měla být v EU zakázána
  9. a b c d LI, Dong-Lin; PRASAD, Mukesh; HSU, Sheng-Chih. Face recognition using nonparametric-weighted Fisherfaces. EURASIP Journal on Advances in Signal Processing. 2012-12, roč. 2012, čís. 1. Dostupné online [cit. 2024-12-19]. ISSN 1687-6180. DOI 10.1186/1687-6180-2012-92. (anglicky) 
  10. a b c d e f LI, Lixiang; MU, Xiaohui; LI, Siying. A Review of Face Recognition Technology. IEEE Access. 2020, roč. 8, s. 139110–139120. Dostupné online [cit. 2024-12-19]. ISSN 2169-3536. DOI 10.1109/ACCESS.2020.3011028. 
  11. a b SCHERHAG, Ulrich; RATHGEB, Christian; MERKLE, Johannes. Deep Face Representations for Differential Morphing Attack Detection. IEEE Transactions on Information Forensics and Security. 2020, roč. 15, s. 3625–3639. Dostupné online [cit. 2024-12-19]. ISSN 1556-6013. DOI 10.1109/TIFS.2020.2994750. 
  12. a b c d e f g h i OLOYEDE, Muhtahir O.; HANCKE, Gerhard P.; MYBURGH, Hermanus C. A review on face recognition systems: recent approaches and challenges. Multimedia Tools and Applications. 2020-10, roč. 79, čís. 37-38, s. 27891–27922. Dostupné online [cit. 2024-12-19]. ISSN 1380-7501. DOI 10.1007/s11042-020-09261-2. (anglicky) 
  13. a b c ALMABDY, Soad; ELREFAEI, Lamiaa. Deep Convolutional Neural Network-Based Approaches for Face Recognition. Applied Sciences. 2019-10-17, roč. 9, čís. 20, s. 4397. Dostupné online [cit. 2024-12-19]. ISSN 2076-3417. DOI 10.3390/app9204397. (anglicky) 
  14. SANCHEZ DEL RIO, Jose; MOCTEZUMA, Daniela; CONDE, Cristina. Automated border control e-gates and facial recognition systems. Computers & Security. 2016-09, roč. 62, s. 49–72. Dostupné online [cit. 2024-12-19]. DOI 10.1016/j.cose.2016.07.001. (anglicky) 
  15. ZHOU, Jianhang; ZENG, Shaoning; ZHANG, Bob. Linear Representation-Based Methods for Image Classification: A Survey. IEEE Access. 2020, roč. 8, s. 216645–216670. Dostupné online [cit. 2024-12-19]. ISSN 2169-3536. DOI 10.1109/ACCESS.2020.3041154. 

Související články

[editovat | editovat zdroj]


Externí odkazy

[editovat | editovat zdroj]