Vaizdo atpažinimo technologijos: kam priklauso mūsų veidai?

Nauji telefonai nuotraukas albumuose atpažįsta nebe pagal jų pavadinimus, o žiūrėdami į vaizdą. Ananasą atpažįsta todėl, kad prieš tai matė tūkstančius nuotraukų, kuriose ananasas užfiksuotas skirtingais kampais, skirtingame apšvietime. Pataiko teisingai 96,36 proc.? Good enough, ananaso nuotrauka rasta. Už tai reikia dėkoti kompiuterio mokymosi (machine learning) technologijoms, kurios vaizdo atpažinimą pakėlė į aukštesnį lygį.Bandau įsivaizduoti, kaip tokia technologija atrodys ateityje. Kada pagaliau googlinant atsakymą rasiu ir vaizdo įrašuose, ne vien jų apraše ir priskirtuose raktiniuose žodžiuose (keywords).

Kada galėsiu įvesti į paieškos sistemą Lukas Keraitis ir rasti visus vaizdus, kuriuose šmėsteli mano veidas? Galbūt atrasiu save japono turisto internetan įkeltoje atostogų nuotraukoje: matausi grupinės nuotraukos fone, sėdintis ant Rotušės laiptų? O gal drono filmuotame vaizdo įraše esu vienas iš daugelio besiklausančių koncerto Katedros aikštėje? Geltonas kvadratas apves mano veidą nurodydamas, čia – tu.

Tu – atpažįstamas

Nenustembame, kai, taggindami savo draugą „Facebooko“ nuotraukoje, gauname teisingą vardo pasiūlymą įvedę vos vieną raidę. „Facebookas“ žino, kaip mes atrodom. Bala nematė – juk jis apie mus ir taip viską žino, tiesa?

Bet iki šiol mūsų veidas technologijų pasaulyje buvo labiau naršyklės plėtinys nei kasdienis įrankis. Tai lyg ir norėtų pakeisti „iPhone X“, telefono atrakinimui naudojantis biometrinius veido duomenis. Ar atiduoti tokią informaciją į koorporacijų rankas yra praktikška ar naivu? Patogumas vs. privatumas yra modernybiškas klausimas, į kurį atsakinėti... tingim?

Kažkada pirštų antspaudų panaudojimas telefono atrakinimui irgi buvo nejauki futuristinė naujiena. Normalizacija čia įvyko palengva ir dabar išmaniojo funkcija „atrakinti nykščio antspaudu“ verčiasi tiesiog greičiau ir patogiau. Ar taip pat bus ir su mūsų veidais? Ar įprasime juos naudoti atrakinimui, patvirtinimui, atsiskaitymui, išsisaugojimui, nuspėjimui...? Technologiniai sprendiniai jau už kampo, o kartais ir programėlių parduotuvėje.

Tu – pornožvaigždė

Neseniai nuskambėjo „Deepfakes“ incidentas: internete (visų pirma – Reddit subredite r/deepfakes) išpopuliarėjo pornografiniai vaizdo įrašai, kuriuose aktorių veidai kokybiškai pakeisti įžymybių veidais. Dažnai – labai įtikinamai:

Tačiau ne visuomet:

Nauja čia tai, kad veidą pakeisti netikru galėjo beveik kiekvienas, turintis šiek tiek programavimo žinių ir parsisiuntęs „FakeApp“ programėlę (>200 000 parsisiuntimų).

Tiesa, reikės didelės apskaičiavimo galios (gero kompiuterio, nes kitaip nepaveš). Bent jau kol kas. Štai ką sugeba vos viena vaizdo plokšte varoma vaizdo (žmonių) atpažinimo programa:

Garsenybės nukentėjo pirmiausia todėl, kad jų veido nuotraukų internete devynios galybės, tad jais apmokyti programą yra gerokai lengviau. Tačiau įskaudintos liko ir gabių programišių pažįstamos, buvusios klasiokės...

„Reddit“ ir kiti tinklalapiai netrukus susigriebė ir ištrynė su „Deepfakes“ susijusį turinį. Atskiro paminėjimo verti herojai, kurie pornografinį turinį bandė atskiesti gausiu kiekiu vaizdo įrašų su Nicolo Cage‘o veidu ant pornožvaigždžių galvų. Nešvankūs vartotojai dėl to nebuvo patenkinti.

Tu ir gražesnis tu

Tai nėra pirmas kartas, kai žmonių veidai tampa kieno nors nuosavybe. Prieš trejus metus fotografas Egoras Tsvetkovas pasidalino savo eksperimento rezultatais. Sankt Peterburgo metro traukiniuose jis slapčia fotografavo žmones ir, naudodamas vis dar veikiančią programą „FindFace“, pagal veido nuotraukas rado keleivių profilius socialiniame tinkle „Vkontakte“.

Pagrindinis fotografo tikslas buvo palyginti žmonių internete kuriamą įvaizdį su realybe. Atrasti žmogų pagal metro darytą nuotrauką jam pavyko 70 proc. iš visų mėginimų. Jei toks įrankis veiktų su „Facebook“, sujudimas, matyt, būtų kilęs daug didesnis.

Su „Facebook“ duombaze tai atrodytų tarsi žmonių „Shazam“ – nukreipi kamerą, palauki dvi sekundes ir ekrane išvysti asmens vardą, pavardę bei mygtuką apačioje „Send Message?“.

Tu ir tavo jausmai

Kaip neseniai aprašė „The Financial Times“, vaizdo atpažinimo technologijos mokosi ne tik identifikuoti, kas mes esame, bet ir kaip mes jaučiamės. Londone įskūręs startuolis „Human“ vaizdo įraše analizuoja kandidatų į darbo vietą asmenines savybes. Ne, ne emocijas, o asmenines savybes.

Algoritmai neva gali apibūdinti tokias individualias charakteristikas kaip sąžiningumas ar aistringumas (?). Keistas programos kūrėjų manymas, kad interviuotojas yra šališkas, o programa – ne. Visi algoritmai yra šališki, tačiau niekas (kartais – net patys kūrėjai) nežino, į kurią pusę tas šališkumas linksta.

Kol „Google“ pripažįsta, kad jos veido atpažinimo algortimai nesugeba atskirti juodaodžio žmogaus nuo gorilos, nenoriu, kad darbo pokalbyje programinė įranga vertintų, kaip labai atviraširdiškas esu.

Tu... ar ne tu?

Vaizdo atpažinimo programas jau dabar galima apgauti. Kol kas tai sudėtinga, nors pavyko ne kartą. Pavyzdžiui, šalia atvaizdo padedant mažą psichodelinių spalvų lipduką. Tarsi haliucinacija toks raštas sugeba įtikinti kompiuterį, kad jis mato kitką nei pateikiama realybėje.

Bananą supainioti su skrudintuvu nėra pasaulio pabaiga, tačiau jei tokiais buitiškais būdais tikrai galima apgauti vaizdo atpažinimo programas, gal pastarąsias reiktų vadinti... vaizdą atpažindi besistengiančiomis technologijomis?

Yra ir kitokių būdų paslėpti savo veidą nuo sumanių algoritmų. Jei būčiau Čempionų lygos (Champions League) gerbėjas su prasta teisinių nusižengimų istorija, į finalines rungtynes mėginčiau patekti pasigaminęs vieną iš kelių eskperimentinių veido atpažinimo programas apgaunančių kaukių.

O gal užsidėjęs tuo pačiu tikslu kurtus funky akinukus?

Kol kas tokios kaukės kuriamos kaip meninės manifestacijos, o ne įrankiai nusikaltėliams. Tačiau kodėl neišmėginti bandant patekti į futbolo stadioną, kurio įėjimai prigrūsti kamerų, galinčių atpažinti veidus ir patikrinti juos nusikaltėlių veidų duombazėje. Paskutinėse rungtynėse susimušei su kitos komandos sirgaliais? Banas vienam sezonui! Beje, coming soon to a metro station near you!

Ar tokios kaukės veiktų Kinijoje, kur policininkai jau dabar naudoja išmanius akinius, skenuojančius žmonių veidus ir randančius, umm, tuos, kurių ieškojo?

Prieš kurį laiką dvidešimt penki nusikaltėliai kinai buvo suimti jų veidus atpažinus prie įėjimo į alaus festivalį. Kinija šioje temoje yra išskirtinė ir, žiūrint iš Vakarų pusės, ekstremali. Nors (spėlioju), kinai tiesiog mėgaujasi moderniojo pasaulio gerybėmis, pragmatiškumą statydami aukščiau privatumo.

Kinija, Europa bei JAV tiek kultūriškai, tiek teisiškai į asmeninių duomenų privatumą žiūri labai skirtingai. Bet tai jau kitas klausimas.

Tu ir tavo veidas

Tačiau yra rugiapjūtė klaustuku besibaigiančių minčių, kurioms jau derlius. Galima, pavyzdžiui, klausti labai pragmatiškai ir kasdieniškai. Argi nebūtų gražu į virtualų renginio aprašą įdėti perspėjimą, jei tame renginyje žmonės bus fotografuojami ir keliami į internetą? Nežinau, kokia nauda draugams pamatyti mane renginio „Kaip kalbant nesispjaudyti?“ virtualiame albume.

Galima klausti ir gerokai, gerokai plačiau: kur yra riba tarp veido ir identiteto? Tarp asmens ir jo atvaizdo? Tarp reprezentacijos ir realybės?