(Samsung nuotr.)

Fizionominis pramoninis kompleksas

Fizionominis pramoninis kompleksas

Plinta vis geresnės ir pigesnės veido atpažinimo technologijos

Ekskursija po „Megvii“ būstinę Pekine primena apsilankymą Didžiojo Brolio mašinų centre. Vestibiulyje įrengta vaizdo kamera akimirksniu atpažįsta lankytojus. Tokių įrenginių gausu visame biure. Dalis fiksuojamų vaizdų rodomi ant vaizdo įrašų sienos, dirbtinio intelekto (DI) sistemos iš filmų apie terminatorių garbei pavadintos „Skynet“. Viename ekranų – grupė lifto laukiančių darbuotojų. Visų veidai apvesti baltais rėmeliais, šalia rodomi jų vardai. Paklausus apie orvelišką tokios tvarkos prieskonį, startuolės vadovas Yin Qi tiesiog pabrėžia, kad „tai padeda gaudyti blogiukus“.

Net jei Yin Qi norėtų pamąstyti apie tokių technologijų potekstę, jis neturėtų laiko. „Megvii“ intensyviai kuria, jo žodžiais, vizualinės kompiuterijos smegenis. 2011 m. įkurta bendrovė (pavadinimas reiškia „megavizija“) nuėjo ilgą kelią. Jos veidų atpažinimo technologiją „Face++“ visame pasaulyje naudoja apie 300 tūkst. įmonių ir asmenų, taigi tai – viena didžiausių tokio tipo paslaugų. Gruodį „Megvii“ surinko 100 mln. JAV dolerių ir jos įvertinimas beveik pasiekė 2 mlrd. JAV dolerių, tad bendrovė tapo pirmąja pasaulyje milijardine sektoriaus, kurį galima pavadinti fizionominiu pramoniniu kompleksu, startuole.

Šios srities tiekėjai siūlo aparatinę įrangą ir programines priemones, kurios gali atpažinti veidus ir juos susieti su kitais naudingais duomenimis. Nors rinka palyginti maža (optimistiškiausiais vertinimais, verta kelių milijardų dolerių), pati technologija veržiasi į platesnius verslo vandenis. Pagrindinė priežastis – sparčiai tobulėjantis veidų atpažinimo tikslumas, einantis kalbos atpažinimo pramintu keliu. Pastarasis realiai įsitvirtino tikslumui įveikus kelis paskutinius procentinius punktus ir priartėjus prie 100 proc. „Dauguma žmonių tinkamai neįvertina skirtumo tarp 95 ir 99 proc. tikslumo – 99 proc. viską keičia“, – apie kalbos atpažinimą sakė žymus DI tyrinėtojas Andrew Ngas.

Negana to, išmanusis telefonas veidams atpažinti pasitarnaus, kaip kalbai atpažinti pasitarnavo išmanieji garsiakalbiai, pavyzdžiui, „Amazon Echo“, – prie naujovės pripratins vartotojus. Milijonai kinų jau patvirtina mokėjimus veidu „perbraukę“ išmaniuoju telefonu. Rugsėjo 12 d. „Apple“ pristatė naują „iPhone“ versiją, kurioje įdiegta technologija, galinti patikimai nustatyti savininko veidą ir atrakinti įrenginį net tamsoje. Buvo praėjusios vos kelios savaitės, kai „Samsung“ pademonstravo naują „Galaxy Note“ su panašia funkcija, nors paprastesne.

Verta išskirti dvi veidų atpažinimo technologijų kategorijas – pamatinę funkciją ir ją naudojančias programas. „Megvii“ siūloma „Face++“ priklauso pirmajai kategorijai, kaip ir panašūs produktai, siūlomi dar vienos kinų startuolės „SenseTime“, rusų bendrovės „NTechLab“, taip pat „Amazon“, IBM ir „Microsoft“. Visos šios bendrovės veidų atpažinimą siūlo kaip debesijos paslaugą. Įkėlę krūvą nuotraukų ir vardų „Megvii“ klientai gali pagal šiuos duomenis išmokyti algoritmus vėliau atpažinti tuos žmones. Taip pat įmonės gali atpažinimo paslaugą integruoti į savo produktus, pavyzdžiui, prieigai prie internetinių paskyrų kontroliuoti.

„Megvii“ ir „SenseTime“ paslaugose dažniausiai naudojami geri duomenys. Jos gauna teisę naudotis Kinijos valdžios vaizdų duomenų baze, apimančia 700 mln. piliečių, kurie visi sulaukę 16 metų įgyja tapatybės dokumentą su nuotrauka. Kinų valstybės įstaigos taip pat vertingos klientės – greitai vis daugiau iš šimtų milijonų šalies stebėjimo kamerų atpažins veidus. Šendžene atpažįstant veidus identifikuojami neleistinoje vietoje gatvę perėję žmonės – vardai ir nuotraukos rodomi ekrane (žr. nuotr.). Pekino savivaldybė šią technologiją pradėjo naudoti tualetinio popieriaus iš viešųjų tualetų pasigviešusiems vagims gaudyti (sistema taip pat neleidžia per devynias minutes paimti daugiau kaip 60 centimetrų ilgio popieriaus).

(Vida press nuotr.)

Dar sparčiau plinta komerciniai variantai, dažnai siūlomi naudojant kurią nors debesijos paslaugą. Rugsėjo 1-ąją milžinės „Alibaba“ padalinys „Ant Financial“ pirmą kartą fizinėje parduotuvėje įdiegė „Sumokėk nusišypsojęs“ sistemą: Hangdžou atidarytos sveikesnį maistą siūlančios KFC versijos, pavadintos „K PRO“, klientai gali atsiskaityti pažiūrėję į ekraną. Parduotuvių tinklas „Xiaomai“ nurodė, kad skenuos į tinklo parduotuves įeinančių žmonių veidus, siekdamas tyrinėti jų elgesį. Keli Kinijos bankai jau leidžia naudotojams prie bankomatų identifikuotis pagal veidus.

Vakarai kiek atsilieka. Kai kurie sektoriai jau seniai naudoja primityvų veidų atpažinimą, įskaitant kazino, nenorinčius įsileisti liūdnai pagarsėjusių lošėjų. Bet dažniausiai šią technologiją (atsargiai) taiko didžiosios interneto bendrovės. „Facebook“ nuėjo toliausiai – tinklo nariai pažymi draugus nuotraukose, kad bendrovės algoritmai galėtų juos atpažinti kitose. „Google“ šią technologiją taiko jos nuotraukų paslaugą naudojančių žmonių įkeltoms nuotraukoms grupuoti. „Amazon“ naujasis namų naudotojams skirtas garsiakalbis „Echo Look“ turi ir kamerą – turbūt galima padaryti, kad ji atpažintų veidus.

„Facebook“ nuėjo toliausiai – tinklo nariai pažymi draugus nuotraukose, kad bendrovės algoritmai galėtų juos atpažinti kitose.

Kitos įmonės tikrina vandenis. „JetBlue“ ir kitos JAV oro bendrovės ėmėsi žingsnių lyginti keleivių veidus su paso nuotraukomis, kad nereikėtų įlipimo bilietų. Vakaruose ne tik „Lloyds Bank“, bet ir kiti ketina imti pavyzdį iš kolegų Kinijoje ir leisti klientams prie paskyrų prisijungti nuskaitant veidus. Pavėžėjimo paslaugų bendrovė „Uber“ turi sistemą Indijos vairuotojams, kurie prieš pamainą privalo nusifotografuoti. Ją taikant turėtų sumažėti registruotais apsimetančių neregistruotų vairuotojų. Lustų gamintoja „Nvidia“ planuoja naudoti veidų atpažinimą naujajame biure Kalifornijoje.

Sistema praverstų ir siekiant padidinti prekybą. Antai vaizdo kameros galėtų atpažinti lojalius ir VIP klientus, nusipelniusius specialaus dėmesio. Jos galėtų pastebėti nepasitenkinimą pirkėjų veiduose ir pasiųsti darbuotoją spręsti situacijos. Kalbama, kad veidų atpažinimo sistemą kuria didžiausia pasaulio mažmenininkė „Walmart“, nes nori geriau aptarnauti klientus.

Turbūt neverta stebėtis, kad plintant tokioms paslaugoms jau atsirado bandančių jas apeiti. Izraelio startuolė „D-ID“ (tai reiškia „deidentifikacija“) sukūrė nuotraukas nežymiai retušuojančią programą, kad algoritmai neatpažintų žmonių. Todėl šie gali bendrinti nuotraukas, kuriose matomi jų veidai, nesijaudindami, jog nuotraukos bus naudojamos jiems identifikuoti. Kiti siūlo netechnologines priemones aukšto lygio stebėjimo sistemoms apeiti, pavyzdžiui, akinius su haliucinogeniniu akinių rėmelio marginimu arba elementarias kaukes ar makiažą.

Vis dėlto vargu ar tokios vadinamosios priešiškos atakos sustabdys platų veidų atpažinimo taikymą. Yin Qi iš „Megvii“ tikisi, kad technologija taps kasdienybe. Būtent todėl jis jau nusitaikė aukščiau. Bendrovės kuriamas kompiuterinio regėjimo smegenis jis rengia dar sudėtingesnėms užduotims, pavyzdžiui, žmogaus elgesiui interpretuoti ir objektams atpažinti.

Ilgainiui Yin Qi nori įmonę paversti „algoritmų fabriku“, siūlančiu įvairiausius kompiuterinio regėjimo paslaugų komponentus, iš kurių kitos bendrovės galės lipdyti savus vis aukštesnio lygio pasiūlymus. Nesvarbu, ar šis „Megvii“ siekis virs realybe, bendrovės siūlomos technologijos tik plis.

Jūsų komentaras

Rekomenduojami video

Daugiau leidinio naujienų