Gili klastotė (angl. deepfake) – tai dirbtinio intelekto (DI) technologija, leidžianti sukurti itin realistiškas vaizdo ir garso klastotes, kurios gali būti plačiai naudojamos – nuo meno, kūrybos iki apgavysčių ir sukčiavimo.
Kaip veikia?
„Deepfake“ naudoja DI algoritmus, ypač neuroninius tinklus, kurie geba analizuoti, suprasti ir sukurti naujus duomenis, paremtus viso interneto duomenų bazėje prieinamus mokymo duomenų rinkiniais.
Kuriant „deepfake“ dažniausiai naudojami generatyviniai priešininkų tinklai GANs – dvi neuroninių tinklų sistemos, veikiančios kartu. Sistemą sudaro generatorius ir diskriminatorius. Generatorius kuria naują turinį (pavyzdžiui, reikiamo žmogaus veido vaizdą), o diskriminatorius įvertina, ar sukurtas turinys tikras ar dirbtinis. Generatorius turinį tobulina tol, kol diskriminatorius nebegali atskirti tikro vaizdo nuo dirbtinio – sukuriamas labai tikslus, beveik tikroviškas „deepfake“ kurio nepatyręs vartotojas labai dažnai neatskiria nuo tikro vaizdo turinio.
Dar viena naudojama priemonė – autoenkoderiai. Jie išskaido originalų vaizdą ar garsą į paprastesnes dalis, sumontuoja naujai ir po to jas atkuria. Šis procesas leidžia DI „perdaryti“ arba transformuoti vieną veidą į kitą. Tam naudojamas giluminis mokymas (angl. deep learning), kai naudojamos ypač didelės duomenų bazės (pavyzdžiui, viešos įžymybių nuotraukos ar vaizdo įrašai), kad būtų išmokta sukurti realistišką išvaizdą, mimikas ar balsą.
Naudojamos sritys
„Deepfake“ technologijos suteikia daugybę galimybių – nuo kūrybiškų sprendimų iki pavojingų manipuliacijų. Viena populiariausių „deepfake“ naudojimo sričių – vaizdo ir balso klastotės, veidų pakeitimas. Naudojant DI vieno žmogaus veidas pakeičiamas kitu (pavyzdžiui, įžymybių veidai įdedami į filmus ar reklamą). Kitas populiarus metodas – balso sintezė: naudojamas DI, kad būtų sukurtas žmogaus balso įrašas, kuris skamba beveik identiškai originalui. Tokios klastotės naudojamos sukčiavimui (žymiai tikroviškesnė telefoninių sukčių „mama – padariau avariją“ versija).
Melagingi vaizdo įrašai gali būti naudojami politinei propagandai, manipuliacijoms ar šmeižtui. Taip pat nusikaltėlių sukurti melagingi vaizdo įrašai ar nuotraukos gali būti naudojami šantažui, asmens reputacijos žlugdymui. „Deepfake“ klastotės leidžia labai tiksliai kopijuoti ir pamėgdžioti aukštas pareigas užimančių asmenų, vadovų balsus ar veidus, kad būtų atlikti neteisėti finansiniai pervedimai arba duodami kiti melagingi nurodymai.
Kino pramonėje „deepfake“ gali būti naudojama specialiesiems efektams kurti arba aktorių išvaizdai (pavyzdžiui, jaunos ar vyresnės versijos) atkurti. Kompiuterinių žaidimų kūrėjai šią technologiją naudoja naujoms interaktyvioms patirtims kurti. „Deepfake“ naudojamas švietime ir istorijoje. Ši technologija padeda atkurti istorinius pastatus, asmenybes, jų kalbas ir išvaizdą įvairiuose švietimo projektuose.
Nors „deepfake“ atskirais atvejais (pramogos, kūryba ir pan.) gali būti naudingas, jo piktnaudžiavimo atvejai kelia didelį susirūpinimą.
Ar įmanoma atpažinti?
Nepaisant to, kad „deepfake“ tampa vis realistiškesni, yra būdų juos atpažinti.
Atkreipkite dėmesį į akis. Senesni „deepfake“ modeliai turėjo problemų tinkamai atkurti mirksėjimą. Šiandien šis trūkumas sumažėjęs, bet akis vis dar gali atrodyti nenatūraliai.
Ieškokite vizualinių klaidų. Gali būti nenatūralūs šešėliai arba šviesos pasiskirstymas, netikslūs plaukų kontūrai ar fonas, mimika, kuri nesutampa su kalbos tempu, ypač jei „deepfake“ sukurta anglakalbių specialistų, o įgarsinta ar adaptuota kita kalba, pavyzdžiui, lietuvių.
Stebėkite lūpas ir kalbos sinchronizaciją. Jei lūpų judesiai nesutampa su sakomais žodžiais, tai beveik 100 proc. „deepfake“.
Naudokite technologines priemones. Jau yra sukurtos specialios programos ir įrankiai, padedantys identifikuoti „deepfake“ klastotes, pavyzdžiui, „Deepware Scanner“ ar „Microsoft Video Authenticator“.
Tikrinkite turinio kontekstą. Jei matote sensacingą vaizdo įrašą, patikrinkite, ar tai patvirtina patikimi šaltiniai.
Vietoje epilogo
„Deepfake“ technologijos – viena įdomiausių ir kartu pavojingiausių DI panaudojimo sričių. Ar įmanoma apsisaugoti nuo piktnaudžiavimo ir sukčiavimų, naudojančių „deepfake“ technologijas? Sunku, bet įmanoma.
Pirmiausiai reikia stiprinti savo internetinį raštingumą – domėtis ir žinoti, kaip veikia „deepfake“, atpažinti pagrindinius jo požymius. Valstybės turėtų skirti lėšų savo piliečių kompiuteriniam švietimui ir raštingumui, ypač kai kalbame apie vyresnio amžiaus žmones. Labai svarbus ir šiuolaikinės, prieš internetinį sukčiavimą orientuotos teisinės bazės visame pasaulyje kūrimas.
Ne viena valstybė jau pradėjo priiminėti teisės aktus, reguliuojančius „deepfake“ naudojimą ir baudžiamąją atsakomybę už piktnaudžiavimą, gaila, kad Lietuvos vis dar nėra tarp jų.
GANs veikimo principai ir pritaikymo galimybės
Generatyviniai priešininkų tinklai (angl. Generative Adversarial Networks, GANs) – viena inovatyviausių dirbtinio intelekto (DI) technologijų, leidžiančių kurti itin realistiškus duomenis: vaizdus, garsus, tekstus ir net trimačius modelius.
Išgarsėjo protestu
GANs 2014 m. sukūrė tuomet 27 metų JAV mokslininkas Ian Goodfellow (g. 1987). Jis visame pasaulyje plačiai išgarsėjo po COVI-19 pandemijos, kai protestuodamas prieš „Apple“ grįžimo į darbą politiką, paliko bene geidžiamiausią darbdavį visame pasaulyje. Mat po pandemijos „Apple“ pareikalavo, kad kompanijos darbuotojai pirmadieniais, antradieniais ir ketvirtadieniais dirbtų biure, paliekant jiems teisę dirbti visiškai nuotoliniu būdu iki keturių savaičių per metus. Vyresniajam „Apple“ inžinieriui I.Goodfellow naujoji tvarka nepatiko – atsisakęs daugiau nei 1 mln. JAV dolerių metinio atlyginimo, jis, trenkęs durimis, išėjo. Dabar I.Goodfellow dirba DI tyrimų laboratorijoje „Google DeepMind“.
Tuo tarpu siauresniame IT rate I.Goodfellow gerai žinomas kaip vienas iškiliausių ir svarbiausių DI kūrėjų. Jo sukurtas GANs veikia pagal priešinimosi principą, kurio pagrindą sudaro du neuroniniai tinklai – generatorius ir diskriminatorius. Šie tinklai dirba vienas prieš kitą, kartu mokydamiesi generuoti realistiškus duomenis.
Generatorius (angl. generator) yra atsakingas už naujų duomenų kūrimą. Pradiniame mokymo etape jis generuoja atsitiktinius duomenis, kurie iš pradžių atrodo visiškai netikroviškai. Tačiau generatorius palaipsniui stengiasi „apgauti“ diskriminatorių ir atsižvelgdamas į jo pastabas kuria duomenis, vis labiau panašesnius į tikruosius.
Tuo tarpu diskriminatorius (angl. discriminator) yra mokomas atskirti tikrus duomenis nuo generatoriaus sukurtų dirbtinių duomenų. Jis vertina duomenis ir nurodo generatoriui, kur pastarasis klysta.
Generatorius ir diskriminatorius dirba vienas prieš kitą ir nenutrūkstamai tobulėja, mokosi. Generatorius nuolat, milžinišku greičiu ir kiekiais tobulina savo gebėjimus kurti tikroviškus duomenis, o diskriminatorius gerina savo gebėjimą aptikti, kurie duomenys yra dirbtiniai. Šis ciklinis procesas vyksta tol, kol diskriminatoriui tampa sunku atskirti tikrus duomenis nuo generatoriaus sukurtų.
Kam naudojami GANs?
Vaizdų generavimas ir redagavimas
Fotografijų sintezė. GANs naudojami generuojant itin realistiškas nuotraukas. Pavyzdžiui, galima sukurti visiškai naujus žmonių veidus, kurie neegzistuoja realybėje (pavyzdžiui, svetainėje „This Person Does Not Exist“).
Vaizdų tobulinimas. Naudojami pagerinti nuotraukų kokybę, pavyzdžiui, transformuojant žemos raiškos vaizdus į aukštos raiškos (angl. super-resolution).
Stiliaus perkėlimas. GANs gali perkelti vieno meno kūrinio stilių į kitą, pavyzdžiui, padaryti nuotrauką panašią į Van Gogo ar Pablo Picasso stiliaus paveikslą.
Kinas, animacija, virtuali realybė ir kompiuteriniai žaidimai
GANs naudojami kuriant interaktyvius pasaulius ir realistiškus kino ar kompiuterinių žaidimų personažus. Jie leidžia automatizuoti procesus, kuriems anksčiau reikėjo sunkaus dailininkų, animatorių ir dizainerių darbo. Kine GANs leidžia pigiai ir greitai naudoti anksčiau buvusius labai brangius ir ilgai trunkančius procesus (pavyzdžiui, personažo senėjimo ar jaunėjimo procesas).
Medicina
Diagnostika. GANs padeda sukurti medicininius vaizdus (pavyzdžiui, MRT skenavimus), kurie naudojami mokymui arba kaip kontroliniai pavyzdžiai, kai realių duomenų trūksta.
Vaistų kūrimas. Jie gali būti naudojami kuriant naujus molekulių ir genų modelius, vaistų vystymui.
Mokslas ir tyrimai
GANs generuoja dirbtinius duomenis, kurie užpildo realių duomenų trūkumą klimato duomenų modeliavime, astronomijos tyrimuose ar statistiniuose eksperimentuose.
Tekstų generavimas
Nors tekstams generuoti labiau populiarūs kiti DI modeliai (pavyzdžiui, Chat GPT), GANs taip pat gali būti naudojami, kai reikia kurti realistiškas frazes ar automatizuoti tekstų sintezę.
Garso ir vaizdo klastotės
GANs plačiai naudojami kuriant „deepfake“ technologijas, kurios leidžia keisti ir klonuoti balsus, keisti veidus vaizdo įrašuose ar generuoti visiškai dirbtinį turinį.
Privalumai ir iššūkiai
GANs tapo tikra revoliucija kūryboje ir suteikė galimybę generuoti naujus, niekur nematytus duomenis, kuriuos sunku sukurti kitais metodais. GANs leidžia analizuoti sudėtingas sistemas ir rasti sprendimus ten, kur trūksta realių duomenų, taip pat padeda automatizuoti daug laiko reikalaujančius procesus, pavyzdžiui, vaizdų kūrimą ar duomenų modeliavimą.
Tačiau GANs mokymo kokybė tiesiogiai priklauso nuo pradinio duomenų rinkinio. Jei duomenys nėra kokybiški ar pakankamai įvairūs, rezultatai gali būti netikslūs. Be to, pats GANs modulių mokymasis yra gana sudėtingas procesas, kuris dažnai veikia nepakankamai stabiliai ir nuosekliai. Tinklai tarpusavyje gali „nesusitarti“, todėl generuojami duomenys neatrodo realistiški.
GANs jau dabar daro didelę įtaką daugybei sričių ir jų potencialas
tik auga.
Alvydas Budraitis