Suomalaistutkijoiden algoritmi luo fotorealistisia kasvokuvia kuvitteellisista ihmisistä, esikuvina Hollywoodin julkkikset. © Nvidia

Näitä ihmisiä ei ole

Tästä artikkelista et löydä yhtäkään oikeasta ihmisestä otettua kuvaa. Kaikki näkemäsi on koneälyn uneksimaa.

tiede 16.2.2018

Teksti: Lassi Lapintie

Julkaistu yli kolme vuotta sitten

Helsingin Ruoholahdessa sijaitsevan toimistotalon kellarissa surisee niin, että korvia huumaa. Siellä on kaapillinen tietokoneita, joiden laskentatehon summa vastaa tehokasta supertietokonetta.

Nämä koneet rouskuttavat miljoonia laskutoimituksia, joita käytetään tietokoneyhtiö Nvidian koneoppimisen tutkimuksessa. Tekoälyyn liittyvä deep learning eli syväoppiminen on teknologia-alan kuumimpia käsitteitä.

Syväoppimisen tutkimuksessa luodaan niin kutsuttuja neuroverkkoja, jotka ovat aivojen toiminnasta inspiraatiota ottaneita laskennan malleja tietokoneissa. Neuroverkkojen avulla koneita opetetaan ymmärtämään maailmaa ihmisen tavalla.

Jotta kone oppisi havainnoimaan maailmaa kuten ihminen, sen täytyy oppia näkemään se ihmisen lailla.

Syväoppimisen tutkimuksen yleisimpiä tavoitteita on opettaa neuroverkkoja tulkitsemaan visuaalista informaatiota kuvasta. Neuroverkot harjoittelevat esimerkiksi tunnistamaan ihmisen kasvot valokuvasta.

Ruoholahdessa työskentelevä nelihenkinen suomalaisryhmä on tämän alan huipulla.

Nvidia-yhtiön tutkijoiden algoritmi ei vain tunnista ihmisiä. Se luo kokonaan uusia kasvokuvia ihmisistä, joita ei ole koskaan ollut olemassa.

”Ihminen on oppinut tunnistamaan kasvot hyvin helposti,” kertoo nykyistä tutkimusprojektia vetävä Tero Karras. ”Siihen on aivoissa selkeä malli. Tällainen mallinnus on olennainen lähtökohta älykkyydelle.”

Sylivauvakin osaa tunnistaa kasvoja, mutta tietokoneohjelmalle ja niiden ohjelmoijille pulma on haastava.

”Jos pitäisi kirjoittaa ohjelma, joka katsoo kuvaa ja kertoo, ovatko siinä ihmisen kasvot, ohjelmoijan on vaikea kiteyttää tietokoneelle sitä, mikä on se ihmiskasvojen ydin. Ihminenkin oppii sen esimerkkien kautta.”

”Kuva on tietokoneelle kasa miljoonia numeroita, miljoonia pikseleitä eri väreillä”, sanoo tutkijaryhmän jäsen, Aalto-yliopiston professori Jaakko Lehtinen.

”Mahdollisia yhdistelmiä on valtavasti enemmän kuin universumissa atomeja. Jos siirrät yhdellä pikselillä sisältöä, se on ihmiselle edelleen sama kuva, mutta koneen silmissä se muuttuu monimutkaisella tavalla.”

Ongelman monimutkaisuuden vuoksi sitä ei tutkijoiden mukaan voi ratkaista perinteisen ohjelmoinnin keinoin.

Tavanomaiseen tietokoneohjelmaan ei voi kirjoittaa kaikkia eri muuttujia, joita ihmisen kasvoissa on pelkässä valokuvassa. Kasvonpiirteiden lisäksi esimerkiksi valaistus ja pään asento lisäävät soppaan miljoonia uusia aineksia.

Ratkaisu ongelmaan on neuroverkko, jolle kasvojen reseptiä ei opeteta valmiina. Sen sijaan neuroverkko opiskelee itse säännöt valtavasta määrästä oikeita kasvokuvia. Mitä enemmän oikeita kasvoja koneälyllä on tutkittavana, sitä parempia sen omat luomukset ovat.

Samaa periaatetta käyttävät tekoälyt ovat esimerkiksi päihittäneet maailman parhaat ihmispelaajat monissa lauta- ja videopeleissä opiskelemalla ihmisten pelaamia otteluita.

Googlen tekoälyohjelma AlphaGo päihitti hiljattain maailman parhaat ihmispelaajat kiinalaisessa go-lautapelissä. Ohjelman uusin versio AlphaGo Zero ei tarvitse edes ihmisopettajia.

Tällainen saavutus on mahdollista vain neuroverkon avulla, sillä toisin kuin šakissa, go-pelissä on liian monta muuttujaa perinteiselle tietokoneelle laskea kaikkia siirtoja etukäteen.

Šakin valloittivat perinteiset, raakaa laskentavoimaa käyttäneet supertietokoneet jo 1990-luvulla. IBM:n luoma Deep Blue voitti šakkimestari Garri Kasparovin 1997.

Syväoppimisen kautta syntyvät algoritmit ovat niin monimutkaisia, etteivät edes niiden kehittäjät täysin ymmärrä sitä, miten ne päätyvät lopputulokseen. Menetelmä kuitenkin toimii.

”Tiedämme täsmälleen, mitä malli laskee annetusta syötteestä, mutta operaatiossa on miljoonia ja miljoonia parametreja”, Lehtinen sanoo.

Tutkija vertaa tällaista algoritmia musiikin miksauspöytään, jossa on kymmeniä miljoonia erilaisia nuppeja tiskijukan käännettäväksi.

“Ne miljoonat parametrit antavat halutun vastauksen. Mutta meillä on lopulta aika vähän hajua siitä, miten se syntyy. Mallin opettaminen tarkoittaa juuri sopivien parametrien hakemista.”

”Ohjelmoijan on vaikea kiteyttää tietokoneelle sitä, mikä on se ihmiskasvojen ydin.”

Neuroverkot eivät kykene samanlaiseen luovaan ongelmanratkaisuun kuin ihmismieli, mutta koneälyillä on meiltä itseltämme puuttuvia kykyjä. Suomalaistutkijoiden algoritmi luo kokonaan uudenlaisia realistisia valokuvia, mihin harva ihminen pystyy edes pitkällä koulutuksella.

”Kasvojen tunnistaminen on tehty aikaisemminkin hyvällä laadulla”, ryhmän tutkija Timo Aila sanoo. ”Ja siihen pystyy myös jokainen ihminen. Se, mitä me tuodaan pöytään, on tämä kyky luoda kokonaan uusia fotorealistisia kasvoja. Sitä kykyä minulla ei ole ihmisenä.”

Ruoholahden ryhmä käyttää kuvien luomiseen niin kutsuttua GAN-mallia (generative adversarial network). Siinä kaksi neuroverkkoa asetetaan ottelemaan toisiaan vastaan. Yhden tavoitteena on luoda keinotekoisia kasvokuvia sille annetun opetusmateriaalin pohjalta. Toisen tehtävänä on erottaa keinotekoiset kuvat aidoista kasvokuvista.

Toisiaan vastaan pelaavat algoritmit parantavat jatkuvasti omaa toimintaansa. Kun peliä jatkaa tarpeeksi pitkään, koneäly kykenee luomaan fotorealistisen kuvan, joka huijaa jopa ihmissilmää.

Ihmiskasvojen luominen on kuitenkin tutkijoiden mukaan vain leluesimerkki siitä, mitä kaikkea tällaisella teknologialla voi tehdä. Periaatteessa GAN-malli taipuu millaisen datan tahansa tuottamiseen. Sen avulla tietokoneen voi opettaa vaikkapa runoilijaksi tai säveltäjäksi.

Koneälyn opetusmateriaalina Nvidian tutkijat käyttävät julkkiksista punaisella matolla otettuja kasvokuvia. Tämän raakamateriaalin pohjalta kone oppii kuvittelemaan omat ihmisensä. Alkuperä näkyy, sillä useimmat algoritmin luomat ihmiset ovat perinteisen komeita tai kauniita.

Ruoholahden ryhmän tekemä työ on akateemista perustutkimusta, josta ei tutkijoiden mukaan sellaisenaan ole hyötyä kenellekään. Kyse ei siis ole tuotekehittelystä, vaikka tutkimuksen tulokset saattavatkin tulevaisuudessa johtaa myös käytännön sovelluksiin.

Vuosi 2017 oli valeuutisten aikaa politiikassa. Valheellista tietoa uutisen muodossa levittäneiden sivustojen arveltiin vaikuttaneen muun muassa Donald Trumpin vaalivoittoon Yhdysvalloissa ja julkisen keskustelun tason laskemiseen länsimaissa.

Tässä tilanteessa keinotekoista todellisuutta luovat tietokoneet kuulostavat pelottavalta ajatukselta. Paitsi kasvokuvia, älykkäät algoritmit pystyvät luomaan muun muassa väärennettyä puhetta oikean ihmisen nauhoitettujen puheiden pohjalta.

Tällainen koneäly analysoi valitun ihmisen puheen maneereja ja äänenpainoja. Sen jälkeen se lukee kirjoitettua tekstiä robottiäänellä, joka imitoi esikuvaa. Tällainen väärennös ei ole vielä täysin vakuuttava, mutta tekniikka kehittyy nopeasti.

Keinotodellisuuden esimerkissä Washingtonin yliopiston tutkijat poimivat Barack Obaman äänen eräästä entisen presidentin puheesta ja liittivät sen tietokoneella manipuloituun versioon aivan toisesta puheesta.

Oppiva algoritmi animoi videolla näkyvän presidentin huulet vastaamaan uusia vuorosanoja. Tutkijoiden käyttämä neuroverkko oli oppinut presidentin kasvojen liikkeen analysoimalla valtavaa määrää Obaman kuvattuja puheita.

Kun nämä kaksi teknologiaa yhdistää, olisi mahdollista luoda täysin kuvitteellinen video, jossa poliitikko puhuu, mitä käsikirjoittaja haluaa.

Valeuutisten vaara on suomalaisten tutkijoiden tiedossa, mutta Jaakko Lehtinen muistuttaa, että mediasisältöjen väärentäminen onnistuu jo nykyisellä tekniikalla.

”Jos katsoo elokuvien erikoisefektejä, meillä on ollut jo vuosikymmenien ajan mahdollisuudet väärentää vaikka mitä. Toki sellainen muuttuu uuden tekniikan myötä helpommaksi, joten visuaalisen median luotettavuus jossain määrin kärsii.”

Lehtisen mukaan oppivat algoritmit voivat myös auttaa väärennetyn mediasisällön havaitsemisessa. Syväoppivat neuroverkot voivat siis toimia ratkaisuna mahdollisesti luomaansa ongelmaan.

”Nykyiset koneoppimismallit ovat hyviä tunnistamaan näitä sisältöjä. Sehän on perustavanlaatuinen ominaisuus tässä meidänkin mallissamme.”

Lehtisen mukaan algoritmeille on opetettava myös kykyjä, jotka sopivat ikäviin tarkoituksiin, mikäli uuden teknologian hyödylliset hedelmät halutaan korjata.

”Jos haluamme koneellisesti ymmärtää maailmaamme, nämä kyvyt ovat tarpeellisia hyödyllisen tekoälyn mahdollistamiseksi. Tietysti pitää puhua julkisesti siitä, mikä on mahdollista ja laillista.”

Tekoäly on laaja käsite, jolla viitataan kirjavaan joukkoon ajatuksia ja keksintöjä kännyköiden apuohjelmista tieteisfiktion jumalkoneisiin, joiden luominen johtaa pahimmissa uhkakuvissa ihmiskunnan sukupuuttoon.

Todellisessa maailmassa tällaisen keinotekoisen tietoisuuden luominen ei vielä onnistu. Varmasti ei tiedetä edes sitä, onko niin kutsutun vahvan tekoälyn luominen ylipäätään mahdollista. Tietoisuuden rakennuspalikat ovat huonosti tunnettuja myös ihmisaivoissa.

Monet alan tutkijat kuitenkin uskovat tekoälyn tulevaisuuteen. Nvidian tutkijaryhmän jäsenten mukaan sähköinen mieli on mahdollista rakentaa. Suomalaisten tutkimus voi olla yksi tällaisen mullistavan teknologian monista rakennuspalikoista.

”Me olemme saaneet nyt yhden älykkyyteen liittyvän kyvykkyyden toimimaan”, Tero Karras sanoo. ”Sitä voidaan sitten miettiä, kuinka monta erilaista kyvykkyyttä tarvitaan siihen, että laaja yleistekoäly voidaan luoda.”

Nykymuodossaan oppivat neuroverkot ovat tutkijoiden mukaan kaukana tästä tavoitteesta. Osa ryhmän jäsenistä karsastaa tekoälyn rinnastamista koneoppimiseen.

”Koneoppiminen sopii sellaisten ongelmien ratkaisemiseen, jotka ovat hyvin tarkkaan rajattuja”, esittää Timo Aila.

”Esimerkiksi kysymys, onko kuvassa lintu, on koneelle täysin eri asia kuin se, kuinka monta lintua kuvassa on. Ihmiselle nämä kysymykset ovat hyvin lähellä toisiaan. Todellinen tekoäly olisi mielestäni yleistettävä.”

Laaja tekoäly pystyisi myös luovaan ongelmanratkaisuun ja päättelyyn, mihin neuroverkot eivät toistaiseksi ole hyvin taipuneet.

”Sitä tässä ei tapahdu, että kone päättelisi asioita järkevästi tai tekisi jotain yllättävää”, sanoo tutkija Samuli Laine.

Mitä hyötyä tekoälystä sitten ihmiselle on? Monissa ennusteissa nopeasti etenevä automatisointi ja yhä älykkäämmäksi käyvät algoritmit syrjäyttävät ihmiset työmarkkinoilta.

Tutkijoiden visioissa tekoälyn ja ihmisen välinen suhde on sen sijaan hyödyllinen symbioosi, jossa älykkäät ohjelmistot ottavat taakakseen ikävät askareet.

”Otetaan esimerkiksi vaikka lääkäri, joka käyttää työssään kahtakymmentä erilaista tietojärjestelmää”, Jaakko Lehtinen sanoo. ”Hän kopioi tietoja järjestelmästä toiseen, koska ne eivät puhu keskenään. Iso osa työajasta menee siis aivan muuhun kuin varsinaiseen potilastyöhön.”

Lääkäriä avustava tekoäly voisi Lehtisen mukaan ratkaista ongelman ja vapauttaa ihmisen tekemään varsinaista työtään potilaiden parissa.

”Tekoäly voi hoitaa monet asiat lääkärin puolesta ja tarjota omaa ratkaisuansa hänelle. Tällä tavalla ihmislääkäri on edelleen vastuussa kaikesta ja tekee päätöksen.”

Tekoälyn ja ihmisen tulevaisuus voi siis hyvin olla myös harmoninen yhteistyö eikä tieteisfiktion visioima konflikti, jossa kone syrjäyttää ihmisen.

Ilmoita asiavirheestä