Internet on rikki: Se tarjoaa ihmisille vain sen, minkä arvelee heidän tarvitsevan

Kotimaa 5.12.2012 16:00

Internet ei enää ole kaikille sama.

Kuvitus Outi Kainiemi.

Kirjakauppa Amazon sen aloitti. Muistan, kun rekisteröidyin sinne joskus 1990-luvulla. Ostin kirjan ja elokuvan.

Palatessani kauppaan minua tervehti viesti: ”Tervetuloa takaisin Lauri. Tässä joitain tarjouksia, joiden uskomme kiinnostavan sinua.”

Tarjoukset osuivat ällistyttävän hyvin mielenkiintoni kohteisiin. Kuvitelmani henkilökohtaisesta mausta olikin illuusio. Huomasin uivani aivan kuten parveni muutkin kalat.

Amazon oli profiloinut minut käyttäen algoritmeja. Ne ovat kuin ruuanlaittoreseptejä: joukko täsmällisiä, suoritettavissa olevia ohjeita, jotka ohjaavat jonkin tehtävän päätökseensä.

Tietotekniset algoritmit vain ovat karjalanpaistireseptiä äärettömän paljon monimutkaisempia.

Algoritmit hyödyntävät evästeiden keräämää dataa ja määrittelevät säännöt, joilla tätä dataa käsitellään. Evästeet puolestaan ovat pieniä ohjelmia, jotka sijoitetaan tyypillisesti koneellesi. Ne kertovat omistajalleen, kuka olet, mistä pidät, missä kuljet ja milloin. Uupumatta ne lähettävät tietokantoihin yhä uusia asioita sinusta. Meistä kerätään tietoja niin paljon ja niin monen tahon toimesta, ettei sitä olisi uskonut mahdolliseksi.

Omalla koneellani oli syyskuun alussa lähes 6 000 evästettä. Poistin ne ja asensin esto-ohjelman. Viikossa se oli estänyt 2 565 pyrkimystä seurata nettikäyttäytymistäni. Niistä 1 786 oli peräisin seurantaan erikoistuneilta yrityksiltä, jotka myyvät haalimansa tiedot eteenpäin.

Evästeet otettiin käyttöön jo internetin alkuaikoina 1994 nettikaupan yksinkertaistamiseksi. Tarkoitus oli pitää kirjaa ostoskorien sisällöstä.

”Evästeen idea on tietokoneitakin vanhempi. Narikkalappu on puhdas esimerkki evästeestä”, Electronic Frontier Finland ry:n eli Effin puheenjohtaja Timo Karjalainen hahmottaa. Eff haluaa puolustaa kansalaisten digitaalisia oikeuksia.

Evästeiden teko on teknisesti helppoa. Tietokoneiden kehittymisen myötä niille löytyy yhä uusia sijoituspaikkoja.

”Näiden tietojen uusia yhdistely- tai läpileikkaustapoja kehitetään mainonnan nimissä ja pyrittäessä miellyttämään käyttäjää.”

Karjalainen uskoo, että kerättyjä tietoja myydään eteenpäin estoitta: ”Tietosuojalaki koskee vain henkilöön liitettävissä olevia tietoja, ja evästelataukset pinnallisesti katsoen liittyvät vain toisiinsa.”

Hän on huolissaan siitä, että palveluntarjoajien suodattaessa informaatiota yhteiskunnallinen keskustelu- tai jopa näköyhteys muihin ihmisiin ehkä menetetään.

”Personoinnista tulee sananvapauden este, jos ihmiset eivät sen vuoksi voi vapaasti vastaanottaa tietoa.”

Suuret nettipalvelut rikkaine sisältöineen ovat käyttäjille ilmaisia, koska me olemme niiden tuote.

Henkilötiedot ovat nykyisin internetin talouden voimakkain moottori. Sadat robottiohjelmistot seuraavat liikkeitäsi netissä.

Mitä tietoa ne keräävät? Se on liikesalaisuus.

Google esimerkiksi käyttää noin 200 eri ”signaalia” eli profilointimäärettä. Niitä lienevät esimerkiksi IP-osoitteesi eli koneesi sijainti, kuinka kauan koneesi on ollut auki, kuinka nopeasti kirjoitat, teetkö kirjoitusvirheitä, käytätkö monipuolisia hakumenetelmiä tai useita kieliä. Google sanoo käyttävänsä tietojaan vain hakutulosten suodattamiseen ja täsmämainontaan.

Ennen Google lajitteli hakutulokset sen mukaan, kuinka moni linkitti kullekin sivulle. Nyt hakutulokset järjestäytyvät profiilisi mukaan. Niiden järjestykseen vaikuttavat aikaisemmat valintasi, sijaintisi ja monet muut sinusta kertovat tekijät.

Hakutuloksiin vaikuttaa myös kalaparvesi yhteinen profiili: Jos joku kaltaisesi on valinnut tietyllä hakusanalla tietyn hakutuloksen, se nousee sinunkin hakutuloksissasi korkeammalle.

Kaupallisten tiedonkeruuyritysten sinusta rakentama profiili saattaa sisältää hyvinkin henkilökohtaisia seikkoja, kuten poliittiset mielipiteesi, seksuaalisen suuntautumisesi, luottokelpoisuutesi, sairautesi, matkasi ja lukutottumuksesi.

”Tulevaisuudessa ihmisen on hyvin vaikeaa nähdä aineistoja tai saada tietoja, joita ei olisi jollain tavoin suodatettu juuri heitä varten”, Googlen toimitusjohtaja Eric Schmidt sanoi Wall Street Journalissa vuonna 2010.

Yhteinen internetimme kuoli 4.12.2009. Kuolinsyy oli Googlen hakutulosten listausmenetelmä, joka perustuu henkilöprofiloinnille ja jossa korkeimmalle nousee tieto, josta juuri sinä olet kiinnostunut tai samaa mieltä.

”Netin yksilöllistäminen johtaa sähköiseen harmoniaan, jossa on mukava olla”, Lundin yliopiston tietojenkäsittelytieteen professori ja algoritmien tutkija Thore Husfeldt sanoo.

”Tässä hyödynnetään joitain ihmismielen epämiellyttävämmistä puolista: Halua löytää uskomuksiamme vahvistavaa tietoa, ja halua välttää haasteita.”

Googlen edustajien mielestä suodatus on välttämätöntä. ”Tiedon suodattaminen on työtämme”, Googlen Pohjoismaiden edustaja Christine Sørensen sanoo.

”Ajattele vaikkapa sanaa Golf – pelistä kiinnostunut saa golfkenttien osoitteita, autoista kiinnostunut Volkswagenin sivuston.”

Googlata voi kirjautumalla tai kirjautumatta. Kirjautuneen käyttäjän hakuhistoriaa hyödynnetään, koska se antaa yrityksen mielestä paremmat ja mielekkäämmät hakutulokset. Jos käyttäjä ei kirjaudu, Google poimii vain joitain tietoja, kuten käyttäjän sijainnin. Sitten käyttäjä saa sanalla ”ravintola” hakutuloksiin eniten ravintoloita lähellä itseään.

”Google ei ikinä myy profiilitietoja kolmansille osapuolille”, Sørensen lupaa.

Hänen mukaansa hakuyritys pyrkii myös laajentamaan hakutulosten kirjoa. ”Algoritmimme sijoittaa suodatettuun hakuun myös vastasignaaleja. Siten tarjoamme muutakin tietoa kuin aikaisemmin hyväksyttyä.”

Valtava määrä tietoa, johon luulemme vapaasti pääsevämme, on salakavalasti esivalmisteltu, suodatettu ja järjestelty.

”Nettipalvelut ohjaavat asiakkaittensa käyttäytymistä. Vaikka järjestelmät, kuten Google ja Facebook, antavat ymmärtää myyvänsä vapautta, ne myyvät käyttäjän vapauden surutta ulos suodattamalla tietoa”, sanoo Kansalliskirjaston johtaja Kai Ekholm.

Hän ja Tampereen yliopiston informaatiotieteiden tutkija Päivikki Karhula osallistuvat Helsingin Sanomain Säätiön rahoittamaan yhteistutkimushankkeeseen ”Sananvapaus ja sensuuri verkkoaikana”.

Tutkimuksessa tarkastellaan myös, millainen voisi olla horisontissa häämöttävä ubiikkiyhteiskunta. Termi tulee englannin kielen sanasta ubiquitous, kaikkialla läsnä oleva.

Ubiikissa maailmassa tietoteknologia on levinnyt kaikkialle. Esineet, tilat, eläimet ja ihmiset ovat aina tunnistettavia ja paikannettavia. Älylaitteemme kommunikoivat jatkuvasti ympäristön kanssa.

Ubiikissa tulevaisuudessa henkilötietojen keräämisestä tulee siksi nykyistä vakavampi ongelma.

Markkinoinnin kohdentaminen voi vaikuttaa harmittomalta, mutta sillä voi Karhulan mielestä olla ikäviä jälkiseurauksia.

”Tämä riippuu siitä, kenelle tiedot ohjautuvat; kuluttajalle itselleen vai jollekin toiselle taholle, joka tekee päätelmiään kuluttajan tai tiedonhakijan käyttäytymisestä.”

Keskeistä on Karhulan mielestä vallankäyttö. Joku ulkopuolinen määrittelee, mitä tietoa tai etuja eri ryhmille tai yksilöille tarjotaan ja mitä tietoja vaimennetaan.

”Tämä on kansalaisoikeuksien kannalta erittäin merkittävä asia”, sanoo Karhula, joka on virkavapaalla toimestaan eduskunnan kirjaston johtavana tietotekniikan asiantuntijana.

Ubiikkimaailmasta on vaikea karata jo nyt. Englantilainen dokumenttiohjaaja David Bond kokeili sitä. Tammikuussa 2009 hän yritti paeta Britanniassa kaikkialla läsnä olevaa valvontaa, rekisteröintiä ja paikkatietoa.

Hän palkkasi erään Lontoon parhaista yksityisetsivistä ja yritti kadota. Karkumatkallaan hän tosin käytti satunnaisesti sähköpostiaan, sähköistä julkisliikenteen matkakorttia ja matkapuhelintaan.

18 päivän jälkeen hän luovutti.

Yksityisetsivät löysivät hänet kerta toisensa jälkeen. He tuntuivat tietävän hänen liikkeistään kaiken lähes reaaliajassa. Ainoa tapa paeta heitä oli kyhjöttää risumajassa keskellä metsää kommunikoimatta kenenkään kanssa. Operaatiosta oli Bondin kannalta se hyöty, että hän teki siitä dokumenttifilmin Erasing David.

Mutta eikö ole hyvä, että netin aiheuttamaa informaatioähkyä lievennetään suodattamalla pois tieto, jonka olemme jo aikaisemmin turhaksi todenneet?

Internetiin tulee yhtenään valtavasti lisää materiaalia. Tulostettuna sen sisältö muodostaisi pinon, joka ulottuisi täältä Neptunukseen ainakin 20 kertaa – edestakaisin.

Amerikkalaisen moveon.org-sivuston perustaja Eli Pariser on vahvasti eri mieltä. Kirjassaan The Filter Bubble – What the Internet Is Hiding from You hän varoittaa, että suodatus tuhoaa yhteisöllisyyttä ja vaarantaa demokraattisen keskustelun.

”Yksilöinti luo pieniä, eristyneitä maailmoja, jossa keskustelemme vain samanmielisten kanssa ja saamme käsityksiämme vahvistavaa dataa. Emme joudu pohtimaan vastakkaisia mielipiteitä, emmekä törmää uusiin näkökulmiin”, Pariser pohtii.

Professori Thore Husfeldt on samaa mieltä: ”Kaikesta tulee subjektiivista. Yksilön on päivä päivältä vaikeampi tajuta toisten näkemyksiä tai ymmärtää, että on muitakin tarpeita kuin hänen omansa.”

Siten me ajaudumme kaikki omiin norsunluutorneihimme, korkeisiin ja kapeisiin. Niistä me huutelemme yksilöidystä tiedosta pinkeinä hävyttömyyksiä toisillemme.

Mitä tapahtuu, kun valitset netistä ruman koiran?

Pariser käyttää viehtymystä eläimiin esimerkkinä suodatuksesta, joka johtaa tiedon vulgarisoitumiseen.

”Yritykset hyödyntävät sisällämme tiedonhalusta ja viihteen tarpeesta käytävää eeppistä taistelua. Yksi osa minusta haluaa katsoa Kurosawan elokuvan Rashomon. Toinen osa haluaa nähdä juuri nyt hauskan pätkän rumasta koirasta.”

Kun olet tarpeeksi usein valinnut ruman koiran, rumien koirien määrä hakutuloksissasi kasvaa. Lopulta olet täysin roskainformaation ympäröimä.

Facebookin perustaja Mark Zuckerberg tuntuu ymmärtävän tämän piirteen ihmisessä. Syksyllä 2006 Facebook avasi News Feed -toiminnon. Sitä suunniteltaessa Zuckerberg sanoi: ”Orava, joka kuolee talosi edessä saattaa olla tärkeämpi asia sinulle juuri nyt, kuin ihmiset, jotka kuolevat Afrikassa.”

Christine Sørensen on hänkin lukenut Pariserin kirjan. ”Hänen varoituksensa on varteenotettava, ja hän on tehnyt meidät tietoisiksi suodatinumpiosta.”

Sørensenin mukaan osa Googlen palveluista tarjoaa jo nyt monipuolista sisältöä. Yksi näistä virityksistä on vain USA:ssa käytössä olevat lisäpainikkeet. Jos haet painaen Muotokuva-painiketta, saat sinulle yksilöidyt tulokset. Jos haet Maapallo-painikkeella, yksilöinti poistuu.

Muun muassa näillä perusteilla Sørensen väittää, ettei Googlen tekemä suodatus ole uhka sen paremmin demokratialle kuin sananvapaudellekaan.

Median kuluttaja on aina lajitellut tarjolla olevaa tietoa ihan itse. Kansan Uutisten lukija ei saanut samaa tietoa kuin Uuden Suomen lukija. Vaihtoehtoinen tieto oli kuitenkin aina esillä. Me altistuimme eriäville mielipiteille ainakin hetkellisesti joka päivä.

Internetin käyttäjällä ei ole pienintäkään mahdollisuutta tietää, mitä häneltä piilotetaan. On kuin lehtikioskin asiakas näkisi hyllyillä vain Kansan Uutisia tai vain Uutta Suomea.

Google tosin antaa mahdollisuuden kytkeä yksilöintimekaniikkansa pois päältä. Tällä mahdollisuudella ei käytännössä ole juuri merkitystä, koska useimpien muiden palveluiden kohdalla profilointimekanismit toimivat näkymättöminä.

Kohdistettu mainonta saattaa olla tuhoisaa niille tiedotusvälineille, jotka yrittävät pitää yllä yhteistä päiväjärjestystä. Sanomalehdet ovat eläneet ilmoituksilla. Rivi-ilmoitukset ovat siirtyneet nettiin, ja nyt ovat siirtymässä myös suuret, kalliimmat mainokset. Netissä niiden kohderyhmä tavoitetaan täsmällisemmin ja halvemmalla.

Helsingin Sanomien digitaalisesta kehityksestä vastaavan toimituspäällikön Paula Salovaaran mielestä HS.fi:n lukijoiden ei tarvitse pelätä ajautuvansa pois yhteisten faktojen ääreltä.

”Toimituksen laatimassa uutislistauksessa aiomme tarjota jatkossakin kaikille samoja uutisia.”

Salovaara selittää HS.fi-etusivun uutislistauksen olevan aina toimituksellinen, jatkuvasti elävä valinta kunkin hetken uutisista. Sivulta voi myös valita uutiset tulojärjestyksessä.

Myös HS.fi kerää tietoa käyttäjistään voidakseen tarjota kohdennettuja mainoksia ja uutisnostoja.

”Kerätty tieto ei vaikuta uutislistaukseen mitenkään”, Salovaraa vakuuttaa.

HS.fi:n lukija voi kirjautuneena suodattaa itse etusivun uutislistauksen alla olevia osastonostoja.

Otavamedian kehityspäällikkö Jouni Lojander kertoo, että yhtiön internet-sivuilla käyttäjätietoa kerätään ainoastaan mainonnan kohdistamista varten. Otavamedia julkaisee muun muassa Plaza.fi-verkkopalvelua ja Suomen Kuvalehteä.

”Tarjoamme verkkopalveluissamme mainostaville tarkempaa kohdennettavuutta ja käyttäjille mainontaa heitä kiinnostavista asioista.”

Joissain Otavamedian verkkopalveluista on käyttäjillä mahdollisuus räätälöidä palveluja mieleisekseen. Julkaisija ei tee sitä heidän puolestaan.

Profiilimme jäävät internetin muistiin hamaan ikuisuuteen. Ne ovat myös täynnä virheitä. Evästeet eivät erottele huumoria, sarkasmia tai henkisen tilasi ailahduksia. Jos vaikkapa epäilet masennusta ja etsit tietoa aiheesta, se saattaa rekisteröityä osaksi profiiliasi.

Profiiliasi voidaan myös käyttää sinua vastaan. USA:ssa profilointia käytetään varsinkin suuryritysten rekrytoinnissa. Kun rekrytointialgoritmi ilmoittaa, että firman historiassa siihen on palkattu vain ani harva yli 45-vuotias, kaikki yli 45-vuotiaiden hakemukset saatetaan lajitella automaattisesti syrjään.

Amerikkalainen vakuutusyhtiö voi ilmoittaa vakuutuksenottajalle, että sinun on parannettava elämäntapojasi tai sanomme vakuutuksen irti. Pankki saattaa evätä profiilisi perusteella lainan.

Algoritmit etsivät tilastollisia yhteyksiä. Siten ne tulevat luoneeksi stereotypioita. Yksilöt ja kokonaiset väestöryhmät tyypitellään luokkiin, joista on vaikea päästä ulos.

Kansalaisiin liittyvän datan yhteisjärjestelmiä tehdään yhä enemmän. Meillä Suomessa sellainen on tuleva terveys- ja sosiaalitiedon yhteisjärjestelmä.

”Näitä järjestelmiä laadittaessa on kysyttävä, voidaanko tiedot tarkistaa”, Päivikki Karhula sanoo.

”Meidän on myös saatava tietää, mitkä tiedot ovat perusteena meitä koskevalle päätöksenteolle. Meidän on saatava mahdollisuus korjata mahdolliset virheet.”

Loppuraportissaan Unissakävelyllä valvontayhteiskuntaan? 10 trendiä jotka meidän on tunnettava Kai Ekholm ja Päivikki Karhula varoittavat:

”Huolestuttavin seuraus massavalvonnan hyväksymisestä on se, että kansalaiset tottuvat siihen. Siten tulee koko ajan vaikeammaksi asettaa kysymyksiä valvonnan luotettavuudesta, luvallisuudesta, kohtuullisuudesta ja suhteellisuudesta.”

Oletko pannut merkille, että näet aina ne samat tyypit Facebookissa, vaikka sinulla on kymmeniä tai satoja ”kavereita”. Oletko aprikoinut, ovatko jotkut poistaneet sinut listoiltaan?

Tämä johtuu palvelun yrityksestä antaa sinulle hillitympi syötevirta. Facebook antaa kavereillesi arvosanoja algoritmilla nimeltä EdgeRank (”SärmäRankkaus”). Se rekisteröi, keiden syötteitä luet useimmin, keitä kommentoit ja keiden jutuista tykkäät. Mitä harvemmin reagoit jonkun kaverin syötteisiin, sitä harvemmin niitä näet.

Näin sinulle kehittyy sisäpiiri. Luet sen ehdottamia artikkeleita, kuuntelet samoja lauluja. Aikajanasi latistuu sisältämään linkkejä, jotka loksahtavat maailmankuvaasi ketterästi kuin telkkä pesään.

Jos kuulut niihin moniin, joille Facebookista on tullut tärkeä ellei peräti ainoa uutislinkkien lähde, olet jatkuvasti tihentyvässä suodatinumpiossa.

Facebook seuraa sinua myös sivustoilla, joilla on f-merkki. Yhteisöpalvelun uskotaan seuraavan käyttäjiään myös silloin, kun he eivät ole kirjautuneet palveluun.

Jos haet vaikkapa matkaa Maltalle, se rekisteröityy myös Facebookin palvelimille. Kun palaat Facebookiin, se osaa näyttää sinulle mainoksia matkasta juuri Maltalle.

Kalifornialaisen Berkeleyn yliopiston Web Privacy Cencus -työryhmä tutki viime keväänä 25 000 verkkosivuston pääsivut. Niistä 87 prosenttia lykkäsi kävijän sivuille seurantaevästeen. 133 niistä käytti yli 150 evästettä. 76 prosenttia evästeistä oli kolmannen osapuolen tuotteita.

Tuhat suosituinta sivustoa tarkistettiin. Seurantaevästeitä oli lähes kaikilla.

Vuonna 1995 evästeitä oli vain pienellä osalla sivustoista. Käyttäjien koneille sijoitettavien HTML5-evästeiden määrä on kaksinkertaistunut vuodesta 2011 vuoteen 2012.

Verkossa toimii yrityksiä, kuten BlueKai ja Acxiom, jotka haalivat henkilötietoja ja myyvät ne kenelle tahansa. Acxiomilla sanotaan olevan tietokannassaan noin 96 prosenttia näppäimistölle ylettyvää amerikkalaisista.

Vakoiluun ja profilointiin puuttuminen viranomaisvalvonnan keinoin on aika toivotonta, sillä nettimediabisnes liikkuu nopeasti.

Effin Timo Karjalainen suositteleekin netin käyttäjille, että he eivät jaa henkilötietojaan harkitsemattomasti. ”Evästeet kannattaa sallia vain sivustoille, joille aikoo kirjautua sisään. On hyvä harkita, tarvitseeko sivustolle rekisteröityä ollenkaan.”

”Selaimen yksityisyysasetukset kannattaa muutenkin säätää kohdalleen ja käyttää yksityisyyttä tukevia selainlaajennuksia ja anonyymin surffailun mahdollistavaa Tor-ohjelmaa.”

Hakukoneet antoivat melko sattumanvaraisia tuloksia, kun ne vielä olivat nuoria. Googlen Christine Sørensen ei osaa sanoa, torjuisiko paluu vanhaan umpiot.

”Internetissä käyttäjä saa silti enemmän tietoa kuin koskaan historiassa.”

Googlen algoritmien hän kertoo olevan salaisia käyttäjien hyväksi. Netissä toimii paljon yrityksiä, jotka pyrkivät setvimään hakujätin algoritmin toimintaa. Tarkoitus on huijata algoritmeja siten, että hakutulosten kärkeen pääsisi ansioitta. ”Käyttäjistä meillä ei ole salaisia profiileja.”

Googleen kirjautunut käyttäjä voi nähdä profiilinsa hallintapaneelissa ja ladata sen itselleen. Hän voi myös poistaa sen ja asettaa yrityksen selaimen toimimaan anonyyminä niin kutsutussa incognito-tilassa.

Christine Sørensen neuvoo erityisesti nuoria harkitsemaan tarkkaan, mitä nettiin lataa.

”Netin käyttäjän on otettava itse itsestään vastuu”, hän tähdentää.

Lisäksi hän ehdottaa oman yrityksensä algoritmien hämäämistä:

”Välillä kannattaa hakea tavallisesta poikkeavaa, tai valita aihe, jota on vältelyt.”

Luku- ja kirjoitustaito on ollut itsestään selvä oppiaine jo vuosisatojen ajan. Nyt informaatio on korvattu toiminnoilla ja ohjelmistokoodilla. ”Opetusta annetaan kemiassa ja muussa 1960-luvun tieteessä, mutta kaikkeen vaikuttavista algoritmeista ei kerrota mitään”, Thore Husfeldt sanoo.

Husfeldtin mielestä meidän on saatava ainakin perustiedot algoritmeistä jo kouluissa, koska meidän on osattava ”ohjelmoida tai meidät ohjelmoidaan”.

Ensi kerralla, kun käväisen Amazonin sivuilla, toivon, että se ehdottaa minulle Eli Pariserin kirjaa. Jos ei, huolestun. Vakavasti.

Juttu on julkaistu ensimmäistä kertaa Suomen Kuvalehden numerossa 48/2012.