Pasi Kivioja analysoi median ilmiöitä.

Cheek sanoi ”Aah!” – lue koko avautuminen!

Pasi Kivioja
Blogit Mediaansekaantuja 18.12.2013 09:02

Tuo otsikko on sattumanvaraisesti koneen luoma, mutta voisi olla ihmisenkin tekemä – sen verran todentuntuisesti se kuvastaa nykyisten klikkihittien otsikointitapaa verkossa. Kyseinen kone eli botti käyttää lähdeaineistonaan Ylen ja muiden suomalaisten nettijulkaisujen otsikoita, jotka kerätään verkkosivujen RSS-syötteistä.

Yle avasi Botsikot-palvelun viime viikolla. Viihdyttävässä sovelluksessa tekoälyn automatiikan viimeistelevät ihmisälyn tekemät valinnat. Palvelun käyttäjät voivat peukuttaa ja jakaa sosiaalisessa mediassa botin luomia fiktiivisiä otsikoita. @botsikot-botti twiittaa eniten peukutetut Twitterissä automaattisesti. Suosituimpien otsikoiden listalle on noussut Cheekin avautumisen lisäksi muun muassa tällaisia timantteja:

  • Tutkimus: Suomalaistaksit samalla tasolla sian ja anjoviksen kanssa
  • AP: Mies sinnitteli Atlantin pohjassa kolme päivää synnytyksen jälkeen
  • Merja Ailus: ”Kevan työsuhde-etuja ei voi korvata lennokilla”
  • Junaliikenteen häiriöt saatu pääosin palautettua
  • Miksi Mandela on kuollut?

Se, että konekin pystyy muodostamaan tällaisia otsikoita, kertoo nettiotsikoinnin toisteisuudesta ja kaavamaisuudesta. Koneen on helppo oppia tietyt otsikointitavat. Ylen ohjelma laskee lähdemateriaalista tilastollisesti, millä todennäköisyydellä sanat esiintyvät peräkkäin lauseessa.

Miksei kone voisi kirjoittaa uutisetkin sille syötettyjen tiedotteiden, tilastojen tai haastattelutallenteiden pohjalta? Voisi ja näin myös tapahtuu. Tätä tekniikkaa on kehitelty monellakin taholla viime vuosina.

Yksi alan pioneereista on yhdysvaltalaisen Northwestern Universityn kehittämä Stats Monkey -sovellus, jota käytetään baseball-uutisten tekoon tilastollisesta aineistosta. Ohjelma osaa selvittää verkossa olevan määrällisen datan perusteella otteluiden kohokohdat ja avainpelaajat. Uutisen lisäksi se kirjoittaa juttuun sopivan otsikon ja lisää valokuvan pelin tärkeimmästä pelaajasta.

Urheilutulosten ohella automatisoitu uutistuotanto sopii hyvin kaavamaiseen ja tilastoja hyödyntävään talousjournalismiin. Esimerkiksi arvostettu talouslehti Forbes käyttää Narrative Science -nimisen yrityksen tekniikkaa automaattisten online-ennusteiden luomiseksi tulevista tulostiedotteista. Tässä yksi esimerkki uutisbotin kirjoittamasta talousjutusta.  Sen tunnistaa koneen tekemäksi bylinesta, johon on merkitty kirjoittajaksi Narrative Science. Oikein napakkaa ja informatiivista tekstiä!

Narrative Science ilmoitti viime vuonna Slate-lehden artikkelin julkaisun aikaan asiakasmääräkseen 30. Jutussa kerrotaan provosoivasti, että kun robotin tekemän 500 sanan artikkelin hinnaksi tulee alle 10 dollaria, on halvempaa maksaa sovelluksen käytöstä kuin täysipäiväisen journalistin työstä. Toimittajilla kun on ikävä taipumus sairastella ja vaatia kunnioitusta. Botti tekee saman homman sekunnissa ilman marinoita.

Narrative Sciencelle on sukua Kauppalehden tulostiedotteiden taustalla oleva keinoäly, joka tuottaa automaattisesti yritysten tilinpäätösdatasta luettavaa tekstiä otsikoineen päivineen. Palvelusta vastaavan Balance Consultingin liiketoimintapäällikön Tatu Kaskelan mukaan tulostiedote ei ole journalistista sisältöä ja sitä paremmin kuvaava nimi olisikin tuloskatsaus.

Järjestelmä pystyy hyödyntämään vain tilinpäätöksen euromääräisiä lukuja ja niistä laskettuja tunnuslukuja, minkä vuoksi tulostiedotteessa ei voida raportoida varsinaisia syitä liikevaihdon tai tuloksen kehitykseen. Kaskela kertoo, että tietokoneen tuottamaa aineistoa korjaillaan manuaalisesti yksittäisissä poikkeustapauksissa.

”Joskus voi olla myös aiheellista poistaa jokin tiedote, vaikka luvut ja teksti olisivat oikein, jos pelkkä lukuihin perustuva tulkinta sanallisessa muodossa ilman taustatekijöiden huomioimista ei anna tilanteesta oikeaa tai riittävän laajaa kuvaa”, Kaskela sanoo.

Suomessa on tutkittu ja kehitelty omaa uutisrobottia myös viestintäalan Next Media -tutkimusohjelmassa. Tavoitteena on ollut kehittää botti, joka haistaa uutisaiheet sosiaalisen median kirjoituksista ja kuvista. Puheenaiheiden ja sanojen välisten assosiaatioiden tunnistamisessa apuna on käytetty STT-Lehtikuvan arkistojuttuja kymmenen vuoden ajalta.

Viestinnän Keskusliiton kehitysjohtajan Helene Juholan mukaan uutisrobotti on nyt sellaisessa kehitysvaiheessa, että se pystyy opastamaan toimittajaa ja etsimään uutisaiheita, mutta sen kaupallistamisessa on vielä tehtävää. Vaikeaa on myös saada botti ymmärtämään yleiskielestä poikkeavaa uutiskieltä ja internetille ominaista puheenpartta.

Next Media -ohjelma loppuu tänä vuonna, mutta uutisrobottia on tarkoitus jatkojalostaa uudessa pohjoismaisessa Nordic Next Mediassa, jossa Suomen tutkimusohjelma on nimeltään Digital First.

”Uutisrobotista voi tulla hyvä apuväline toimittajalle, mutta sen tuottamaa aineistoa ei pysty sellaisenaan julkaisemaan”, Juhola toteaa.

Botti ei tee skuuppeja eikä taatusti voita Suomen Kuvalehden journalistipalkintoa. On vaikea nähdä, että yhdenkään toimittajan työpaikka olisi vaarassa tämän takia. Osa journalistin mekaanisesta ja toisteisesta työstä on kuitenkin mahdollista korvata koneella tai saada työhön lisäapua puheenaiheita nuuskivalta robotilta.

Oikean journalistin ns. uutisnenä tutkii, yhdistelee erilaisia lähteitä, verkostoituu, oivaltaa ja tekee lopulta analyysistään synteesin, jonka lukija nauttii myös kirjoittajan persoonallisesta ilmaisutavasta. Siihen ei kone pysty.