Vain tulkitsija voi voittaa tekoälyn – äänikirjat kaipaavat persoonaa
Suomen Kuvalehti kokeilee uutta koneääntä. Jos haluat, voit antaa palautetta äänen laadusta täältä.
Äännetäänkö ”Coca-Cola” [koukkakoula] vai [kokakola]?
Sain kysymyksen vastattavakseni puhelimitse kesken aivan toisenlaisten toimien.
Kysyjä oli filosofi Tuomas Nevanlinna, jonka kiinnostus ei tällä kertaa ollut luonteeltaan akateemista vaan poikkeuksellisen käytännöllistä. Hän istui äänitysstudiossa mikrofonin edessä ja oli lukemassa Nykyajan sijoitusgurut -kirjaani äänikirjaksi.
Warren Buffettia ja Charlie Mungeria koskevissa luvuissa käsitellään Coca-Colaa. Se esiintyy kirjassa niin juoman kuin sitä valmistavan yhtiön nimenä.
Kuinka se pitäisi ääntää?
Vastasin Nevanlinnalle, että minun mielestäni hänen pitäisi ääntää se juuri niin kuin se hänen mielestään tulisi ääntää. Kuinka hän ääntää sanaparin ”Coca-Cola”, kun se tulee vastaan yllättäen? Sen annoin lukuohjeeksi.
Olin palkannut Nevanlinnan hommiin juuri siitä syystä, että äänikirjojen kuuntelijana olen mieltynyt hänen persoonalliseen lukutyyliinsä. Tavanomaista suomalaista äänikirjanlukijaa enemmän hän painottaa ja tulkitsee tekstiä. Hän on hieman lähempänä ääninäyttelijää kuin valtaosa äänikirjojen lukijoista.
Tätä korostaakseni olin kirjoittanut äänikirjan alkuspiikkiin: ”Kirjan lukee sinulle Tuomas Nevanlinna” ja aivan loppuun: ”Kirjan sinulle luki Tuomas Nevanlinna”.
Halusin hänen tulkintansa. Siksi en ollut kirjoittanut esimerkiksi ”Coca-Colalle” ääntämisohjetta tai -toivetta.
Tekstin muuttuminen ja muuttaminen audiomuotoon hakee vielä muotoaan. Suomessa noudatetaan pääosin vähäeleistä linjaa, kun taas Yhdysvalloissa tapaa elävämpää kerrontaa.
Ilahduttavia poikkeuksia ovat usein ne tapaukset, joissa äänikirjan minäkertoja itse lukee kirjansa. Näin teki esimerkiksi Alexander Stubb yhdessä hänen kanssaan kirjoittamani Alex-teoksen kohdalla. Ehkä kuulijasta tuntuisi oudoltakin, jos minä-muodossa Alexander Stubbin elämäntarinaa kertoisi joku muu kuin Stubb itse. Hänen äänensä on kaikille tuttu.
Samoin on tehnyt Merja Mähkä, jonka uusi sijoitusalkeiskirja Sijoittajaksi noin viidessä tunnissa ilmestyi vain äänikirjana ja on alun alkaen kuunneltavaksi kirjoitettukin. Tällöin kirjoittaja voi teosta kirjoittaessaan miettiä sitä suoraan puhuttavaksi ja vieläpä omaan suuhunsa sopivaksi. Kirjan kirjoittamisen sijaan voisi hyvin puhua audiokäsikirjoittamisesta.
On vain ajan kysymys, milloin tekoälylukijat posottavat valtaosan kuunneltavista tai ainakin kuunneltavaksi tarjottavista äänikirjatunneista. Tekoäly sopii lukijaksi mainiosti, jos tavoitteena on kirjan sisältöön tutustuminen tai selailu. Sellaista on varmaan suuri osa esimerkiksi tietokirjojen kuuntelemisesta.
Tekoäly on varmasti monin kohdin tarkempi kuin ihmislukija. Se on helppo kytkeä ääntämystietokantaan eikä sen tarvitse lehteillä tietokantaa äänitysstudiossa hikoillessaan.
Pidän selvänä, että tekoälylukijat korvaavat bulkkiluennan. Siis juuri sen, mitä suuri osa suomalaisesta äänikirjojen lukemisesta on.
Ihmisen vahvuus lukijana on tulkinnassa. Ihminen osaa tulkita ironian ja tuoda nyanssit kuulijalle.
Tosin ei ihminenkään siihen pysty, jos lukeminen on sitä, että käsikirjoituksen rivit rullaavat silmien eteen ensimmäistä kertaa siinä vaiheessa, kun näyttelijä istahtaa mikrofonin äärelle.
Ihminen on konetta hitaampi, ja ollakseen konetta parempi, ihmisen on oltava vielä hitaampi.
Ei tarvitse käännellä povarinkortteja ennustaakseen, että samalla kun osa äänikirjojen tekemisestä siirtyy koneiden tehtäväksi, tähtitulkitsijoiden arvo kasvaa.
Äänikirjan tulkitsijan paikka on tekijöiden joukossa. Hänen nimensä kuuluu äänikirjan ”kanteen” aivan niin kuin suomentajan.