Artikkeli
Miten mediasisältöjä ja journalistista dataa voidaan käyttää tekoälyn kehityksessä laillisesti, läpinäkyvästi ja tekijänoikeuksia kunnioittaen? Tarkastelimme, voisiko mediadatan markkinapaikka olla vastaus tähän kysymykseen. Tässä kirjoituksessa avaamme, mitä teimme ja millaisia oppeja työstä kertyi, sekä mihin suuntaan polku tästä voisi jatkua.
Johtava asiantuntija, Demokratiainnovaatiot-ohjelma
Artikkelin tyyppi
Tunnustelu
Julkaistu
1.6.2026
Lähdimme tarkastelemaan, miten mediasisältöjä ja journalistista dataa voitaisiin käyttää tekoälyn kehityksessä laillisesti, läpinäkyvästi ja tekijänoikeuksia kunnioittaen.
Selvisi, että laillista ja yksinkertaista tapaa lisensoida mediasisältöjä tekoälykäyttöön ei nykyisellään ole tarjolla.
Työn pohjalta käynnistettiin pilottihanke, jossa kotimainen uutismedia testaa sisältöjen käyttöä ja hinnoittelua tekoälykehittäjien kanssa.
Sitran projektin tavoitteena oli muodostaa yhteinen tilannekuva media-aineistojen hyödyntämisestä tekoälyn kehityksessä ja jäsentää edellytyksiä markkinapaikalle, jossa journalistisia sisältöjä voitaisiin lisensoida tekoälyn koulutukseen ja osaksi tekoälysovelluksia. Projektiin osallistuivat Alma Media, Kaleva, Keskisuomalainen, MTV, Otavamedia, Sanoma, Yleisradio ja Uutismedioiden liitto.
Työn pohjaksi tilattiin Geradin Partnersilta laaja oikeudellinen ja liiketoiminnallinen taustaselvitys, jossa tarkasteltiin erilaisia tekoälyratkaisuja, niiden tekijänoikeudellisia reunaehtoja sekä eurooppalaista sääntelykehikkoa. Tämän jälkeen syvennyimme työpajasarjassa konkreettisesti sisältöjen käyttötapauksiin, markkinapaikan toteutusvaihtoehtoihin, eri toimijoiden rooleihin sekä mahdollisiin hallintamalleihin.
Työn lopputuloksena mediayhtiöt käynnistivät pilottihankkeen, jonka tavoitteena on löytää joukko tekoälykehittäjiä rakentamaan mediayhtiöiden kanssa Kopioston tuella sopiva lisenssi, joka mahdollistaa materiaalin laillisen hyödyntämisen. Samalla kokeillaan käytännössä, millainen markkinapaikka palvelisi parhaiten tekijänoikeuksia kunnioittavaa tekoälykehitystä.
Kaiken kiinni laittaminen ja kiristäminen ei välttämättä ole oikea tapa – mutta avoimuus edellyttää selkeitä pelisääntöjä.
Keskusteluissa mediayhtiöiden kanssa nousi esiin vahva tarve hallita sitä, kuka käyttää mediasisältöjä tekoälyn kehittämiseen ja miten. Datan eli mediatalojen tuottamien artikkelien, videoiden ja äänen käyttö tekoälyssä haluttaisiin tehdä läpinäkyväsi, rajatuksi ja sopimuksellisesti selkeäksi. Journalististen arvojen, tiedon alkuperän ja brändin näkyvyyden turvaamista pidettiin keskeisenä lähtökohtana.
Tekoälyn vauhdittamia uusia median liiketoimintamalleja ei vielä ole ja perinteisellä tavalla tuotetun sisällön hinnoittelu tekoälyn koulutusmateriaalikäyttöön nähdään haastavana kysymyksenä. Mediayhtiöt toivovat, että sisältöjen käytöstä maksettava korvaus heijastelisi selkeästi sen tuottamisen edellyttämän ihmisen tekemän työn hintaa. Tekoälykehittäjien kanssa käytyjen alustavien keskustelujen perusteella heille koulutusmateriaalin arvo syntyy isosta hyödynnettävässä muodossa olevasta määrästä sisältöä, jolloin se ei ole merkityksellistä, onko joku tietty vaivalla tuotettu artikkeli osa materiaalia vai ei.
Kustantajien keskuudessa erityisesti revenue share -mallit herättivät kiinnostusta, mutta samalla myös kysymyksiä pitkän aikavälin vaikutuksista. Kehityksessä haluttaisiin olla mukana, mutta suoran kilpailun ruokkiminen omilla toimilla tuntuu isolta riskiltä.
Projektin edetessä osallistujille kiteytyi useita keskeisiä oppeja:
Tunnustelun pohjalta päädyttiin ehdottamaan pilottihanketta, jossa testataan mediasisältöjen käyttöä ja hinnoittelua tekoälykehittäjien kanssa. Pilotin tavoitteena ei ole ratkaista kaikkia oikeudellisia tai taloudellisia kysymyksiä, vaan tunnistaa kysyntä ja mallintaa sisältöjen hallintaa ja kaupallistamista tekoälyaikakaudella.
Kesällä 2026 toteutettavaan pilottihankkeeseen etsitään tekoälypalveluja kehittäviä yrityksiä, joita kiinnostaa mediasisältöjen lisensointi tekoälyratkaisuihin. Yrityksille tarjotaan mahdollisuutta lisensoida kokeilujakson ajaksi mediasisältöjä tekoälyn koulutusmateriaaliksi tai osaksi palvelujaan.
Pilottihankkeen takana ovat kaikki Sitran projektiin osallistuneet mediayhtiöt. Niiden tavoitteena on ennen kaikkea ymmärtää,
Tekoälykehittäjille pilottihanke tarjoaa suoran väylän keskusteluun keskeisten suomalaisten mediayhtiöiden kanssa ja sitä kautta mahdollisuuden vaikuttaa tulevan markkinapaikan toimintatapaan ja datan käyttöehtoihin.
Kysymys mediadatan käytöstä tekoälyssä on yhteiskunnallisesti merkittävä. Laadukas journalismi on keskeinen osa luotettavaa tiedonvälitystä ja demokraattista keskustelua. Samalla se on arvokasta lisätietoa ja koulutusdataa tekoälyjärjestelmille.
Ilman toimivia pelisääntöjä riskinä on, että arvo valuu pois oikeudenhaltijoilta ja teknologinen kehitys tapahtuu median kustannuksella. Ilman oikeudenmukaista arvon jakamisen mallia tai kokonaan uudenlaisia liiketoimintamalleja mediataloilla ei ole enää taloudellisia mahdollisuuksia tuottaa ihmisvoimin sisältöjä, mikä voi pahimmillaan johtaa dystooppisiin lopputulemiin.
Johtava asiantuntija, Ratkaisut