Lähdimme tarkastelemaan, miten mediasisältöjä ja journalistista dataa voitaisiin käyttää tekoälyn kehityksessä laillisesti, läpinäkyvästi ja tekijänoikeuksia kunnioittaen.

Selvisi, että laillista ja yksinkertaista tapaa lisensoida mediasisältöjä tekoälykäyttöön ei nykyisellään ole tarjolla.

Työn pohjalta käynnistettiin pilottihanke, jossa kotimainen uutismedia testaa sisältöjen käyttöä ja hinnoittelua tekoälykehittäjien kanssa.

Mitä teimme?

Sitran projektin tavoitteena oli muodostaa yhteinen tilannekuva media-aineistojen hyödyntämisestä tekoälyn kehityksessä ja jäsentää edellytyksiä markkinapaikalle, jossa journalistisia sisältöjä voitaisiin lisensoida tekoälyn koulutukseen ja osaksi tekoälysovelluksia. Projektiin osallistuivat Alma Media, Kaleva, Keskisuomalainen, MTV, Otavamedia, Sanoma, Yleisradio ja Uutismedioiden liitto.

Työn pohjaksi tilattiin Geradin Partnersilta laaja oikeudellinen ja liiketoiminnallinen taustaselvitys, jossa tarkasteltiin erilaisia tekoälyratkaisuja, niiden tekijänoikeudellisia reunaehtoja sekä eurooppalaista sääntelykehikkoa. Tämän jälkeen syvennyimme työpajasarjassa konkreettisesti sisältöjen käyttötapauksiin, markkinapaikan toteutusvaihtoehtoihin, eri toimijoiden rooleihin sekä mahdollisiin hallintamalleihin.

Työn lopputuloksena mediayhtiöt käynnistivät pilottihankkeen, jonka tavoitteena on löytää joukko tekoälykehittäjiä rakentamaan mediayhtiöiden kanssa Kopioston tuella sopiva lisenssi, joka mahdollistaa materiaalin laillisen hyödyntämisen. Samalla kokeillaan käytännössä, millainen markkinapaikka palvelisi parhaiten tekijänoikeuksia kunnioittavaa tekoälykehitystä.

Lähtökohdat mediakentän näkökulmasta

Kaiken kiinni laittaminen ja kiristäminen ei välttämättä ole oikea tapa – mutta avoimuus edellyttää selkeitä pelisääntöjä.

Keskusteluissa mediayhtiöiden kanssa nousi esiin vahva tarve hallita sitä, kuka käyttää mediasisältöjä tekoälyn kehittämiseen ja miten. Datan eli mediatalojen tuottamien artikkelien, videoiden ja äänen käyttö tekoälyssä haluttaisiin tehdä läpinäkyväsi, rajatuksi ja sopimuksellisesti selkeäksi. Journalististen arvojen, tiedon alkuperän ja brändin näkyvyyden turvaamista pidettiin keskeisenä lähtökohtana.

Tekoälyn vauhdittamia uusia median liiketoimintamalleja ei vielä ole ja perinteisellä tavalla tuotetun sisällön hinnoittelu tekoälyn koulutusmateriaalikäyttöön nähdään haastavana kysymyksenä. Mediayhtiöt toivovat, että sisältöjen käytöstä maksettava korvaus heijastelisi selkeästi sen tuottamisen edellyttämän ihmisen tekemän työn hintaa. Tekoälykehittäjien kanssa käytyjen alustavien keskustelujen perusteella heille koulutusmateriaalin arvo syntyy isosta hyödynnettävässä muodossa olevasta määrästä sisältöä, jolloin se ei ole merkityksellistä, onko joku tietty vaivalla tuotettu artikkeli osa materiaalia vai ei.

Kustantajien keskuudessa erityisesti revenue share -mallit herättivät kiinnostusta, mutta samalla myös kysymyksiä pitkän aikavälin vaikutuksista. Kehityksessä haluttaisiin olla mukana, mutta suoran kilpailun ruokkiminen omilla toimilla tuntuu isolta riskiltä.

Opit

Projektin edetessä osallistujille kiteytyi useita keskeisiä oppeja:

  • Sisältöjä voidaan hyödyntää tekoälyn kouluttamiseen ja osana palveluja monella eri tavalla. Käyttötapaukset, joissa on määritelty mihin sisältöjä käytetään ja mitä se teknologiamielessä tarkoittaa, todettiin hyödylliseksi tavaksi jäsentää keskustelua ja ymmärtää millaisista tekijänoikeuksista missäkin tapauksessa on kyse.
  • Mediadatan arvo tekoälyssä syntyy sekä laadusta että ajankohtaisuudesta, ei pelkästä volyymista.
  • Laillista ja yksinkertaista tapaa lisensoida mediasisältöjä tekoälykäyttöön ei nykyisellään ole tarjolla. Markkinaan on syntynyt välittäjätahoja, jotka hankkivat oikeuksia erityisesti kuva- ja äänimateriaaliin. Ne kategorisoidaan temaattisesti tai käyttötapausten perusteella, ja myydään eteenpäin paketteina. Joustavampaa, sisältöbrändit säilyttävää ja eurooppalaiseen lainsäädäntöön suunniteltua tapaa ei toistaiseksi ole.
  • Keskitetty datan välittäjämalli mahdollistaa uusien datatuotteiden kehittämisen, mutta edellyttää vahvaa luottamusta sisältöjen hallintaan ja lisensointiin.
  • Markkinapaikan rakenteessa on huomioitava kilpailuoikeudelliset riskit: hinnoittelun yhdenmukaistamista tai kaupallisesti arkaluonteisen tiedon vaihtoa ei saa tapahtua.
  • Suomi on yksin liian pieni markkina. Onnistuminen edellyttää yhteistyötä ja yhteneväisiä pelisääntöjä vähintään pohjoismaisella ja mielellään Eurooppa-tasolla.

Miten tästä eteenpäin?

Tunnustelun pohjalta päädyttiin ehdottamaan pilottihanketta, jossa testataan mediasisältöjen käyttöä ja hinnoittelua tekoälykehittäjien kanssa. Pilotin tavoitteena ei ole ratkaista kaikkia oikeudellisia tai taloudellisia kysymyksiä, vaan tunnistaa kysyntä ja mallintaa sisältöjen hallintaa ja kaupallistamista tekoälyaikakaudella.

Kesällä 2026 toteutettavaan pilottihankkeeseen etsitään tekoälypalveluja kehittäviä yrityksiä, joita kiinnostaa mediasisältöjen lisensointi tekoälyratkaisuihin. Yrityksille tarjotaan mahdollisuutta lisensoida kokeilujakson ajaksi mediasisältöjä tekoälyn koulutusmateriaaliksi tai osaksi palvelujaan.

Pilottihankkeen takana ovat kaikki Sitran projektiin osallistuneet mediayhtiöt. Niiden tavoitteena on ennen kaikkea ymmärtää,

  • mitkä sisällöt olisivat hyödyllisiä ja mihin koulutustarkoituksiin.
  • miten paljon hyödyntäjiä Suomessa tai laajemmin kansainvälisesti voisi olla
  • minkä arvoisena kehittäjät materiaalin näkevät.

Tekoälykehittäjille pilottihanke tarjoaa suoran väylän keskusteluun keskeisten suomalaisten mediayhtiöiden kanssa ja sitä kautta mahdollisuuden vaikuttaa tulevan markkinapaikan toimintatapaan ja datan käyttöehtoihin.

Miksi?

Kysymys mediadatan käytöstä tekoälyssä on yhteiskunnallisesti merkittävä. Laadukas journalismi on keskeinen osa luotettavaa tiedonvälitystä ja demokraattista keskustelua. Samalla se on arvokasta lisätietoa ja koulutusdataa tekoälyjärjestelmille.

Ilman toimivia pelisääntöjä riskinä on, että arvo valuu pois oikeudenhaltijoilta ja teknologinen kehitys tapahtuu median kustannuksella. Ilman oikeudenmukaista arvon jakamisen mallia tai kokonaan uudenlaisia liiketoimintamalleja mediataloilla ei ole enää taloudellisia mahdollisuuksia tuottaa ihmisvoimin sisältöjä, mikä voi pahimmillaan johtaa dystooppisiin lopputulemiin.

Lue lisää

ota yhteyttä

Anssi Komulainen

Johtava asiantuntija, Demokratiainnovaatiot-ohjelma

Tarmo Toikkanen

Johtava asiantuntija, Ratkaisut

Tutustu myös