julkaisut

Suomalaisten data-avaruuksien tilannekuva

Edelläkävijöiden opit datatalouden infrastruktuurin kehittämiseen

Kirjoittajat

Antti Poikola, Denny Wong, Viivi Lähteenoja, Marko Turpeinen

Julkaistu

Esipuhe

Euroopan komissio julkaisi vuonna 2020 Euroopalle datastrategian, jonka ytimessä on ajatus data-avaruuksista Euroopan digitaalisen kilpailukyvyn selkärankana. Noin vuotta myöhemmin Sitra käynnisti projektin, jonka tavoitteena on ollut ymmärtää mitä nämä data-avaruudet ovat, minkälaisille käyttötapauksille ne soveltuvat ja minkälaisia liiketoiminnallisia hyötyjä ne mahdollistavat.

Tämän selvityksen tavoitteena on koota yhteen parin viime vuoden aikana tekemiämme havaintoja ja data-avaruushankkeista saamiamme oppeja. Ymmärrystä on kerrytetty koordinoimalla Suomen Gaia-X verkostoa ja osallistumalla data-avaruustyöhön laajemmin Euroopan tasolla. Selvityksen on tarkoitus antaa lukijalle kokonaisvaltainen kuva suomalaisen data-avaruustyön tämänhetkisestä tilanteesta sekä näkemyksiä siitä, miten data-avaruuksien hyötyihin päästäisiin kiinni mahdollisimman nopeasti tulevina vuosina.

Datatalous on lähitulevaisuudessa merkittävä osa liiketoimintaa useimmilla toimialoilla. Tästä huolimatta vain murto-osa suomalaisista yrityksistä näkee datan hyödyntämisen keskeisenä osana omaa toimintaansa.

Datataloudesta kiinnostuakseen yrityksen on osattava luoda arvoa datasta tai ymmärtää, miten dataa voi käyttää oman toiminnan kehittämisessä. Data-avaruuksista hyötyäkseen yrityksellä on oltava liiketoimintamalli, jossa pystytään hyödyntämään oman organisaation ulkopuolista dataa. Valtaosalla suomalaisista yrityksistä on vielä pitkä matka tähän.

Kansainvälisesti katsottuna datatalouden parissa tehdään jo nyt hyvin tuottoisaa liiketoimintaa. Sen luonteeseen kuuluu, että ensimmäisenä liikkeellä olevat tahot keräävät suurimmat hyödyt. Mitä isompiin datamassoihin saa pääsyn, sitä merkittävämmän etumatkan saavuttaa. Perässähiihtäjien on hyvin vaikea kuroa kaulaa umpeen. Suomella on kiire, jos haluamme pysyä digitalisaation kärkimaana.  

Haluamme kiittää kaikkia Gaia-X Suomen työhön osallistuneita yrityksiä ja sidosryhmiä sekä erityisesti 1001 Lakes -konsulttiyritystä, joka haastatteli tätä selvitystä varten suomalaisia data-avaruushankkeita kehittäviä asiantuntijoita. Hankkeista kerättyjä oppeja ja selvityksen lopussa listattuja suosituksia on tarkoitus hyödyntää huhtikuussa 2024 käynnistettävän Data Spaces Alliance Finland -yhteistyöverkoston toiminnassa. Tavoitteena on, että Data Spaces Alliance Finland kokoaa yhteen Suomen keskeiset data-avaruustoimijat ja tukee suomalaisen yksityisen ja julkisen sektorin toimijoiden kilpailukykyä eurooppalaisessa datataloudessa.

25.3.2024

Anssi Komulainen
projektijohtaja, Sitra

Tiivistelmä

Datatalouden suurimmat mahdollisuudet liittyvät yritysten väliseen yhteistyöhön, joka edellyttää tehokasta ja luotettavaa datan jakamista yli organisaatiorajojen. Dataa on toki jaettu organisaatioiden välillä jo pitkään, mutta ei kovin systemaattisesti tai tehokkaasti. Kun datan jakamisen tarpeet monipuolistuvat ja ekosysteemit laajenevat, data-avaruudet tarjoavat skaalautuvan ja turvallisen tavan jakaa dataa eri toimijoiden välillä. 

Tämä selvitys antaa kattavan kuvan suomalaisten data-avaruuksien tilasta, sekä niiden tarjoamista mahdollisuuksista liiketoiminnan näkökulmasta. Data-avaruushankkeilla tarkoitetaan sellaista konkreettista tekemistä, joka edistää data-avaruuksien rakentamista eri toimialoille. Suomalaista data-avaruuskehitystä tarkastellaan selvityksessä kolmen ryhmän eli käyttäjien, tekijöiden ja tukijoiden näkökulmasta. Käyttäjät ovat yrityksiä ja organisaatioita, jotka hyödyntävät data-avaruuksia liiketoiminnassaan. Tekijät ovat hankkeiden käynnistäjiä ja kehittäjiä. Tukijat puolestaan ovat niitä toimijoita, jotka mahdollistavat data-avaruushankkeita rahoituksella ja resursseilla. 

Data-avaruudet voimistavat merkittävästi taloudellisia, operatiivisia sekä innovaatiotoiminnan hyötyjä, joita eri organisaatioiden muodostamat ekosysteemit tarjoavat osallistujilleen. Ekosysteemeissä toimiva datainfrastruktuuri hyödyttää kaikkia, mutta sen rakentaminen on investointi, joka vaatii kannustimen. Data-avaruuksien tukijaorganisaatioilla on merkittävä rooli, kun pienimuotoisista ekosysteemeistä kehitetään kasvavia yhteiseen datainfrastruktuuriin nojautuvia dataekosysteemejä. 

Data-avaruuksien kehittämiseen panostetaan ympäri Eurooppaa ja samat ideat ovat saaneet jalansijaa myös muilla mantereilla, vaikkakin hieman eri nimisinä. Suomessa on kokoonsa nähden vilkas data-avaruuksien kehittäjäyhteisö – maasta löytyy yli 30 data-avaruushanketta 15 eri toimialalla, ja niissä on mukana pitkälti yli toistasataa organisaatiota. Eurooppalaisittain vertailtuna Suomi onkin kiistatta edistyneiden data-avaruusmaiden joukossa, vaikka suomalaiset data-avaruushankkeet ovatkin vielä pääosin varhaisessa vaiheessa. 

Keräsimme tietoa eri toimialojen data-avaruushankkeista haastattelemalla niiden parissa työskenteleviä asiantuntijoita. Kokosimme haastatteluista ja taustatutkimuksista esille nousseet opit, ja kiteytimme niistä kohdennettuja suosituksia data-avaruuksien nykyisille ja tuleville osallistujille, sekä data-avaruushankkeiden tekijöille ja tukijoille. 

Selvityksen julkistaminen toimii lähtölaukauksena samaan aikaan käynnistyvälle Data Spaces Alliance Finland -yhteistyöverkostolle. Se tuo yhteen suomalaisia data-avaruuksien tekijöitä sekä data-avaruuksia tukevia toimijoita. Allianssi pyrkii toteuttamaan tässä selvityksessä annettavia suosituksia ja edistämään data-avaruushankkeiden toteutumista Suomessa. Allianssin kohderyhmää ovat data-avaruuksien käyttäjät. Ne ovat siis yrityksiä ja organisaatioita, jotka haluavat investoida ja kehittää datavetoista liiketoimintaansa liittymällä jo olemassa oleviin ekosysteemeihin tai käynnistämällä uusia dataekosysteemejä. Allianssi tarjoaa data-avaruuksien käyttäjille yhtenäisen näkymän työkaluihin ja palveluihin, joiden avulla data-avaruuksiin pääsee mukaan. 

1. Data-avaruus tarjoaa ekosysteemeille puitteet datan jakamiseen

Datatalouden suurimmat mahdollisuudet liittyvät yritysten ja organisaatioiden väliseen yhteistyöhön, joka edellyttää tehokasta ja luotettavaa datan jakamista organisaatiorajojen yli. Organisaatioiden välistä datan jakamista on tehty jo pitkään, mutta ei kovin systemaattisesti ja tehokkaasti. Kun datan jakamisen tarpeet monipuolistuvat ja ekosysteemit laajentuvat, data-avaruudet tarjoavat skaalautuvan ja turvallisen tavan jakaa dataa eri toimijoiden välillä.

Yritysten ja julkisten organisaatioiden on haastavaa vastata asiakkaidensa kaikkiin tarpeisiin yksinään, mutta joustavissa liiketoimintaekosysteemeissä toimijat pystyvät yhdessä vastaamaan laajempiin ongelmiin kokonaan uudenlaisilla saumattomilla palveluilla.

Suomessa on useita eri aloilla toimivia ekosysteemejä, jotka muodostuvat yritysten, korkeakoulujen, tutkimuslaitosten sekä kolmannen sektorin toimijoiden verkostoista. Yhteisillä säännöillä pelaavat ekosysteemitoimijat jakavat tietoa ja osaamistaan sekä vahvistavat omaa kyvykkyyttään muilta oppimalla. Saumattomien palvelukokonaisuuksien edellytyksenä on organisaatioiden rajat ylittävä datan hyödyntäminen. Luotettava datan jakaminen vaatii toteutuakseen uudenlaisia teknisiä, hallinnollisia ja liiketoiminnallisia ratkaisuja, jotka pohjaavat yhteisiin pelisääntöihin. Data-avaruudella tarkoitetaan juuri tällaista digitaalista tietoaluetta, joka mahdollistaa luotettavan ja helpon datan käytön yli organisaatiorajojen.

Dataa on jaettu jo pitkään esimerkiksi olemassa olevissa toimittajaverkostoissa ja tutkimusprojekteissa sekä uusien liiketoimintamallien kehittämisestä kiinnostuneiden markkinaosapuolten välillä. Data-alustoja, markkinapaikkoja, rajapintoja ja muita datan jakamiseen tarkoitettuja rakenteita on jo olemassa. Tästä huolimatta datan yhteiskäytön mahdollisuuksia ei ole täysimittaisesti hyödynnetty vielä millään toimialalla. Vain jotkut toimialat Suomessa sekä muualla EU:ssa, kuten liikenne ja logistiikka ovat hieman pidemmällä datan jakamisessa ja yhteiskäytössä kuin muut.

Datan jakaminen ei vielä ole niin systemaattista ja tehokasta kuin se voisi olla, sillä se perustuu usein yksittäisten toimijoiden välisiin räätälöityihin sopimuksiin ja teknisiin ratkaisuihin. Dataa täytyy muokata, rajapintoja pitää testata ja sopimuksista on neuvoteltava jokaisen kumppanin kanssa ja jokaisen käyttötapauksen kohdalla erikseen. Kaikki tämä käsin tehtävän työn määrä ja haastavuus estävät skaalautuvan ja eri tilanteisiin mukautuvan datan käytön. Käytännössä moni hyödyllinen käyttötapaus kaatuu pelkästään siihen, että räätälöidyllä tavalla tehtynä sen kustannukset nousevat liian korkeiksi. Lisäksi ekosysteemeissä erityisesti pienemmillä toimijoilla ei useinkaan ole mahdollisuutta investoida omaan datainfrastruktuuriin. Juuri näihin haasteisiin data-avaruudet vastaavat tarjoamalla helposti skaalautuvat perusrakenteet datan jakamiseen toimijan kokoluokasta riippumatta.

1.1 Millaisia kyvykkyyksiä organisaatiot tarvitsevat datataloudessa?

Data-avaruudet ovat osa datatalouden laajempaa kokonaisuutta. Toimiva datatalous edellyttää eri tasoilla toistensa päälle rakentuvia kyvykkyyksiä. Näitä kyvykkyyksiä voi ajatella myös tarvehierarkiana. Ensin on tyydytettävä perustarpeet, eli saatava organisaation omat datanhallintaratkaisut säädylliseen kuntoon. Jos kotipesä on vielä kovin sekaisin, niin osallistuminen yritysten välisiin ekosysteemeihin on vaikeaa.

Kuva 1. Datataloudessa tarvittavien kyvykkyyksien eri tasot.

Ensimmäisellä tasolla tarkastellaan itse organisaatiota ja sitä, miten se voi oman datansa avulla tehostaa tuotantoa ja liiketoimintaa. Tarpeet organisaation sisäisten datakyvykkyyksien kehittämiseen tulevat tyypillisesti prosessien optimoinnista, rutiinitehtävien automatisoinnista sekä talous- ja liiketoimintatiedon paremmasta hyödyntämisestä. Tällä tasolla ei vielä tarvita data-avaruuksia, koska toiminta ei tapahdu organisaatiorajat ylittävissä ekosysteemeissä. Organisaation sisäisiä datakyvykkyyksiä kehittämällä voidaan kuitenkin parantaa organisaation valmiuksia vastata myös seuraavien tasojen tarpeisiin. Organisaation sisäisten siilojen ylittäminen ja eri yksiköiden välinen datapohjainen yhteistyö on rinnastettavissa organisaatioiden välisten rajojen ylittämiseen ja yhteistyöhön. Sisäisesti organisaatiossa voidaan siirtyä hajautetumpaan, niin kutsuttuun data mesh -arkkitehtuuriin, jossa data käsitetään tuotteina, joilla on sisäisiä asiakkaita. Esimerkiksi markkinointiosasto voi tehdä datatuotteita, joita strategia- sekä asiakaspalvelutoiminnot voivat hyödyntää.

Seuraavalla tasolla näkökulma laajenee organisaation ulkopuolelle. Tällöin yritys pohtii, kuinka se voi dataa verkostoissa jakamalla ja kumppanien dataa hyödyntämällä esimerkiksi parantaa asiakaskokemusta, sujuvoittaa toimitusketjuja tai kehittää uusia tuotteita ja palveluja. Tavoitteena voi muun muassa olla uudenlaisten verkostopohjaisten liiketoimintamallien kehittäminen ja yhteisten, aiemmin vaikeiksi koettujen haasteiden sekä asiakastarpeiden ratkaiseminen. Tällä tasolla on tärkeää ekosysteemissä tehtävän verkostomaisen yhteistyön osaaminen, kyky nähdä yhteistyön mahdollisuuksia sekä rakentaa luottamusta toimijoiden välille. Pienimuotoisissa ekosysteemeissä ei silti välttämättä vielä tarvita data-avaruuksia. Tällöin on mahdollista pärjätä räätälöimällä toimijoiden välisiä datan jakamisen sopimuksellisia ja teknisiä ratkaisuja yksittäisiin käyttötapauksiin.

Kolmannella tasolla ovat ekosysteemin kyvykkyydet skaalautuvaan datan jakamiseen. Tarve data-avaruuden perustamiselle syntyy, kun ekosysteemin toimijajoukko laajentuu, käyttötapaukset monipuolistuvat ja datan jakamisen volyymi kasvaa. Ekosysteemin toimijat voivat myös investoida data-avaruuden kehittämiseen vauhdittaakseen ekosysteemin kasvua ja madaltaakseen uusien datan jakamisen käyttötapausten toteuttamiskustannuksia. Toisin sanoen data-avaruuteen siirtyminen voi joko vastata ekosysteemin kasvun mukanaan tuomiin haasteisiin tai se voi olla investointi ekosysteemin kasvun mahdollistamiseen.

1.2 Mitä data-avaruudet ovat?

Data-avaruus ei ole uusi käsite, mutta ei myöskään vielä valtavirtaa. Ennen syventymistä data-avaruuksien merkitykseen ja mahdollisuuksiin, on syytä kirkastaa, mitä data-avaruudet tarkalleen ottaen ovat ja mitä ne eivät ole.

Data-avaruudet ovat aina osa laajempia ekosysteemejä, joissa löyhästi toisiinsa liittyvät toimijat jakavat dataa ja pyrkivät yhdessä datan avulla vastaamaan sellaisia ongelmiin, joita mikään yksittäinen toimija ei pystyisi ratkaisemaan. Toimivia ekosysteemejä on myös ilman data-avaruuksia, mutta data-avaruudet tarjoavat edistyneille ekosysteemeille luotettavat puitteet skaalautuvaan datan jakamiseen käytännössä.

Data-avaruuksissa datan oikeuksien haltijat päättävät, kuka heidän dataansa saa käyttää ja millä ehdoin. Ehtoihin voi kuulua esimerkiksi se, että datasta maksetaan tai että sitä ei saa jakaa edelleen vaikkapa kilpailijoille. Data-avaruuden sääntökirja ja tekninen infrastruktuuri yhdessä tarjoavat keinoja valvoa datan käyttöä ja varmistaa luotettavasti, että datan oikeuksienhaltijan määrittämiä reunaehtoja noudatetaan. Lisäksi data-avaruudet mahdollistavat datan käytöstä saatavan arvon jakamisen arvoketjun eri toimijoille niin, että myös datan tuottajat hyötyvät.

Data-avaruuden määrittelee sen sääntökirja, joka on jäsennelty kokonaisuus data-avaruudessa toimimista ohjaavia periaatteita, prosesseja ja sääntöjä. Data-avaruuden osallistujiksi kutsutaan niitä toimijoita, jotka ovat sitoutuneet noudattamaan data-avaruuden sääntökirjaa. Jokaisella osallistujalla on omat syynsä olla mukana data-avaruudessa. Toiset voivat olla datan tarjoajia, toiset datan hyödyntäjiä ja jotkut kenties molempia.

Teknisessä mielessä data-avaruus on hajautettu digitaalinen järjestelmä, jonka avulla osallistujat voivat siirtää dataa luotettavasti ja turvallisesti. Hajautettuja data-avaruuksia ei pidä sekoittaa yhden organisaation hallinnoimiin keskitettyihin data-alustoihin, jotka voivat myös tarjota puitteita datan jakamiseen.

Data-avaruus on skaalautuva datan jakamisen ratkaisu, johon on sopimuksellisesti ja teknisesti helppo liittää mukaan uusia osallistujia ja uusia käyttötapauksia. Data-avaruuden käyttötapaus tarkoittaa tilannetta, jossa osallistujat luovat liiketoiminnallista tai yhteiskunnallista arvoa käyttäen data-avaruutta organisaation rajat ylittävään datan jakamiseen. Data-avaruus tukee yleensä useita käyttötapauksia, tekee niiden toteuttamisesta kustannustehokasta ja mahdollistaa verkostovaikutukset, kun käyttötapauksiin liittyy osin samoja toimijoita ja samoja datalähteitä.

Tyypillisiä syitä sille, että organisaatiot eivät jaa dataansa ekosysteemeissä ovat epävarmat kannustimet eli pohdinta siitä, onko datan jakaminen vaivan arvoista sekä pelko siitä, että dataa väärinkäytetään sen jakamisen jälkeen.

Myös uuden eurooppalaisen dataan liittyvän lainsäädännön määrä ja yksityiskohtaisuus haastavat yrityksiä. Dataekosysteemeihin osallistuvien yritysten ei pitäisi joutua selvittämään kaikkia sääntelyn monimutkaisuuksia yksin. Parhaimmassa tapauksessa sääntöjen noudattamisen tulisi olla vaivatonta ja jopa automatisoitua. Tähän vaivattomuuteen data-avaruudet pyrkivät. Ne luovat dataekosysteemeille lainsäädännön kanssa yhteentoimivan ja teknisesti helppokäyttöisen ympäristön, jossa osallistujat voivat keskittyä datan hyödyntämiseen nojaavien liiketoimintaratkaisujen kehittämiseen.

Taulukko 1. Data-avaruuden keskeiset piirteet.

Data-avaruus onData-avaruus ei ole
Data-avaruus on työkalu ekosysteemeille, jonka avulla ekosysteemitoimijat voivat siirtää dataa luotettavasti ja turvallisesti.Data-avaruus ei ole sama asia kuin ekosysteemi eli toimijoiden yhteistyöverkosto.
Data-avaruuksissa datan oikeuksien haltijat päättävät kuka heidän dataansa saa käyttää ja millä ehdoin. Data-avaruus helpottaa myös datan käytöstä saatavan arvon jakamista eri toimijoiden kesken.Data-avaruuteen osallistuminen ei pakota datan avaamiseen tai kontrolloimattomaan jakamiseen ilman korvausta.
Data-avaruuden määrittää sen sääntökirja, jota kaikki osallistujat noudattavat.Data-avaruutta ei määritä sen tekninen toteutus. Sama tekninen infrastruktuuri voi tukea useita eri data-avaruuksia.
Data-avaruus on hajautettu digitaalinen järjestelmä.Data-avaruus ei ole yhden tahon hallinnoima data-alusta.
Data-avaruus on skaalautuva datan jakamisen ratkaisu, mihin on sopimuksellisesti ja teknisesti helppo liittää mukaan uusia osallistujia ja uusia käyttötapauksia.Data-avaruus ei ole vain kahden tai muutaman toimijan räätälöity ratkaisu datan jakamiseen tiettyä tarkoitusta varten.
Data-avaruus tukee yleensä useita käyttötapauksia, tekee niiden toteuttamisesta kustannustehokasta ja mahdollistaa verkostovaikutukset, kun käyttötapauksiin liittyy osin samoja toimijoita ja samoja datalähteitä.Data-avaruus ei ole yhtä kuin käyttötapaus.
Data-avaruus mahdollistaa oikeudellisen varmuuden datan käsittelyyn.Data-avaruus ei ole pelkästään tekninen ratkaisu datan siirtämiseen.  

2. Mitä hyötyä data-avaruuksista on minulle?

Data-avaruudet vahvistavat taloudellisia, operatiivisia sekä innovaatiotoimintaan liittyviä hyötyjä, joita ekosysteemit tarjoavat osallistujilleen. Ekosysteemien datainfrastruktuuri siis hyödyttää kaikkia osallistujia, mutta sen rakentaminen on investointi, joka vaatii kannustimen. Tukijaorganisaatioilla on merkittävä rooli, kun pienimuotoisista ekosysteemeistä kehitetään kasvavia, yhteiseen datainfrastruktuuriin nojautuvia dataekosysteemejä.

Tarkastelemme data-avaruuskehitystä käyttäjien, tekijöiden ja tukijoiden näkökulmasta. Käyttäjät ovat yrityksiä ja organisaatioita, jotka hyödyntävät data-avaruuksia toiminnassaan. Tekijät ovat hankkeiden käynnistäjiä ja kehittäjiä. Tukijat ovat puolestaan niitä, jotka mahdollistavat data-avaruushankkeita tarjoamalla rahoitusta ja resursseja hankkeiden käyttöön. Data-avaruushankkeilla tarkoitetaan konkreettista tekemistä, jolla edistetään data-avaruuksien rakentamista eri toimialoille.

Kuva 2. Kolme ryhmää suomalaisen data-avaruuskehityksen tarkasteluun.

2.1 Käyttäjät – miksi liittyä ekosysteemiin, joka tukeutuu data-avaruuteen?

Data-avaruuden ja dataekosysteemin hyödyt näyttäytyvät yhdessä. Pelkästä data-avaruudesta ei ole iloa ilman verkostomaista yhteistyötä eli ekosysteemiä. Data-avaruuteen tukeutuva ekosysteemi voi olla kuitenkin houkuttelevampi kuin pelkkä ekosysteemi ilman skaalautuvaa datan jakamisen infrastruktuuria. Data-avaruuden avulla on nopeampaa ja kustannustehokkaampaa toteuttaa arvoa tuottavia käyttötapauksia muiden ekosysteemin toimijoiden kanssa.

Tyypillisiä hyötyjä data-avaruuksien käyttäjille:

  • Operatiiviset hyödyt: Toimitusketjun tehokkuuden parantaminen, kun prosesseja voidaan optimoida datan avulla.
  • Verkostovaikutukset: Yhteistyön ja strategisten kumppanuuksien vahvistaminen muiden data-avaruuden käyttäjien ja sidosryhmien kanssa.
  • Riskien hallinta: Kontrolli jaetun datan käytöstä, lainsäädännöllinen vaatimustenmukaisuus sekä parempi tietoturva.
  • Liiketoiminnan monipuolistaminen ja uudet tulovirrat: Helppo pääsy erilaisiin tietoaineistoihin avaa mahdollisuuksia innovatiivisten tuotteiden ja palvelujen kehittämiseen ja sitä kautta uusia liiketoimintamahdollisuuksia ja tulovirtoja.
  • Laajennettu asiakaskunta: Pääsy data-avaruuteen voi tarkoittaa pääsyä uusiin asiakaskanaviin ja markkinapaikkoihin.
  • Kustannusten jakaminen: Data-avaruus monen toimijan jaettuna infrastruktuurina on kustannustehokas tapa organisaation omien käyttötapausten toteuttamiseen.

2.2 Tekijät – miksi ekosysteemin kannattaa investoida data-avaruuteen?

Data-avaruuksien kehittäjien motiivit heijastelevat edellä mainittuja yksittäisen organisaation motiiveja. Mikäli ekosysteemin osallistujien käyttöön on tarjolla skaalautuva datan jakamisen infrastruktuuri, osallistujat hyötyvät ekosysteemistä enemmän ja ekosysteemistä tulee houkuttelevampi. Tämä lisää verkostovaikutuksia ja ekosysteemin arvoa kaikille osallistujille.

Haasteena on niin kutsutut vapaamatkustajat. Valmiin datainfrastruktuurin hyödyt tulevat kaikille ekosysteemin osallistujille, mutta joidenkin pitäisi olla aloitteellisia ja investoida data-avaruuden rakentamiseen ja kantaa alkuvaiheen riskiä. Miten siis varmistaa riittävät kannustimet ensimmäisille toimijoille, jotka investoivat aikaa ja rahaa data-avaruuden rakentamiseen?

Kannustimia varhaisen vaiheen toimijoille investoida data-avaruuden kehittämiseen:

  • Kriittinen massa: Vapaamatkustajaongelmaa ei ole, jos jonkin toimialan keskeisimmät toimijat yhdessä sitoutuvat data-avaruuden kehittämiseen.
  • Investointivaiheen hallintomalli: Data-avaruushankkeelle voidaan luoda sopimuksellinen kehikko, joka takaa varhaisen vaiheen sijoittajille tulovirtoja tai muita hyötyjä kuten matalampia käyttökustannuksia data-avaruuden myöhemmissä vaiheissa.
  • Edelläkävijäasema: Data-avaruuden kehityksessä varhaisessa vaiheessa mukana olevat voivat saavuttaa paremman markkina-aseman suhteessa myöhemmin mukaan liittyviin kilpailijoihin.
  • Ulkopuolinen rahoitus: Ulkopuolinen investointituki pienentää riskiä ja voi olla kriittinen tarvittava tekijä edellä mainittujen muiden kannustimien lisäksi, jotta ekosysteemin toimijat käynnistävät data-avaruuden kehittämisen.

2.3 Tukijat – miten kasvattaa vaikuttavuutta data-avaruuksilla?

Monilla organisaatioilla, kuten rahoittajilla, toimialoja edustavilla liitoilla, tutkimus- ja koulutusorganisaatiolla sekä ministeriöillä on omasta strategiastaan kumpuavia syitä edistää datatalouden kehittymistä Suomessa tai jollakin tietyllä toimialalla. Näille tukiorganisaatioille panostaminen data-avaruuksiin voi olla keino oman vaikuttavuuden kasvattamiseen.

Data-avaruudet voivat lisätä vaikuttavuutta panostuksille, jotka kohdistetaan esimerkiksi dataekosysteemien tai yritysten dataliiketoiminnan tukemiseen. Dataekosysteemien ulkopuolisilla tukijaorganisaatioilla voi olla rahoituksen ja muun tuen kautta kriittinen rooli siinä, että ekosysteemi siirtyy kasvuhakuiseen vaiheeseen ja alkaa investoimaan datainfrastruktuurin kehittämiseen.

2.4 Data-avaruuksien liiketoiminnalliset ajurit

Toimiessaan data-avaruudet tuottavat hyötyjä osallistujilleen ja yhteiskunnalle laajemminkin. Myös data-avaruuksien edistämisen tavoitteet voivat olla taloudellisia ja yhteiskunnallisia. Nämä tavoitteet eivät välttämättä ole ristiriidassa keskenään, mutta eri tavoitteita edistetään eri toimenpiteillä ja eri data-avaruuksissa näiden tavoitteiden painoarvot vaihtelevat. Alla on listattu eurooppalaisessa yhteiskehittämishanke Data Spaces Support Centerissä tunnistettuja tyypillisiä syitä data-avaruuksien perustamiselle.

Tyypillisiä liiketoiminnallisia syitä data-avaruuksien perustamiselle. Lähde: DSSC Starter-kit.  

Kustannusten jakaminen
Data-avaruus on tapa jakaa datainfrastruktuurin toteutus- ja ylläpitokustannuksia ekosysteemin muiden toimijoiden kanssa. Data-avaruus voi helpottaa täyttämään kaikille ekosysteemitoimijoille yhteisiä liiketoiminnasta tulevia vaatimuksia (esim. prosessitehokkuus, läpinäkyvyys) tai lainsäädännön vaatimuksia (esim. lakisääteinen vastuullisuusraportointi).
Uudet innovaatiot
Dataa ja kyvykkyyksiään yhdistämällä data-avaruuden osallistujat voivat tuoda markkinoille uusia ratkaisuja, joiden toteuttamiseen tarvittavaa dataa yksittäisellä taholla ei ole hallussaan.
Voimien yhdistäminen markkinoilla
Data-avaruuden kautta saman alan yritykset voivat yhdistää voimansa estääkseen markkinan keskittymisen muutamille hallitseville markkinatoimijoille. Pienemmillä toimijoilla yksinään ei ole tarvittavia resursseja estää markkinoiden keskittymistä.
Jaettu markkinapaikka
Data-avaruuden kautta toimialan yritykset yhteistyössä muiden organisaatioiden kanssa tarjoavat pääsyn kattavaan ja laadukkaaseen dataan kyseiseltä toimialalta. Data-avaruudesta muodostuu toimialalla merkittävä markkinapaikka datalle sekä sitä hyödyntäville sovelluksille.
Yhteiskunnallinen päämäärä
Data-avaruudet voivat tukea suurempien yhteiskunnallisten haasteiden kuten vihreään siirtymään ja terveyteen liittyvien kysymysten ratkaisemisessa mahdollistamalla datan jakamisen yritysten, tutkimuslaitosten ja julkisten toimijoiden välillä.

3. Suomalaiset data-avaruushankkeet, missä mennään?

Suomi on kiistatta edistyneiden data-avaruusmaiden joukossa. Meiltä löytyy yli 30 data-avaruushanketta 15 eri toimialalla, ja hankkeissa on mukana yli sata organisaatiota. Suomalaiset data-avaruushankkeet ovat silti pääosin varhaisessa vaiheessa ja eurooppalaisittain vertailtuna yritysosallistujien määrä on meillä vähäinen. Kertynyt data-avaruusosaaminen pitää kanavoida laajemmin suomalaisen elinkeinoelämän käyttöön. Jos emme onnistu, se tarkoittaa menetettyä mahdollisuutta ja riskiä suomalaisen datatalouden kehitykselle.

Data-avaruuksista puhutaan yleensä monikossa, viitaten eri toimialojen data-avaruuksiin, kuten liikennedata-avaruuteen tai energiadata-avaruuteen. Taustalla on Euroopan komission datastrategiassa 2020 kuvattu visio. Siinä puhutaan yhteisistä eurooppalaisista data-avaruuksista strategisilla toimialoilla, jotka loppujen lopuksi yhdistyvät tai ovat ainakin saumattomasti yhteentoimivia ja muodostavat yhdessä eurooppalaisen datan yhteismarkkinan.

Yhtenäiseen datan sisämarkkinaan on vielä pitkä matka ja selkeitä toimialakohtaisia data-avaruuksia ei vielä muutamaa poikkeusta lukuun ottamatta ole sen enempää Euroopassa kuin Suomessakaan. Hyviä kansainvälisiä esimerkkejä toimialakohtaisista toiminnassa olevista data-avaruuksista ovat saksalaisen autoteollisuuden Catena-X sekä Alankomaiden valmistavan teollisuuden alihankintaketjuja sujuvoittava Smart Connected Supply Network (SCSN). Lisäksi osaamisen data-avaruus Prometheus-X on vahvasti kehittyvä toimialakohtainen data-avaruus.

Jos selkeitä data-avaruuksia ei vielä ole kovin montaa, niin mistä sitten oikeastaan puhumme? Tässä selvityksessä termiä data-avaruushanke käytetään väljästi tarkoittamaan sellaisia konkreettisia, organisoituja ja resursoituja tekemisiä, jotka voivat kehittyä data-avaruuksiksi vaikka eivät vielä sellaisia olekaan. Meneillään on data-avaruuksien kehittämisen esikaupallinen vaihe, jossa samalla toimialalla ja samassa maassa voi olla lukuisia data-avaruushankkeita kypsymässä. Ajan myötä eri hankkeiden tuotokset voivat yhdistyä ja muodostaa selkeitä toimialakohtaisia data-avaruuksia, joihin toimialan datan jakamisen tekeminen keskittyy ja kytkeytyy. Lisäksi eri data-avaruuksien odotetaan kytkeytyvän toisiinsa.

International Data Spaces Associationin (IDSA) ylläpitämässä Data spaces radar -luettelossa on noin 150 data-avaruushanketta, joista suurin osa on Euroopassa. Luettelo ei kuitenkaan ole kattava ja esimerkiksi monia tässä selvityksessä tunnistettuja suomalaisia data-avaruushankkeita ei sieltä vielä löydy. Toimialakohtaisten yhteisten eurooppalaisten data-avaruuksien valmisteluhankkeissa on tunnistettu satoja datan jakamisen hankkeita yksittäisiltä toimialoilta (esimerkkinä osaamisdata-avaruuden hankeinventaario).

On myös hyvä huomata, että organisaatioiden välillä tapahtuva datan jakaminen ei ole mikään uusi ilmiö. Erilaisia datan jakamisen projekteja, infrastruktuureja ja hallintomalleja, joita nykyään voidaan kutsua data-avaruushankkeiksi, on ollut olemassa jo vuosikausia. Toki käytännöt ja teknologian mahdollisuudet kehittyvät jatkuvasti.

3.1 Yli 30 data-avaruushanketta 15 eri toimialalla

Tähän selvitykseen on kattavien taustoitusten kautta valittu Suomesta 15 toimialaa, joilta löytyy data-avaruuksiin liittyvää tekemistä (katso kuva 3.). Näistä yhdeksää toimialaa hankkeineen kuvataan tarkemmin seuraavassa luvussa. Toimialajaossa on seurattu Euroopan komission data-avaruuksia koskevan työpaperin listausta yhteisistä eurooppalaisista data-avaruuksista, jota on täydennetty kansallisessa digitalisaatiostrategiassa, Suomen digitaalisessa kompassissa tunnistetuilla data-avaruuksilla. Digitaalisessa kompassissa data-avaruudet ovat esillä digitaalisen infrastruktuurin kehittämisen osana ja kompassissa mainitaan yhteensä 12 toimialaa, joille on tavoitteena perustaa data-avaruudet vuoteen 2030 mennessä. Digitaalisen kompassin ensimmäisessä toimeenpanosuunnitelmassa on priorisoitu viittä toimialaa: sosiaali- ja terveysdata, liikenne, digitaalinen tuotepassi, osaaminen ja tekijänoikeudet.

Eri toimialoilta tunnistimme reilut 30 data-avaruushanketta, jotka joko ovat kokonaan suomalaisia tai vaihtoehtoisesti eurooppalaisia hankkeita, joissa on mukana suomalaisia toimijoita. Yhteensä näissä hankkeissa on mukana toistasataa suomalaista organisaatiota. Data-avaruushankkeiden osalta lista ei ole kaikenkattava. Ei ole myöskään yksiselitteistä, mitkä kaikki datan hyödyntämistä edistävät tekemiset ovat data-avaruushankkeita. Monet hankkeista on aloitettu jo ennen kuin data-avaruuksista alettiin Suomessa puhua, ja hankkeissa on mahdollisesti vasta viime aikoina suunnattu tekemistä kohti data-avaruuksia. Esimerkkinä vaikkapa Fintrafficin merenkulun tiedonhallintajärjestelmää kehittävä NEMO-hanke, joka on suuntautunut data-avaruuskehitykseen.

Kuva 3. Keskeisiä suomalaisia data-avaruushankkeita toimialoittain (tarkasteluajankohtana kevät 2024). Linkit kuvassa esitettyihin hankkeisiin löytyvät liitteestä 2.

Tunnistimme yhteensä 32 eri data-avaruushanketta 15 toimialalla tarkastellessamme kotimaista data-avaruuskenttää keväällä 2024. Hankkeet on eroteltu suomalaisiin hankkeisiin ja eurooppalaisiin hankkeisiin, joissa on mukana suomalaisia toimijoita.

 

Toimiala 1: Liikenne ja logistiikka.

Suomalaiset hankkeet: Liikenteen dataekosysteemi. Merenkulun data-avaruus. NEMO Merenkulun ilmoituspalvelu. Helsinki-Vantaan lentoaseman datahubi.

Eurooppalaiset hankkeet: DSpace 4Mobility. Mobility EDIC.

 

Toimiala 2: Osaaminen.

Suomalaiset hankkeet: Digivisio 2030. Trusted Ecosystem for Skills Foresight. Jatkuvan oppimisen digitaalinen palvelukokonaisuus. Jotpa jatkuvan oppimisen ja työllisyyden palvelukeskus. 

Eurooppalaiset hankkeet: Data Space for Skills. Prometheus-X and the EDGE SKILLS project.


Toimiala 3: Maatalous ja ruokatuotanto.

Suomalaiset hankkeet: Potato-X maatalouden data-avaruuspilotti. Agrifood Data Space Finland.

Eurooppalaiset hankkeet: AgriDataSpace.


Toimiala 4: Energia.

Suomalaiset hankkeet: Fingrid Datahub.

Eurooppalaiset hankkeet: Synergies.


Toimiala 5. Älykaupungit ja rakennettu ympäristö.

Suomalaiset hankkeet: CO2 ESG Data Hub. DataMust.


Toimiala 6: Julkinen sektori.

Suomalaiset hankkeet: Julkisen hallinnon data-avaruus työryhmä. Virtual Finlandin DataFinland -palvelu.


Toimiala 7: Kiertotalous ja digitaalinen tuotepassi.

Suomalaiset hankkeet: SIX Sustainable Industry X.

Eurooppalaiset hankkeet: CIRPASS-2.


Toimiala 8: Kielimallit ja tekoäly.

Suomalaiset hankkeet: FIN-Clarin konsortio.

Eurooppalaiset hankkeet: ALT-EDIC Alliance for Language Technologies.


Toimiala 9: Media ja tekijänoikeudet.

Eurooppalaiset hankkeet: Trusted European Media Data Space.


Toimiala 10: Terveys ja hyvinvointi.

Eurooppalaiset hankkeet: TEHDAS2 Towards European Health Data Space.


Toimiala 11: Tutkimus.

Eurooppalaiset hankkeet: EOSC The European Open Science Cloud.


Toimiala 12: Luonto ja ympäristö.

Eurooppalaiset hankkeet: Destination Earth.


Toimiala 13: Reaaliaikatalous.

Suomalaiset hankkeet: Yrityksen digitalous.

 

Toimiala 14: Valmistava teollisuus.

Suomalaiset hankkeet: FAMN Finnish Advanced Manufacturing Network.


Toimiala 15: Paikkatieto.

Suomalaiset hankkeet: Location Innovation Hub.

3.2 Data-avaruuksien kansainvälinen kehitys ja Suomen asema

Vuonna 2020 julkaistulla datastrategiallaan EU pyrkii datavetoisen yhteiskunnan suunnannäyttäjäksi. Strategia tähtää yhtenäisen eurooppalaisen datamarkkinan luomiseen ja sitä kautta Euroopan globaalin kilpailukyvyn parantamiseen. Samalla EU pyrkii datan osalta myös strategisen autonomian luomiseen. Tämän vision saavuttamiseksi Euroopan komissio rahoittaa data-avaruuksien tutkimusta ja kehittämistä lähivuosina sadoilla miljoonilla euroilla. Yhteisiä eurooppalaisia data-avaruuksia se rahoittaa 14 eri toimialalla. Vuoden 2024 eurovaalien myötä valittavan uuden komission linjauksista ei ole vielä tietoa, mutta voidaan olettaa, että tavalla tai toisella datamarkkinoiden kehittäminen pysyy EU:n agendalla jatkossakin.

Saksa ja Ranska ovat osoittaneet merkittävää kansallista rahoitusta data-avaruuksiin ja se asettaakin ne data-avaruuksien kehittämisen kärkeen Euroopassa. Muita aktiivisia maita ovat muun muassa Alankomaat, Belgia, Espanja ja Itävalta. Suomi on kiistatta edistyneiden maiden joukossa ja kokoonsa suhteutettuna Suomessa on varsin runsaasti data-avaruushankkeita.

Data-avaruuskeskustelu vaikuttaa olevan enimmäkseen eurooppalainen ilmiö. Organisaatioiden väliseen luotettavaan datan jakamiseen on kuitenkin tarvetta kaikkialla maailmassa. Esimerkiksi Yhdysvalloissa yhden tahon omistamat tai hallinnoimat keskitetyt alustat ovat olleet vallitseva ratkaisumalli datan yhteiskäyttöön. Eurooppalainen lähestymistapa data-avaruuksiin korostaa hajautuneisuutta ja yhteentoimivuutta ja pyrkii sitä kautta tarjoamaan erilaisen, mahdollisesti kestävämmän mallin datan jakamiseen.

Teknisesti on mahdollista yhdistää yksittäisiä ekosysteemejä niin sanotusti pisteestä pisteeseen muokkaamalla niiden olemassa olevia rajapintoja. Laajennettavuuden varmistamiseksi kahdenvälinen yhteys voidaan korvata standardoidulla data-avaruuden liittimellä (connector), joka on jaettu ja avoin kaikille kiinnostuneille osapuolille. Suomi on edelläkävijä connector-teknologian kehittämisessä. VTT:n Data Spaces Innovation Lab (DSIL) on yksi kolmesta eurooppalaisesta data-avaruusympäristöstä, jonka connector on saanut virallisen sertifikaatin. Lisäksi DataSpace Europe on EU:n ensimmäinen virallinen Data Intermediator eli datanvälitystoimija.

3.3 Data-avaruuksien kehitysvaiheet

Data-avaruushanke etenee tyypillisesti tiettyjen vaiheiden kautta ja kehittyy muutamien toimijoiden ideasta valmistelun ja toteutuksen kautta operatiiviseksi data-avaruudeksi, joka laajenee orgaanisesti. Eurooppalaisia data-avaruuksia tukeva EU:n rahoittama Data Spaces Support Centre jakaa data-avaruuden kehityksen viiteen vaiheeseen:

  1. tutkiva vaihe
  2. valmisteluvaihe
  3. toteutusvaihe
  4. operatiivinen vaihe
  5. laajentumisvaihe

Kuva 4. Data-avaruushankkeen kehitysvaiheet. Lähde: DSSC.

Tutkiva vaihe on ensimmäinen vaihe, josta data-avaruuden kehittäminen käynnistyy. Tässä vaiheessa varsinaista data-avaruushanketta ei vielä ole, vaan on vain toimijajoukko, joka pyrkii tunnistamaan muita mahdollisesti kiinnostuneita sidosryhmiä ja houkuttelemaan niitä mukaan. Muita tähän vaiheeseen liittyviä toimia ovat käyttötapausten varhainen hahmottelu, vaatimusten kerääminen ja toimialalla olemassa olevien käytänteiden tai standardien tarkastelu.

Valmisteluvaihe alkaa, kun data-avaruuden alullepanijat ovat saaneet taakseen kriittinen massan sitoutuneita osallistujia ja tämä joukko on päättänyt yhdessä aloittaa data-avaruuden rakentamiseen tähtäävän hankkeen. Tässä vaiheessa voidaan siis puhua jo data-avaruushankkeesta, mutta vielä on matkaa siihen, ennen kuin kyseessä on toimiva data-avaruus. Valmisteluvaiheen tyypillisiin tehtäviin kuuluu data-avaruuden käyttötapauksien kehitys sekä pilottitoteutuksen suunnittelu ja resurssien hankkiminen pilottitoteutusta varten. Samalla toimialalla voi olla useita valmisteluvaiheessa olevia data-avaruushankkeita, joista osa saattaa myöhemmin yhdistyä ja osa muodostaa keskenään yhteentoimivia data-avaruuksien verkostoja.

Data-avaruushankkeen toteutusvaihe alkaa, kun hankkeella on riittävän yksityiskohtainen suunnitelma ja resurssit ensimmäisen data-avaruuspilotin tekemiseen. Toteutusvaiheen aikana kehitetään data-avaruuden hallintomallia ja infrastruktuuria data-avaruuspilotin muodossa. Tässä vaiheessa tyypillisesti tarkennetaan, mitkä kaikki tahot osallistuvat data-avaruuden kehittämiseen ja mitä arvoa he siitä saavat.

Operatiivinen vaihe on se kohta, josta eteenpäin voidaan puhua jo toimivasta data-avaruudesta. Aiemmissa vaiheissa on puhuttu vasta data-avaruushankkeista. Operatiivinen vaihe alkaa, kun data-avaruudella on pilottitoteutuksissa testattu infrastruktuuri ja hallintomalli ja data-avaruuden ensimmäinen käyttötapaus saadaan tuotantokäyttöön eli data virtaa datan tarjoajien ja vastaanottajien välillä ja käyttötapaus tuottaa tavoiteltua arvoa. Operatiivisessa vaiheessa data-avaruuden hallintomalli ja tekninen toteutus ovat jo tuotantokäytössä, vaikka niitä kehitetäänkin edelleen.

Laajentumisvaihe on toimivan data-avaruuden kehitysvaihe, jossa data-avaruus kasvaa, kun siihen liittyy luonnollisesti uusia osallistujia ja sitä sovelletaan uusiin käyttötapauksiin. Tässä vaiheessa data-avaruudella on taloudellisesti ja toiminnallisesti kestävän malli, jonka pohjalta on mahdollista kasvaa ja vastata toimintaympäristön muutoksiin.

Yllä olevaa vaiheistusta voi suuntaa antavasti soveltaa myös toimialakohtaisen data-avaruuskehityksen arviointiin, mutta silloin kriteerejä ei voi käyttää sanatarkasti, sillä yhdellä toimialalla voi olla monta data-avaruushanketta, jotka voivat olla keskenään eri vaiheissa.

Taulukossa alla esitetään arvio siitä, missä kehitysvaiheissa olevia suomalaisia data-avaruushankkeita eri toimialoilta löytyy. Toimialoista pisimmällä data-avaruusajattelussa ovat liikenne ja logistiikka, sekä taulukossa operatiivisessa vaiheessa näkyvä Fingridin datahubi (energia).

Taulukko 2. Suuntaa antava arvio data-avaruuskehityksen vaiheesta eri toimialoilla Suomessa.

Toimialat, joilla on data-avaruushankkeita tutkivassa vaiheessa Toimialat, joilla on data-avaruushankkeita valmistelu- tai toteutusvaiheissa Toimialat, joilla on data-avaruushankkeita operatiivisessa tai skaalausvaiheissa
– Julkinen sektori
– Kiertotalous ja digitaalinen tuotepassi
– Kielimallit ja tekoäly
– Media ja tekijänoikeudet
– Terveys ja hyvinvointi
– Tutkimus
– Luonto ja ympäristö
– Reaaliaikatalous
– Valmistava teollisuus
– Paikkatieto
– Liikenne ja logistiikka
– Osaaminen
– Maatalous ja ruokatuotanto
– Älykaupungit ja rakennettu ympäristö
– Energia

4. Suomalaiset data-avaruushankkeet eri toimialoilla

Keräsimme tietoa eri toimialojen data-avaruushankkeista haastattelemalla niiden parissa työskenteleviä asiantuntijoita. Tähän lukuun on koottu yhteenvedot yhdeksältä toimialalta.

4.1 Liikenne ja logistiikka

Liikennealan data-avaruuskehitys on toimialoista pisimmällä Suomessa. Liikenne ja logistiikka maalla, merellä sekä ilmassa tuottavat jatkuvasti valtavan määrän dataa. Datan avulla on mahdollista saada aikaiseksi merkittäviä päästövähennyksiä sekä aika- ja kustannussäästöjä. Suomalaiset toimijat omaksuvat uuden EU:n datasääntelyn suhteellisen nopeasti ja ovat edelläkävijöitä digitaalisten liikkumispalveluiden kehityksessä. Nämä valtit halutaan kääntää kansainväliseksi liiketoiminnaksi.

Valtion omistama yhtiö Fintraffic toimii orkestraattorina liikenteen dataekosysteemissä ja meriliikenteen data-avaruushankkeessa sekä neutraalina toimijana monessa liikenteeseen ja logistiikkaan liittyvissä datan jakamisen yhteistyöprojektissa.

Liikenteen dataekosysteemi

Ekosysteemi ei ole itseisarvo, hyöty on pystyttävä todentamaan.

Liikenteen dataekosysteemissä pyritään jakamaan suomalaiseen liikenteeseen liittyvää tietoa tasapuolisesti eri toimijoille toiminnan tehostamiseksi sekä uusien palvelujen mahdollistamiseksi.  Dataekosysteemissä on yhteistyössä jo yli 200 toimijaa, joista 23 on allekirjoittanut Liikenteen dataekosysteemin sääntökirjan, joka pohjautuu Sitran reilun datatalouden sääntökirjaan.

Dataekosysteemin ansiosta suomalaisen liikennedatan käyttö nousee vuosittain 10–15 prosenttia. Datan laatu on parantunut, toimijoiden yhteistyö tiivistynyt ja ekosysteemi toimii alustana innovaatioille. Yhteistyötä on laajennettu myös yli rajojen. Ensimmäinen kansainvälinen kumppani on Viro ja tulevaisuudessa tavoitteena on tehdä myös pohjoismaista yhteistyötä.

Haasteena liikenteen ekosysteemissä pidetään liiketoimintamallien tunnistamista. Tällä hetkellä ekosysteemiin osallistumista perustellaan usein sääntelyn vaatimusten kautta. Lakisääteisiin velvoitteisiin vastaaminen voi olla alkuun hyvä kannustin, mutta pitkällä tähtäimellä ekosysteemin pitää tarjota myös muita laajemmin toimijoita hyödyttäviä ratkaisuja.

Dataekosysteemin rakentamisessa onnistumisen edellytyksiä on käyttötapausten tunnistaminen, toiminnan rahoitus, toimijoiden välinen luottamus sekä näiden jälkeen tarpeeseen sopiva infrastruktuuri ja teknologiaratkaisut.

Meriliikenteen data-avaruus

Dataekosysteemin avulla voidaan nostaa laivaston kustannustehokkuutta ja kohdesatamien resurssien hyödyntämistä sekä vähentää hiilidioksidipäästöjä.

Tällä hetkellä liikenteen kulkua satamissa ei ole optimoitu, eikä varustamoilla ole helppoa tapaa jakaa liikennöintitietoja muiden toimijoiden, kuten satamien, muiden varustamojen ja laivojen kanssa. Laivat joutuvat kiirehtimään täydellä nopeudella mantereen läheisyyteen odottamaan, kunnes paikka laiturissa varmistuu satamasta käsin. Kiirehtimisestä syntyvän kaasuttelun takia palava polttoaine kuormittaa ympäristöä ja kasvattaa kuljetuksen kustannuksia. Samaan aikaan maissa rekkojen kuljettajat joutuvat pohtimaan, mikä laiva rantautuu ensimmäisenä, ja kenen rahtia päästään purkamaan mihinkin autoon.

Fintrafficin koordinoiman suomalaisen meriliikenteen data-avaruuden kehitystyö aloitettiin kahden Sitran yhteisrahoittaman pilottihankkeen kautta. Kestävään merikuljetukseen erikoistunut Awake.AI toteutti oikea-aikaisen satamaan saapumisen (Just-in-Time Arrival) käyttötapauksen, jossa hyödynnettiin koneoppimisalgoritmia ennustamaan paremmin aluksen arvioitua saapumisaikaa. Tiedon avulla matkan suunnittelua voitiin parantaa. Yritys pyrkii yhdistämään Just-In-Time toiminnallisuuden osaksi palvelutarjontaansa.

Siili Solutionsin johtamassa virtuaalisen satamaan saapumisen (Virtual Port Arrival) pilotissa suunniteltiin menetelmää, jonka avulla laivat voivat tehdä virtuaalisen saapumisilmoituksen ja varmistaa laituripaikan jo ennen varsinaista satamaan saapumista. Menetelmän tarkoituksena oli vähentää laivojen turhaa kiirehtimistä satamaan. Siilin pilotilla on tiivis yhteys Fintrafficin NEMO-projektiin, joka toi Siili Solutionsille arvostetun Service Design Award -palkinnon.

Nämä kaksi pilottia yhdessä laajentavat Fintrafficin viranomaistoimintaa varten kehittämää merenkulun NEMO-tiedonhallintajärjestelmää niin, että sitä voi kutsua merenkulun data-avaruudeksi. Pilotit tarjosivat Fintrafficille oivalluksia siitä, miten viranomaistoimintaan tarkoitettu tiedonhallintajärjestelmä voi mahdollistaa lisäarvopalvelujen toteuttamisen. Yleiskäyttöinen data-avaruus tukee myös muita merenkulkuun liittyviä datan jakamisen käyttötapauksia kuin lakisääteistä datanvälitystä.

Pilotteihin osallistui yhteistyössä seitsemän organisaatiota: Awake.AI, E&S Tankers, Borealis Plastics, Siili Solutions, Fintraffic VTS, ESL Shipping ja Ruotsissa sijaitseva Oxelösundin satama. Konsulttiyritys Taival Consultancy auttoi pilottien toimijoita ymmärtämään paremmin erilaisia liiketoimintamalleihin ja arvonluontiin liittyviä oletuksia.

Analyysien pohjalta arvioitiin, että tuotantokäytössä virtuaalisen satamaan saapumisen käyttötapaus voi vähentää sitä käyttävien alusten päästöjä ja polttoainekustannuksia jopa 24 prosentilla. Vastaavasti oikea-aikaisen satamaan saapumisen (Just-in-Time Arrival) käyttötapaus voi säästää satamien operointikustannuksissa 27 prosenttia ja tuottaa jopa 20 prosentin säästöt lyhentyneestä läpimenoajasta rahdin omistajille.

Merenkulun data-avaruuden kehittäminen jatkuu Fintrafficin saatua Euroopan komissiolta 2,7 miljoonaa euroa rahoitusta vuosille 2024–2026 NEMO-tiedonhallintajärjestelmän laajentamiseen data-avaruuskyvykkyyksillä.

Helsinki-Vantaan lentoaseman datahubi

Lentorahti saapuu määränpäähänsä alle päivässä, mutta sen lähteminen kentältä voi kestää huomattavasti pidempään.

Lentorahdin sujuva käsittely vaatii tiivistä ja samantahtista yhteistyötä monien eri toimijoiden välillä. Silti yhteistyön tueksi ei ole vielä olemassa datavetoisia ratkaisuja. Monet manuaaliset kirjaamiset ja tietojen siirrot rahtiprosessin aikana katkaisevat näkyvyyden oikeaan lähetystietoon. Ajantasaiset ja kattavat rahtitiedot ovat kuitenkin tärkeitä eri toimijoille, jotta ne voivat ennakoida ja suorittaa oman osuutensa logistiikkaketjussa sujuvasti ja tehokkaasti.

Helsinki-Vantaan lentokentän datahub oli projekti, jossa Sitra oli mukana yhteisrahoittamassa Fintrafficin, Finnair Cargon ja Finavian datahubin konseptointia.

Tavoitteena oli tunnistaa lentorahdin käsittelyyn liittyviä datavetoisia liiketoimintatapauksia. Projektin aikana luotiin yhteistä tavoitetilaa keskeisille sidosryhmille, kuten logistiikkapalvelujen tarjoajille, huolitsijoille, rahtia kuljettaville lentoyhtiöille ja lentokenttäoperaattorille.

Projektissa tunnistettiin myös lentorahdin data-avaruudelle mahdollisia liiketoimintatapauksia, kuten lähetyksen hiilidioksidipäästötietojen kerääminen, lähetyksen tilan optimointi oikeiden pakkausmittojen avulla, digitaalinen tullikäsittely, reaaliaikainen rahdin tilannetietoportaali sekä sääntelyn tuomien vaatimusten ratkaiseminen lentokentän eri toimijoille.

Liiketoiminta-analyysin mukaan nämä liiketoimintatapaukset voisivat toteutuessaan tuottaa jopa 10 prosentin kustannussäästöt lentoyhtiöille ja muille rahdin käsittelyyn liittyville toimijoille, kuten huolitsijoille ja lähettäjille.

Jotta datahub toteutuisi, se vaatisi Helsinki-Vantaalle yhteisön, joka lähtee kehittämään konseptia yhdessä. Toinen vaihtoehto on, että neutraali osapuoli orkestroisi ratkaisua yhteistyössä muiden toimijoiden kanssa.

4.2 Osaaminen

Työmarkkinat ja osaamistarpeet ovat jatkuvassa ja nopeassa muutoksessa. World Economic Forumin selvityksen mukaan työnantajat uskovat, että 44 prosenttia työntekijöiden tarvitsemista taidoista muuttuu merkittävästi seuraavan viiden vuoden aikana. Euroopan komission mukaan jopa 77 prosenttia EU:n yrityksistä ilmoittaa jo nyt vaikeuksista löytää tarvittavaa osaamista omaavia työntekijöitä. Datalla ja digitalisaatiolla on paikkansa osaamispolitiikassa, kun ratkottavana on nopeasti muuttuvien osaamistarpeiden luomia haasteita.

Työvoiman ja työpaikkojen kohtaamiseksi on jo pitkään rakennettu dataan ja analytiikkaan pohjautuvia ratkaisuja erilaisissa työnvälitys- ja rekrytointiportaaleissa, mutta osaamisdatan käyttöalueet ovat laajemmat. Osaamisdata kuvaa ihmisten osaamisia, organisaatioiden osaamistarpeita ja oppilaitosten tarjontaa.

Osaamisdataa jakamalla voidaan saada työntekijät ja työpaikat kohtaamaan, koulutus vastaamaan paremmin ennakoituihin osaamistarpeisiin, opinhaluiset löytämään oppimismahdollisuuksia ja yritykset kehittämään paremmin henkilöstönsä osaamista. Osaamisdatan jakamisen käytännöissä niin sanotut OmaData-periaatteet (MyData) ovat keskiössä, sillä suurin osa osaamisdatasta on ihmisten henkilötietoa. OmaData-periaatteiden mukaisesti ihmisillä on mahdollisuus hyödyntää heitä koskevia eri tietojärjestelmissä olevia tietoja ja antaa lupa tietojen käyttöön muissa palveluissa.

Yhtenäisen eurooppalaisen osaamisen data-avaruuden hahmottelu aloitettiin kansainvälisessä DS4Skills-hankkeessa, jossa on vahva edustus Suomesta. Suomessa on paljon osaamisdataan liittyvää toimintaa, ja data-avaruustekeminen on edennyt jo kartoitus- ja valmisteluvaiheiden jälkeiseen pilottitoteutusten työstöön sekä siihen liittyvään asiakas- ja rahoitushankintaan. Vielä ei kuitenkaan voida puhua kotimaisesta osaamisdata-avaruudesta, vaan kyseessä on joukko toimijoita, jotka tekevät eri kokoonpanoissa yhteistyötä paremman osaamisdatan hyödynnettävyyden eteen.

Osaamistarpeiden ennakoinnin kokeilu

Data-avaruudet voivat olla ja niiden pitää olla liiketoimintaa, sillä julkinen raha loppuu aina joskus. Kuvittele mitä olisi tapahtunut, jos CERN olisi sanonut, että tämä internetprojekti on nyt ohi, kun hankerahoitus päättyi?

Yksi osaamisdataan liittyvä hanke muiden joukossa on Sitran yhteisrahoittama pilotti, jossa mahdollistetaan yritykselle sen tulevien osaamistarpeiden ennakointi seuraavalle yhdelle, kolmelle tai viidelle vuodelle. Ratkaisun avulla yritykset voisivat verrata oman organisaationsa osaamisprofiilia kilpailijoihin. Pilotissa ovat mukana Suomesta Headai ja ABB, ranskalainen Visions, eurooppalainen yhteisö Prometheus-X ja globaalisti toimiva yritys Lightcast.

Pilotin osallistujat rakentavat käyttötapauksensa data-avaruusratkaisuun nimeltä VisionsTrust, joka perustuu Prometheus-X:n avoimen lähdekoodin komponentteihin. Osaamisen data-avaruuden osallistujat voivat yhdistää tietolähteitä ja jakaa tietoja eri siiloista organisaation sisällä sekä eri osapuolten välillä. Data-avaruuden kautta osallistujat voivat tuoda uusia datatuotteita tarjolle ja vastaavasti hyödyntää datasta lisäarvoa tuottavia AI-palveluita. Lisäksi data-avaruus mahdollistaa osaamisdataan nojautuvien liiketoimintamallien ja niihin liittyvän voitonjaon testaamisen.

Verkostomainen yhteistyö korostuu kaikissa osaamisdatahankkeissa. Yhteistyötä tehdään suomalaisten toimijoiden kesken sekä Euroopan laajuisissa verkostoissa, kuten Gaia-X, Prometheus-X, International Data Spaces Association (IDSA) ja Big Data Value Association (BDVA). Yhteistyö korostuu myös eri toimialojen välillä ja osaamiseen liittyvän data-avaruustekemisen tuleekin jatkossa kytkeytyä entistä tiukemmin myös muihin toimialoihin, kuten terveyteen, älykaupunkeihin sekä muihin data-avaruuksiin.

Euroopan tasolla osaamisdatan ympärille on muodostunut yhteisö, jolla on työkalut ratkoa osaamistarpeiden nopeaan muutokseen liittyviä ongelmia datalähtöisesti. Osaamisdatan ympärillä olevien toimijoiden yhteisenä tavoitteena on edistää data-avaruuksia kasvuun tähtäävänä liiketoimintana ja rakentaa alalle uusia kasvuyrityksiä. Toimintaa ei kuitenkaan nähdä kestävänä pelkästään projektiorganisaatioiden vetämänä tai puhtaasti julkisrahoitteisena. Ratkaisuja onkin tehty jo asiakastarpeisiin ja asiakkaiden maksamana. Tavoitteena on siirtyä mahdollisimman nopeasti piloteista kohti kasvavaa liiketoimintaa.

4.3 Maatalous ja ruokatuotanto

Maatalous ja siihen nojautuva ruokateollisuus edustavat yhdessä noin kuutta prosenttia EU:n bruttokansantuotteesta. Maatalous on merkittävä toimiala, mutta siitä puhuttaessa datatalous ei useinkaan tule ensimmäisenä mieleen. Maanviljely ja ruuan alkutuotanto ovat kuitenkin vahvasti koneistettua ja viljelyn eri vaiheista syntyy paljon dataa, jonka avulla voidaan muun muassa parantaa maankäyttöä, viljelyn ympäristöystävällisyyttä, ruuan jäljitettävyyttä ”pellolta pöytään” sekä alkutuotannon taloudellista kannattavuutta.

Maataloussektorin keskeisiin datatyyppeihin kuuluvat muun muassa tiedot maaperän laadusta, viljelypaikan sijainti, sato ja koneiden käyttö. Nykyisin näitä samoja datatyyppejä käsitellään lukuisissa eri järjestelmissä hyvin epäyhtenäisesti. Toistaiseksi ruokajärjestelmän alkutuotannosta syntyvällä datalla on siis vielä pitkä ja vaikea matka koko elintarvikealan hyödynnettäväksi. Tätä matkaa eurooppalaiset ja kotimaiset maatalous- ja ruoka-alan data-avaruushankkeet pyrkivät helpottamaan.

Agrifood Data Space Finland

Myös maatalousalalla on datataloutta.

Agrifood Data Space Finland (AFDSF) -konsortio kehittää ruoka-alalle data-avaruutta. Kehittämisen ajurina on toiminut EU:n uusi datasääntely. Erityisesti teollisiin toimijoihin kohdistuu erilaisia sääntöjä ja raportointivelvoitteita ja tämä paine näkyy myös maatalousyrittäjille.

Kotimaisen ruoka-alan konsortio data-avaruuden kehittämiseksi lähti aktiivisesti liikkeelle, mutta käytännön liiketoimintaprojektit ovat kuitenkin toistaiseksi jääneet vähiin. Maatalous- ja ruokatuotannon toimiala on hajanainen ja se vaikeuttaa toimijoiden tavoittamista ja sitouttamista yhteisiin datan jakamisen tavoitteisiin ja toimintaan. Data-avaruuden ideasta on vaikea viestiä yleiskielellä, ja siksi esimerkiksi maatalousyrittäjien kiinnostusta on hankala herättää.

Hankkeen seuraavana tavoitteena on konkretian lisääminen sekä data-avaruuden käyttäjämassan kasvattaminen ensin Suomessa ja sitten Euroopassa. Konsortio pyrkii hankkimaan rahoitusta, sitouttamaan suuria avainyrityksiä mukaan ja selkeyttämään toimijoiden välistä yhteistyötä. Kansallisesti pyritään myös tuomaan yhteen erilaiset alkutuotantoon liittyvät, mutta laajemmin ruokaketjua kattavat data-avaruusaloitteet, kuten Business Finlandin veturihanke Food Data Finland. Aktiivisempaa viestintää toivottaisiin erityisesti ministeriötasolta. On siis tärkeää muistaa, että myös maatalousalalla on datataloutta.

Potato-X – maatalouden data-avaruuspilotti

Annetaan viljelijöille mahdollisuus hallita luomaansa dataa, hyötyä siitä ja päästä käsiksi satoa parantaviin lisäarvopalveluihin.

Potato-X on Sitran yhteisrahoittama kokeilu, jonka tarkoituksena on mahdollistaa perunanviljelykoneiston synnyttämän datan virtaus yli organisaatio- ja maarajojen, hyödyntämällä samalla datan välityspalveluita. Yhteentoimivan datan välityspalveluiden verkoston avulla voidaan mahdollistaa lisäarvopalvelut kuten sadon optimoinnin ja viljelijöiden kannattavuuden sekä tuottavuuden kasvattaminen.

Pilottiin osallistuvat data-avaruuksien hallintomalleja ja infrastruktuuria kehittävät suomalaisyritykset 1001 Lakes ja DataSpace Europe, sekä perunanviljelyyn liittyviä koneita maahantuova Klåvus Group. Belgiasta pilottiin osallistuvat Flanderin alueen maatalouden tutkimusinstituutti EV-ILVO ja maatalouskoneita valmistava AVR Belgium.

Pilotissa perunanviljelijän data virtaa sitä tuottavasta koneesta AVR:n alustalle (AVR Connect), joka on kytketty ILVO:n palveluun (DJustConnect). Sieltä data haetaan DataSpace Europen Tritom-palvelun kautta suomalaisen viljelijän maatilan tietohallintajärjestelmään (Centria DataSato), jossa dataa voidaan esimerkiksi visualisoida ja yhdistää muuhun maatilan ja viljelijän dataan.

Pilotti yhdistää palvelut, joita on alun perin kehitetty ja tarjottu itsenäisesti eri aikoina ja maissa. Eri palveluiden ja niiden ekosysteemien yhdistäminen vaatii yhteensovittamista esimerkiksi liiketoiminnan pelisääntöjen, suostumuksenhallinnan ja hallintomallien parissa. Nämä ovat edellytyksiä maan rajojen yli ulottuvan maanviljelyn data-avaruuden luomiselle.

Taival Advisory avustaa pilotin osallistujia arvioimaan liiketoiminnan arvonluontia, arvoketjua ja liiketoimintamalleja. Käyttötapausten alustavan analyysin ja oletusten perusteella varovainen arvio on, että maatalouden data-avaruutta käyttämällä yksittäinen maatila voisi kasvattaa bruttotulojaan tuhansilla euroilla vuodessa. Lisäksi data-avaruus edistäisi datan kaupallistamismahdollisuuksien luontia ja kasvattaisi datamarkkinan kokoa sadoilla tuhansilla euroilla vuodessa.

4.4 Energia

Fingrid Datahub

Data-avaruudet ovat juuri oikea suunta kehitykselle, jonka keskiössä ei ole aina julkinen toimija vaan yksityisiä palvelukehittäjiä.

Julkisomisteinen Fingrid on kehittänyt sähkömarkkinoiden Datahub-palvelua jo yli kahdeksan vuoden ajan ja se on ollut tuotannossa nyt kaksi vuotta. Datahubin tehtävä on toimia sähkön vähittäismarkkinoiden tiedonvaihtoalustana, jonka kautta voidaan jakaa esimerkiksi dataa sähkösopimuksista ja mittaustietoja sähkön kulutuspisteistä. Datan hyödyntäjinä ovat erityisesti sähkön myyjät ja jakeluverkkoyhtiöt, mutta myös erilaiset palveluntarjoajat, jotka eivät liity suoraan sähkön myyntiin tai siirtoon.

Fingrid ja sen Datahubia pyörittävä tytäryhtiö Fingrid Datahub tekevät säännellysti tuottoa, mutta niiden toiminta perustuu ensisijaisesti julkiseen tehtävään. Tämän takia Datahub koetaan riittävän neutraaliksi tahoksi toimimaan monenvälisen datan jakamisen orkestraattorina.

Datahubin yhtenä tavoitteena on tarjota sähkömarkkinoihin liittyvää dataa yhdestä paikasta kaikille, jotka tarvitsevat sitä palvelujensa tarjoamiseen ja toteuttamiseen. Käyttökohteita sähkömarkkinadatalle onkin paljon, esimerkkeinä energiatehokkuuden edistäminen ja päästöjen vähentäminen, huoltovarmuuden vaatimukset sekä liikenteen sähköistyminen.

Suomessa data-avaruuksien kehittämisessä jotkut toimialat, kuten liikenneala ovat energia-alaa pidemmällä. Sähkömarkkinadatan jakamisessa ja hyödyntämisessä Suomi on kuitenkin kärkijoukoissa Tanskan, Ruotsin ja Norjan kanssa. Suomea käytetään myös yhtenä verrokkina EU:n sähköalan yhteentoimivuuteen tähtäävässä European distributed data infrastructure for energy (EDDIE)-hankkeessa. Tällä hetkellä eri maiden kansallisten Datahubin kaltaisten palvelujen välistä datan vaihdantaa ei vielä ole, mutta vähittäismarkkinoille ollaan kehittämässä standardia, joka auttaisi mahdollistamaan myös maiden välisen datan jakamisen ja hyödyntämisen.

4.5 Älykaupungit ja rakennettu ympäristö

Älykaupungit ja rakennettu ympäristö on data-avaruuksien kehittämisen toimialana poikkileikkaava ja yhdistyy monien muiden toimialojen, kuten liikenteen, energian ja paikkatiedon data-avaruuskehitykseen. Suomalaiset älykaupunkeihin ja rakennettuun ympäristöön liittyvät data-avaruustekemiset vastaavat muun muassa kehittyvän vastuullisuusraportoinnin datatarpeisiin.

Organisaatioiden vastuullisuusraportointi (ESG; environmental, social, governance) pitää sisällään tietoa organisaation vastuullisuustavoitteista ja riskinhallinnasta sekä toiminnan vaikutuksista ympäristöön, ilmastoon ja ihmisiin. Kirjanpitolain mukaisesti suuryrityksillä on velvollisuus raportoida vastuullisuudestaan vuosittain, mutta muille vuosittainen raportointi on toistaiseksi vapaaehtoista. Raportointivaatimukset tulevat kuitenkin laajenemaan EU:n kestävyysraportointidirektiivin (CSRD, Corporate Sustainability Reporting Directive) myötä. Raportointi edellyttää vastuullisuuden tunnuslukujen mittaamista ja läpinäkyvyyttä.

CO2 Datahub

Pisimmällä olevien data-avaruushankkeiden helpoimmin ymmärrettävä ajuri on kustannussäästö, joka on mahdollista saada esimerkiksi energian käyttöä optimoimalla.

Rakennetun ympäristön data-avaruustekemisestä löytyy esimerkkinä kaksi eri hanketta: suomalainen CO2 Datahub ja eurooppalainen Construction Data Space. Näiden hankkeiden puitteissa on toteutettu pilotteja, joilla on havainnollistettu rakennusalan hiilijalanjälkidatan hyödyntämisen taloudellisia vaikutuksia. Piloteissa muun muassa yhdistettiin huoltoliiketoiminnan dataa suuren kiinteistönomistajan kiinteistödataan ja optimoitiin toimitilavuokraukseen liittyvien muutosten ilmastovaikutuksia yhdistämällä kiinteistödataa päästötietoihin.

CO2 Datahub loi rakennusteollisuuteen, logistiikkaan sekä kiinteistöjen energiankulutukseen uusia hiililaskennan, vastuullisuusraportoinnin sekä datalla johtamisen menetelmiä. Hanke loi perustan rakennetun ympäristön ESG-ekosysteemin toiminnalle Suomessa ja auttoi määrittelemään kansainvälisiä periaatteita hiilijalanjälkidatan käsittelyyn. Projektiin osallistuneet organisaatiot saivat ymmärrystä toimitusketjunsa jalanjäljen määrittämisestä, hiilijalanjälkidatan hallinnasta ja toimitusketjun osista, joissa ympäristövaikutuksia voidaan taloudellisesti vähentää.

Pilottivaiheen jälkeen CO2 Datahub -hanke jatkaa eloaan KIRAHubin eli kiinteistö- ja rakentamisalan innovaatio- ja dataverkoston alla. Toisen hankkeen eli EU-tason Construction Data Spacen jatko Suomessa riippuu kansallisen rahoituksen löytymisestä, joka on viime aikoina ollut kiven alla. Hankkeen painopiste on siirtymässä Ranskaan, jossa paikallista rahoitusta on onnistuttu löytämään. Hiilijalanjälkidataan liittyviä kansallisia verkostoja on useita esimerkiksi Saksassa, Hollannissa, Ranskassa ja Iso-Britanniassa.

Rakennusalan hankkeissa painotetaan taloudellista motivaatiota. Vaikka yritykset lähestyvät datan jakamista ja data-avaruuksia eri lähtökohdista, toiminnalla pitää olla kytkentä yrityksen strategiaan ja taloussuunnitteluun. Onnistuminen edellyttää, että yrityksille löydetään sopivat liiketoimintamallit data-avaruustekemiseen. Tässä hyödyksi ovat sellaiset kokeilut, joilla voidaan osoittaa nopeasti taloudellinen hyöty. Uudet innovaatiot vievät aikaa ja ne syntyvät usein sivutuotteena vanhojen kysymysten ratkaisemisesta.

DataMust ja LuxTurrim5G

Uskallammeko antaa dataa ulos, vaikka siitä saisi vähän rahaakin, vai meneekö meidän bisnes siinä samalla?

Nokian vetämässä LuxTurrim5G-hankekokonaisuudessa on työskennelty älykaupungeissa tapahtuvan rakennetun ympäristön datan jakamisen ja yhteiskäytön eteen kymmenien osallistujaorganisaatioiden voimin. Mukana oli Nokian lisäksi tutkimuslaitoksia, suomalaisia kaupunkeja sekä Traficom.

Uuden sukupolven 5G-dataverkon rakentamiseen tarvittiin tiheästi sijoitettujen tukiasemien paikkoja kaupungeista. Toisaalta kaupungeilla oli tarve kerätä ja hyödyntää reaaliaikaista dataa esimerkiksi liikenteestä ja päästöistä, jotta ne voisivat vastata vastuullisuustavoitteisiin. Ratkaisuna tarpeisiin olivat kaupunkeihin pystytettävät älypylväät, jotka toimivat kotina 5G-verkon tukiasemille sekä erilaisille antureille.

LuxTurrim5G-hankkeen aikana huomattiin, että datan jakaminen ei olekaan täysin mutkatonta. Kaupallistamisessa haastavinta on ollut luoda eri toimijoille uskallusta ja luottamusta datan myymiseen ja jakamiseen. DataMust-jatkohankkeessa ydinpartnerit ovat lähteneet taklaamaan tätä haastetta rajaamalla datan käyttötarkoituksia ja datan jakamiseen osallistuvia tahoja riittävän pieniin “soluihin” ja kehittämällä solumaista markkinapaikkaa, jossa toimii ainoastaan orkestraattori ja pieni toimijaporukka. Markkinapaikan kaupallistaminen on vielä kesken, mutta hankkeiden tuloksia, kuten älypylväitä ja niihin perustuvaa datan jakamista on kuitenkin tarkoitus hyödyntää myös jatkossa.

Data-avaruuden infrastruktuuri eli esimerkiksi datamarkkinapaikan alusta on yksinään mittava investointikohde. Lupaavimmat hankkeet on toteutettu julkisrahoitteisissa ympäristöissä sekä yksityisiä 5G-verkkoja hyödyntävissä ympäristöissä, kuten satamissa. Datamarkkinapaikan orkestraattori on todettu hankkeissa kriittiseksi menestystekijäksi. Data-avaruuksissa neutraalin vastuunkantajan tehtävänä on mahdollistaa datan monetisointi ja käyttö niin, että osapuolten välinen luottamus säilyy. Jos kukaan ei halua ottaa tästä tehtävästä koppia, toimintaa ei synny.

4.6 Julkinen sektori

Julkishallinnon toimintaa ohjaa lainsäädäntö, joka asettaa reunaehdot viranomaisten hallussa olevan tiedon luovuttamiselle ja käytölle. Lakisääteisten tehtävien osalta viranomaisella ei ole mahdollisuuksia hyödyntää toiminnassaan muuta tietoa kuin mitä laki viranomaistehtävän suorittamista varten sallii kerättäväksi asiakkailta ja muista tietolähteistä. Käytännössä viranomaisten tietoluovutukset määritellään nykyään tapauskohtaisesti tietoluvan myöntämisen yhteydessä. Lisäksi useilla organisaatioilla on päällekkäisiä tietoja, mutta ne eivät ole yhteensovitettavissa, koska kaikki organisaatiot tarjoavat tietojaan hieman eri termejä käyttäen. Julkisen hallinnon data-avaruuden visiona on, että viranomaisten välisessä tietojenvaihdossa siirryttäisiin räätälöidyistä tiedonluovutuksista kohti laajasti käytettäviä datatuotteita, joita voi hyödyntämistä monessa eri tilanteessa.

Julkishallinnon data-avaruus keskittyy julkista tehtävää hoitavien toimijoiden kykyyn jakaa tietoa ymmärrettävässä ja hyödyllisessä muodossa eri tahoille. Data-avaruus vähentää päällekkäistä työtä ja tiedon kopiointia, sekä kiihdyttää digitaalisten palveluiden kehitystä ja tarjoaa mahdollisuuden uudenlaisiin palvelukonsepteihin, jotka vastaavat paremmin kansalaisten ja yritysten tarpeisiin.

Julkishallinnon data-avaruus voidaan nähdä yhteisenä datainfrastruktuurina elämäntapahtumiin ja liiketoimintatapahtumiin liittyvien digitaalisten palvelukokonaisuuksien. Palvelukokonaisuudella viitataan tilanteeseen, jossa ihmisen elämässä tai yrityksen toiminnassa tapahtuu sellainen muutos, joka edellyttää asiointia useiden viranomaisten kanssa. Suomen digikompassin yhtenä tavoitteena on määritellä sekä digitalisoida noin 40 merkittävintä ja vaikuttavinta elämäntapahtumiin ja liiketoimintatapahtumiin liittyvää palvelukokonaisuutta vuoteen 2030 mennessä. Eri elämän- ja liiketoimintatapahtumissa tarvitaan osin samoja tietoja. Aiemmin toteutettujen palvelukokonaisuuksien vaatimat tiedot olisivat data-avaruuden kautta saatavilla datatuotteina, joita voi suoraan hyödyntää muissa käyttötapauksissa.

Suomessa monilla toimijoilla on tahtoa edistää julkishallinnon digitaalisten palveluiden yhteentoimivuutta. Jotta tieto saadaan aidosti liikkeelle siiloistaan elämän- tai liiketoimintatapahtumien tehostamiseksi, on tiedettävä mitä tietoa missäkin on. Vielä toistaiseksi on puuttunut työtä koordinoiva foorumi, jossa voitaisiin varmistaa yhteinen suunta, tarvittavat tekniset ratkaisut ja nopeuttaa yhteensopivuutta edistävien kokeilujen käynnistämistä. Julkishallinnon data-avaruutta on konseptoitu Kelan luotsaamassa epämuodollisessa työryhmässä. Virtual Finland -testialusta puolestaan tarjoaa alustan data-avaruusaihioiden ja datan tuotteistamisen kokeilemiseen. EU:n komission data-avaruus suunnitelmissa esiintyy julkishallinnon data-avaruus nimellä Data Space for Public Administration. Se ei kuitenkaan ole vielä konkretisoitunut ja Suomella olisi mahdollisuus olla tässä suunnannäyttäjä.

Virtual Finland

Suomen digikompassin tavoitteisiin ei päästä ilman data-avaruuskehitystä.

Julkishallinnon data-avaruus on ollut Virtual Finland -hankkeessa testikäytössä vuodesta 2022 ja yhden pilotin tuotantokäytössä vuoden 2024 alusta alkaen. Hankkeen kautta on avattu yhteistyökanavia ministeriöiden välillä ja saatu monia keskusteluja aikaan. Ulkoministeriö on pohtinut elämäntapahtumien digitalisaatiota muun muassa valtiovarainministeriön, Verohallinnon sekä Maahanmuuttoviraston kanssa. Näitä organisaatioita yhdistävä käyttötapaus data-avaruudelle on työperäiseen maahanmuuttoon liittyvän asioinnin yhtenäistäminen ja digitalisointi.

Virtual Finland -kokeiluympäristössä on tehty hankkeen omia sekä muiden tahojen toteuttamia ja rahoittamia datan jakamisen kokeiluja, kuten esimerkiksi Nordic Smart Government & Business -ohjelman kanssa toteutettu kokeilu, jossa testattiin standardoidun yritystiedon välittämistä Suomen, Ruotsin ja Norjan veroviranomaisten sekä yritysrekisterien välillä.

Data-avaruushankkeelta toivotaan jatkossa lisää konkretiaa onnistuneiden käyttötapausten kautta. Myös datan monetisaatioajattelua tahdotaan kehittää etenkin elämäntapahtumien digitalisaation kontekstissa, jossa tarvitaan yhteistyötä myös yritysten kanssa. Laajempana tavoitteena on tehdä Suomesta edelläkävijä julkishallinnon data-avaruuskehityksen suhteen, jolloin suomalaisia tuotteita ja osaamista voidaan myydä myös ulkomaille.

4.7 Kiertotalous ja digitaalinen tuotepassi

Kiertotalouden kasvu edellyttää parempaa digitalisaation hyödyntämistä, sekä materiaali- ja toimialarajat ylittävää tuotetiedon jakamista yritysten, organisaatioiden ja kuluttajien välillä. Keskeinen kiertotalouden digitalisaatioon liittyvä konsepti on digitaalinen tuotepassi, joka tarjoaa tarkkaa ja luotettavaa tietoa tuotteesta läpi sen valmistus- ja kuljetushistorian. Digitaaliset tuotepassit ovat keino koota yhteen dataa tuotteiden kestävyydestä, raaka-aineista, materiaaleista ja turvallisuudesta. Ne tarjoavat kuluttajille tietoa läpinäkyvästi, edistävät vastuullista liiketoimintaa ja voivat nopeuttaa siirtymistä kiertotalouteen. Parhaimmillaan ne voivat myös mahdollistaa uusia kiertotalouden liiketoimintamalleja.

Kattavan tuotetiedon avulla voidaan parantaa yritysten tuottavuutta, resurssitehokkuutta ja tuotteiden jäljitettävyyttä valmistus- ja jakeluketjussa. Myös tuotteiden elinkaari pitenee, kun data helpottaa tuotteiden huoltoa, korjauksia ja kunnostusta. Dataa tarvitaan myös tuotteen elinkaaren loppupäässä materiaalien turvallisen talteenoton ja uudelleenkäytön tueksi.

Tuotepassit ovat yksi keino Euroopan komission tavoitellessa digitaalista ja vihreää siirtymää. Lähivuosina EU-sääntely tulee määrittelemään tietovaatimuksia digitaalisille tuotetiedoille. Komissio on toivonut eri toimialoilta ratkaisuja digitaalisen tuotepassin kehittämiseksi, erityisesti tekstiilituotteiden, akkujen ja elektroniikkalaitteiden osalta. Komissio rahoittaa digitaalisten tuotepassien kehittämistä lukuisissa hankkeissa. Yksi hankkeista on CIRPASS-2, jossa mukana on myös suomalaisia toimijoita. Suomalaisessa keskustelussa digitaaliset tuotepassit nähdään yhteydessä data-avaruuksiin, vaikkei Euroopan komissio olekaan listannut kiertotaloutta ja digitaalisia tuotepasseja erillisenä alueena yhteiselle eurooppalaiselle data-avaruudelle.

Liikkuvien työkoneiden akkupassikokeilu

Toimialojen välinen tiedonjako on jotain mitä oikeasti tarvitaan. Se myös tehostaisi kaikkien työtä.

SIX Mobile Work Machines -liikkuvien työkoneiden klusteriin kuuluvat johtavat pohjoismaiset työkonevalmistajat Sandvik, Kalmar, Valtra, Ponsse, Junttan, Normet ja Tana sekä avainteknologiakumppanit Valmet Automotive, Epec, Danfoss, Hevtec ja Nokia. Sitra rahoitti klusterin toimijoiden kanssa kokeilua, jossa kehitetään digitaalista akkupassia liikkuvien työkoneiden akkujen elinkaaren läpinäkyvyyden parantamiseksi.

Tavoitteena on auttaa asiakasta saamaan työkoneestaan enemmän irti akkudatan avulla sekä palauttamalla akkuvalmistajalle hyödyllistä dataa tuotekehitystä varten. Samalla tehostetaan akkuihin liittyvää kiertotaloutta ja pidennetään akkujen elinkaarta uusiokäytöllä. EU:n datasäädöksen myötä vuonna 2024 voimaan astuva akkupassidirektiivi tekee akkupassista pakollisen.

Akkupassi kokoaa yhteen akkujen tunnistetiedot, työkoneen käyttöä koskevat tiedot ja akun elinkaaren tiedot. Koottuna tämä tieto hyödyttää monipuolisesti eri toimijoita, kuten koneiden käyttäjiä, teollisuusyritysten asiakkaita ja viranomaisia esimerkiksi työkoneiden ja tuotantoketjujen päästötietojen arvioinnissa.

Kokeilu toteutettiin Virtual Finland -testiympäristössä, jonne rakennettiin prototyyppi teollisen datan data-avaruudesta. Se on yksi ensimmäisistä käytännön ratkaisuista Euroopan komission akkupassisääntelyn toteuttamiseksi. Kokeilu osoitti, kuinka akkupassi on mahdollista toteuttaa ja miten sen tarjoamat tiedot voivat auttaa teollisuuden toimijoita esimerkiksi päästöjen laskennassa ja vähentämisessä.

Kokeilu toi suuren joukon toimijoita saman pöydän ääreen miettimään datan jakamiseen liittyviä kysymyksiä eri näkökulmista. Hankkeen avulla akkudatan hyödyntämisessä ja digitaalisten tuotepassien kehityksessä on edistytty huomattavasti. Projektin tuoteläheisyys lisäsi yritysten kiinnostusta ja halukkuutta osallistua. Käyttötapauksissa on riittävän suora linkki yritysten asiakkaisiin.

Myös ekosysteemitoimijoiden välisen luottamuksen synnyttäminen ja yhteisten pelisääntöjen sopiminen on ollut onnistumisen kannalta tärkeää. SIX Mobile Work Machines voi toimia innoittavana esimerkkinä liiketoimintakeskeisen data-avaruuden luomisessa. Hankkeen oppeja voidaankin soveltaa myös muilla toimialoilla, joilla toimijoiden välinen tiedonjako olisi hyödyllistä.

4.8 Kielimallit ja tekoäly

Generatiivinen tekoäly on riippuvainen kielidatasta ja datan pohjalta luoduista kielimalleista. Kielimalleja hyödyntävien tekoälysovellusten mahdollisia käyttökohteita ja liiketoimintapotentiaalia ei tarvitse hakea kaukaa. Esimerkiksi mediatoimialalla sisällöntuotannossa tai vaikkapa lääkäreiden työssä potilaskertomusten kirjaamisessa tekoäly voi nopeuttaa työtä huomattavasti.

Kielidata-avaruuden tavoitteena on kerätä kielidataa ja rakentaa kaikilla eurooppalaisilla kielillä toimivat kielimallit sekä mahdollistaa tätä kautta tekoälyn laaja hyödyntäminen kansallisissa ratkaisuissa.

Viime vuosina on jo tehty useita kansallisia hankkeita kielidatan ja tekoälyn ympärillä, kuten kieliaineistoja hallinnoiva Kielipankki, Lahjoita puhetta -kampanja, puheliittymä tekoälylle, sekä Turun yliopiston ja Silo AI:n tekemä suomen kielen Poro-kielimalli. Lisäksi Business Finlandin rahoittama Language Resource Infrastructure for AI (LAREINA) -hanke pyrkii kansallisen dataekosysteemin kehittämiseen kieliteknologioiden ympärillä.

Eurooppalainen kieliteknologioiden konsortio

Tekoäly vaatii toimiakseen kielidataa sekä kielimalleja, Suomella on näissä vahvaa osaamista.

Suomessa ei toistaiseksi ole yhtä kansallista data-avaruuslähtöä kieliteknologian alueella, vaan kansallisella tasolla tavoitteena on ollut kytkeytyä eurooppalaiseen kehitystyöhön. Suomella on pitkä historia kieliteknologioissa ja vahvaa asiantuntemusta yhteistyön rakentamiseen liittyvistä sopimusmalleista. Nämä luovat hyvän pohjan osallistumiseen Euroopan tason kielidata-avaruuden kehittämiseen ja voisivat tarjota myös potentiaalia vientituotteiden kehittämiseen.

Euroopan tasolla kielidata-avaruuden perustamiseen tähtäävää työtä on vuodesta 2024 alkaen koordinoinut Ranskan vetämä Alliance for Language Technologies European Digital Infrastructure Consortium (ALT-EDIC). ALT-EDIC:in tavoitteena on luoda perusedellytykset tekoälyratkaisuissa tarvittavan eurooppalaisen kielidata-avaruuden luomiseksi.

Suomen kannattaa olla mukana kansainvälisessä yhteistyössä kielidata-avaruuksiin liittyen. ALT-EDIC:in alaisuuteen olisi hyvä perustaa Suomen konsortio, joka toimii osana kansainvälistä verkostoa. Mukaan kannattaisi koota niin akateemisia toimijoita kuin yritysmaailman edustajia. Tällainen konsortio voisi käsitellä kielidataan, kielimalleihin ja tekoälyyn liittyviä toimialakysymyksiä ja käyttötapauksia yli toimialarajojen.

4.9 Media ja tekijänoikeudet

Sisällöntuotantoon, mainontaan, personointiin ja tekijänoikeuksiin liittyvät datan jakamisen verkostot ovat jo pitkään olleet tärkeä osa digitalisoituneen media-alan toimintaa. Nyt toimiala on aktivoitunut myös eurooppalaisessa data-avaruuskehityksessä.

Suomella on pitkään ollut opetus- ja kulttuuriministeriön johdolla aktiivinen rooli EU-tasolla sekä kansainvälisissä järjestöissä tekijänoikeusdatan ja tekijänoikeusinfrastruktuurin kehittämisessä.  Tämän takia tekijänoikeudet ovat myös yksi viidestä Suomen digikompassissa priorisoiduista alueista, joille pitäisi kehittää data-avaruudet. Eurooppalaisessa data-avaruuskeskustelussa tekijänoikeudet eivät näy omana erityisenä teemanaan, mutta ne liittyvät keskeisesti moniin muihin data-avaruuksiin, kuten mediadata-avaruuteen ja kielidata-avaruuteen.

Eurooppalainen mediadata-avaruus

Kielisiilojen rikkominen on eurooppalaisen media-alan globaalin kilpailukyvyn kannalta ensiarvoisen tärkeää.

Trusted European Media Data Space (TEMS) on vuoteen 2026 saakka jatkuva Euroopan komission rahoittama media-alan data-avaruuden toteutushanke. Hankkeessa on mukana yhteensä 43 kumppania 14 maasta ja hankkeen puitteissa toteutetaan kahdeksan pilottia. Suomesta on mukana 1001 Lakes. Piloteissa jaetaan esimerkiksi faktantarkistukseen liittyvää dataa yli organisaatiorajojen, sekä kehitetään monikielisiä hakutoimintoja. Haun avulla mediasisältöä voi hakea omalla kielellä millä tahansa Euroopassa puhutulla kielellä tehdyistä sisällöistä. Mediaorganisaatioihin ja liiketoimintaan painottunut hanke pyrkii tarjoamaan media-alalle keinoja datapohjaiseen yhteistyöhön sekä avaamaan alan toimijoille uusia datapohjaisia liiketoimintamahdollisuuksia.

Media-alan data-avaruuden tavoitteena on parantaa eurooppalaisen media-alan innovaatiovalmiuksia, jotta se voisi kilpailla suurten kansainvälisten alustayritysten, kuten Facebookin, Amazonin, Applen, Netflixin ja Googlen kanssa. Tarkoitus on myös tukea eurooppalaisen media-alan kilpailukykyä verrattuna yksikielisiin – erityisesti englanninkielisiin mediamarkkinoihin.

Data-avaruudella halutaan helpottaa sisältöjen yhteistuotantoa ja yhteisjakelua, sekä tehostaa tiedon uudelleenkäyttöä erilaisten mediasisältöjen tuotannossa ja kuratoinnissa. Yhteinen eurooppalainen mediadata-avaruus yhdistää mediatoimijoiden omia data-avaruustekemisiä kokonaisuudeksi, joka on yhteydessä myös muihin data-avaruuksiin.

Tekijänoikeusinfrastruktuuri

Tekijänoikeusdatan hallinnassa teosten tekijä pitää nostaa pohjamudista keskiöön.

Opetus- ja kulttuuriministeriön koordinoiman tekijänoikeusinfrastruktuurin kehittämisen tavoitteena on luoda datan hyödyntämisen kokonaislogiikkaa luoville aloille data-avaruusajattelua hyödyntäen. Tekijänoikeuksiin liittyvän data-avaruustyön haasteena on hyvin pirstaleinen toimijakenttä. Suomessa luontevaa kansallista orkestraattoria tekijänoikeusinfrastruktuurille ei ole löytynyt tai syntynyt. Opetus- ja kulttuuriministeriö on vienyt teemaa merkittävästi eteenpäin, mutta toimijakentästä nouseva orkestraattori olisi silti tarpeellinen.

Parempi tekijänoikeusinfrastruktuuri hyödyttäisi luovien alojen toimijoita, kuten sisällöntuottajia, jakelualustoja, tekijänoikeusjärjestöjä ja loppukäyttäjiä. Kehittyneempi tekijänoikeusdata ja sen välitys mahdollistaisi oikeudenmukaisemman korvausmallin tekijöille, selkeyttäisi teosten käyttöoikeuksien hallintaa ja edistäisi uusien innovatiivisten sisältöpalvelujen syntymistä. Yhtenäiset tunnisteet ja avoimien rajapintojen kautta saatavat metatiedot helpottaisivat teosten tunnistamista ja tekijänoikeuksien selvittämistä. Varmennetun tekijänoikeusdatan avulla voidaan myös varmistaa, onko jokin teos ihmisen vai tekoälyn luoma ja liittyykö siihen tekijänoikeuksia.

Tekijänoikeusdatan välittämisen nykytilanteessa on merkittäviä teknisiä puutteita sekä toimijoiden välistä epätasapainoa. Kehityksessä pitää nostaa etusijalle teosten tekijöiden saamat hyödyt. Dataekosysteemin tasapainon näkökulmasta on tärkeää, kenen hallinnoimaa ja tarjoamaa tekijänoikeuksiin liittyvä metadata on. On eri asia ovatko hallinnointivastuussa esimerkiksi tekijänoikeusjärjestöt vai isot mediasisältöjä jakelevat alustajätit.

Kansallinen aineettomien oikeuksien strategia määrittää yhdeksi tavoitteeksi tunnisteita ja rajapintoja koskevan osaamisen lisäämisen Suomessa. EU:n elpymis- ja palautumistukivälineen (RRF) rahoituksella Suomessa on saatu otettua käyttöön ISNI-siltatunniste tekijänoikeusjärjestöissä.

Suomi on vaikuttanut vahvasti EU-tason tekijänoikeusaloitteissa pitämällä esillä tekijänoikeuskysymysten ja datatalouden välistä kytköstä. Suomen EU-puheenjohtajakaudella vaikutettiin suoraan EU:n data- ja digistrategiaan, johon tuli useita viittauksia tekijänoikeusinfrastruktuuriin ja sen kehitystarpeisiin. Globaalisti tekijänoikeussopimusten laatimisesta vastaavan, maailman henkisen omaisuuden järjestö WIPO:n toiminnassa on noussut tärkeäksi teemaksi tekijänoikeusdatan suojaaminen muuttamista ja poistamista vastaan. Suomi on ollut aiheessa näkyvästi aloitteellinen.

5. Kahdeksan oppia suomalaisilta data-avaruushankkeiden tekijöiltä

Kokosimme eri toimialojen asiantuntijoiden haastatteluista esille nousseet opit, jotka koskettavat kaikkea data-avaruuskehittämistä toimialasta riippumatta.

1. Suuri tarve neutraaleille orkestraattoreille. Monilla toimialoilla on tunnistettu tarve data-avaruuden orkestraattorille, joka vie toimintaa eteenpäin ja edistää luottamusta ja yhteistyötä osallistujien kesken. Tunnistetusta tarpeesta huolimatta orkestraattorin roolille ei ole useimmiten ottajia. Saavuttaakseen ekosysteemin toimijoiden luottamuksen orkestraattorin tulee olla neutraali toimija. Neutraaliuden vaatimus voi olla hankala yhdistää siihen, että orkestraattorillakin tulee olla selkeä motiivi tai ansaintamalli, sillä fasilitointi vaatii resursseja ja osaamista.

2. Data-avaruus tarjoaa reilut pelisäännöt ja tasoittaa toimijoiden välisiä epäsuhtia. Joillain toimialoilla toimijoiden välillä on yhteistyötä haittaavia epäsuhtia, joita data-avaruudet voivat auttaa ratkaisemaan. Data-avaruus voi luoda läpinäkyvyyttä ja avoimuutta ruokkivan ympäristön ja tarjota yhteiset käytänteet ja pelisäännöt. Data-avaruuteen nojautuen on myös helpompi rakentaa datan jakamiseen liittyvistä liiketoimintamalleista selkeitä, oikeudenmukaisia ja kaikille osapuolille reiluja. Osallistamalla käyttäjät ja sidosryhmät data-avaruuden ja sen sääntökirjan kehittämiseen voidaan varmistaa, että syntyvät ratkaisut ovat laajalti hyväksyttyjä.

3. Useimmat data-avaruushankkeet ovat vielä esikaupallisessa vaiheessa. Maksavia asiakkaita data-avaruuksiin pohjautuville ratkaisuille etsitään aktiivisesti kotimaasta sekä erityisesti ulkomailta. Data-avaruushankkeen pitää pystyä tarjoamaan selkeää hyötyä mahdollisille osallistujille. Konkreettiset käyttötapaukset toimivat näyttönä data-avaruuden hyödyistä ja mahdollistavat kriittisen massan saavuttamisen nopeammin. Siitä huolimatta, että käyttötapauksia pidetään menestyksen avaimena, käytännön tason toteutuksia on toistaiseksi kehitetty suomalaisissa data-avaruushankkeissa vähän. Yhtenä syynä voi olla, että infrastruktuuriin investointi on iso ja välttämätön panostus käyttötapausten pilotointiin. Olemassa olevat testiympäristöt, kuten Virtual Finlandin testialusta voivat tarjota mahdollisuuden käyttötapausten konkretisointiin ilman mittavia infrastruktuuri-investointeja.

4. Ajatusjohtajuus pitää osata muuttaa markkinajohtajuudeksi. Suomi on onnistuneesti ollut aloitteellinen ajatusjohtaja Euroopan tasolla muutamilla toimialoilla, kuten kiertotaloudessa ja tekijänoikeusinfrastruktuurissa. Ajatusjohtajuus luo vankan perustan, jonka päälle pitäisi voida rakentaa myös markkinajohtajuutta. Monilla toimialoilla data-avaruuksien kehittämiseen liittyvä vientipotentiaali on hyvin tunnistettu ja jotkut toimijat ovat saaneet Business Finlandin tukea kansainvälistymispyrkimyksiinsä. Ajatusjohtajuuden muuntaminen vienniksi edellyttää toimialarajat ylittävää panostusta vienninedistämiseen, innovaatioihin ja kansainväliseen yhteistyöhön. Tavoitteena on, että Suomi vie maailmalle data-avaruuksiin liittyvien ideoiden ja ajatusten lisäksi myös tuotteita ja palveluita.

5. Yhteistyö ja kansainväliset yhteydet ovat erittäin tärkeitä ja tarvitsevat asianmukaisen kansallisen panostuksen. Useimmat haastatellut asiantuntijat korostavat yhteistyön ja verkostoitumisen keskeisyyttä. Kansallinen toimialojen välinen ja kansainvälinen eurooppalaisiin data-avaruuksiin kytkeytyvä yhteistyö kiihdyttävät innovaatioita ja parantavat suomalaisten data-avaruushankkeiden kilpailukykyä. Data-avaruushankkeiden välillä pitää jakaa hyviä käytäntöjä sekä myös tietoa epäonnistumisista ja niistä saaduista opeista. Yksi data-avaruuksien kehittämiseen liittyvä yhteistyömekanismi on European Digital Infrastructure Consortium (EDIC), joka mahdollistaa EU jäsenmaiden välisen koordinoidun yhteistyön. Data-avaruuksiin liittyen Suomi on mukana liikenteen EDIC:issa, mutta toiveena olisi, että Suomi liittyisi myös esimerkiksi kieliteknologioiden ja maatalouden EDIC:eihin. Myös Euroopan komission rahoittamat yhteisten eurooppalaisten data-avaruuksien toteutushankkeet ovat tärkeitä verkostoitumisen paikkoja. Suomalaisia on liian vähän mukana eurooppalaisissa data-avaruushankkeissa. Keskeinen haaste on kansallisen omarahoituksen puuttuminen, mikä estää monia toimijoita hyötymästä EU-rahoituksesta ja sitä kautta saatavista verkostoista.

6. Julkisten toimijoiden rooli data-avaruuskehityksessä vaatii kirkastamista. Data-avaruuskehityksessä julkisen sektorin toimijat peräänkuuluttavat yksityisen sektorin osallistumisen tärkeyttä, kun taas yksityinen sektori korostaa jo toimivansa itsenäisesti ilman julkista sektoria. Yksityisellä puolella tehdään jo paljon datan jakamista ja edetään paikoin nopeastikin, vaikka tätä ei aina nimetäkään data-avaruustekemiseksi. Yhteistyön ja vuoropuhelun parantaminen on avainasemassa, jotta voidaan hyödyntää eri sektoreiden vahvuuksia ja edistää Suomen data-avaruuskehitystä kokonaisvaltaisesti. On tärkeää löytää tapoja, joilla julkisen sektorin toimijat voivat tukea ja edistää yksityisen sektorin toimintaa ilman päällekkäisyyksiä. Tämä edellyttää molempien osapuolten sitoutumista avoimeen keskusteluun ja yhteisten tavoitteiden asettamiseen, jotta Suomelle voidaan rakentaa yhteinen pelikirja data-avaruuskehitykseen.

7. Sääntely voi olla vauhdittaja tai hidaste. Tietyillä toimialoilla kuten liikenteessä ja kiertotaloudessa säädökset ovat kiihdyttäneet yhteistyötä ja data-avaruuskehitystä, kun taas toisaalla EU:n tiukka sääntely nähdään kompastuskivenä. Millään toimialalla sääntelytarpeisiin vastaaminen ei kuitenkaan voi olla ainoa motiivi datan jakamiseen ja data-avaruuksiin, tai jos näin on, niin silloin toiminta ei ole kestävällä pohjalla. Sääntely voi tarjota myös liiketoiminnallisia mahdollisuuksia, kun se kannustaa avoimuuteen, läpinäkyvyyteen ja parantaa datan saatavuutta. Muuttuva lainsäädäntö ja standardit edellyttävät jatkuvaa seurantaa ja jatkuvaa vuoropuhelua sääntelijöiden, yritysten ja muiden toimijoiden välillä. Yksittäisellä data-avaruushankkeella on rajalliset mahdollisuudet tehdä tällaista seurantaa, mutta yhdistämällä voimiaan Suomalaiset data-avaruushankkeet voivat pysyä paremmin ajan tasalla sääntelyyn liittyvistä mahdollisuuksista ja vaatimuksista.

8. Henkilötietojen käsittely data-avaruudessa on haastavaa, mutta välttämätöntä. Kaikissa data-avaruuksissa tulevat tavalla tai toisella vastaan tietosuojakysymykset. Korostuneessa roolissa henkilötiedon käsittely on muun muassa osaamisen, energian, liikenteen, maatalouden ja julkisen sektorin data-avaruushankkeissa. Korkea tietosuojan taso lisää luottamusta data-avaruuksissa, mutta samalla vaatimusten täyttäminen henkilötiedon käsittelyssä on koettu haastavaksi. Haasteet liittyvät muun muassa datan luvitusten järjestämiseen ja seurantaan monitoimijaympäristössä. Suomalainen osaaminen ihmiskeskeisessä henkilötiedon käsittelyssä (MyData) on tässä arvokasta. MyData-lähestymistapa vahvistaa yksilöiden oikeuksia ja valtaa omiin tietoihinsa, edistäen samalla innovatiivisia ja kestäviä ratkaisuja datan hyödyntämiseen.

6. Suositukset

Kiteytimme haastatteluista ja taustatutkimuksista kohdennettuja suosituksia data-avaruuksien nykyisille ja tuleville osallistujille, sekä data-avaruushankkeiden tekijöille ja tukijoille.

6.1 Suositukset data-avaruuksien nykyisille ja tuleville käyttäjille

Suositus 1. Yhteistyötä ekosysteemeissä pitää vahvistaa. Yritysten ja organisaatioiden on panostettava omien datakyvykkyyksiensä ohella ekosysteemiyhteistyön kehittämiseen. Tämä tarkoittaa muun muassa yhteistyön ja verkostoitumisen lisäämistä sekä yhteisten tavoitteiden tunnistamista ja tukemista.

Suositus 2. Johdon sitouttaminen. Data-avaruuksien rakentaminen on pitkäjänteistä työtä, jonka hyödyt tuloutuvat, kun data-avaruuden infrastruktuuri on rakennettu ja riittävän moni toimija jakaa dataa keskenään sen avulla. Osallistuvissa organisaatioissa on tärkeää saada johdon tuki datan jakamiseen perustuvan liiketoiminnan pitkäjänteiselle kehitykselle. Ylimmälle johdolle tulee uskottavasti todentaa, mitä konkreettisia liiketoimintahyötyjä data-avaruuksien avulla on saavutettavissa ja miten data-avaruus suhteutuu verrattuna muihin mahdollisiin tapoihin järjestää datan liikkuminen yritysten välillä. Ylimmän johdon sitoutuminen varmistaa resurssit ja tarvittavan strategisen tuen myös silloin kun liiketoimintajohdon kärsivällisyyttä koetellaan.

6.2 Suositukset data-avaruuksien tekijöille

Suositus 3. Esimerkkien jakaminen ja vertaisoppiminen. Viestimällä konkreettisista käyttötapauksista data-avaruushankkeet vahvistavat omaa tunnettuuttaan ja lisäävät samalla myös yleistä ymmärrystä data-avaruuksista. Esimerkeistä oppiminen nopeuttaa innovaatioita ja parantaa ratkaisujen laatua kaikissa dataekosysteemeissä.

Suositus 4. Kansainvälisen verkostoitumisen vaikuttavuutta on lisättävä yhdistämällä voimia muiden data-avaruushankkeiden kanssa. Yhteistyöllä suomalaiset data-avaruuksien tekijät voivat parhaiten saada kansainvälistä näkyvyyttä. Data-avaruushankkeiden kannattaa pyrkiä yhdessä vahvaan ja kestävään suomalaiseen läsnäoloon kansainvälisissä data-avaruuksiin liittyvissä verkostoissa, kuten Gaia-X, IDSA ja muut vastaavat.

Suositus 5. Ajattele isosti alusta alkaen. Data-avaruuden rakentamisessa tulee alusta alkaen ottaa huomioon ekosysteemin laajentaminen ja yhdistyminen Eurooppa-tason data-avaruuksiin. Sopimusrakenteet ja tekniset ratkaisut kannattaa suunnitella niin, että ne mahdollistavat uusien toimijoiden mukaan ottamisen ja uusien käyttötapausten toteuttamisen mahdollisimman helposti. Lisäksi data-avaruuden kannattaa valmistautua siihen, että se voi yhdistyä muiden saman alan hankkeiden kanssa ja siten muodostaa laajan kansainvälisen verkoston.

Suositus 6. Varmista, että data-avaruudelle löytyy orkestraattori. Orkestraattorin rooli on keskeinen data-avaruuden onnistumisessa. Orkestraattori vie toimintaa eteenpäin ja edistää luottamusta ja yhteistyötä osallistujien kesken. Orkestraattorin tehtävä on kaksiosainen. Käynnistysvaiheessa se fasilitoi osallistujien yhteistyötä, hankkii rahoitusta ja kumppaneita sekä toimii datan hallintaan keskittyvän ratkaisun rakentajana. Operatiivisessa vaiheessa se valvoo data-avaruuden sääntökirjan noudattamista.

6.3 Suositukset data-avaruuksien kehitystä ja käyttöä tukeville organisaatioille

Suositus 7. Kansallinen pelikirja data-avaruuksien käyttöönottoon. Suomessa tulisi olla julkishallinnon ja yksityisten toimijoiden yhdessä muodostama kansallinen suunnitelma data-avaruuksien kehittämiseksi ja hyödyntämiseksi. Suunnitelman tulisi pohjautua ajantasaiseen tilannekuvaan data-avaruuksien eurooppalaisesta ja suomalaisesta kehityksestä. Pelikirjassa tulisi myös suunnitella, miten EU:n rahoitusinstrumenttien rahoitushaut hyödynnetään mahdollisimman tehokkaasti.

Suositus 8. Tulospohjainen investointirahoitus. Data-avaruuden varhaisessa kehitysvaiheessa yksi keskeinen haaste on luoda oikeudenmukaisia ja läpinäkyviä kannustimia ensimmäisille toimijoille, jotka ottavat riskin ja tekevät työn data-avaruuden perustamiseksi. Kannustimien puuttuessa syntyy vapaamatkustajaongelma, jossa kaikki toimijat jäävät odottamaan, että joku muu tekisi data-avaruuden käyttövalmiiksi. Data-avaruuden rakentamiseen kohdennettu julkinen rahoitus pienentää ensimmäisten toimijoiden riskiä, mutta ei välttämättä yksistään luo pitkän aikavälin kestävyyttä ja toimijoiden sitoutumista. Osa investointirahoituksesta voisi olla tulospohjaista, joka riippuisi data-avaruuden todellisesta käytöstä. Näin ensimmäiset toimijat hyötyisivät data-avaruuden kasvusta.

Suositus 9. Valtiotason kansainvälinen yhteistyö. EU:n jäsenvaltiot ovat kyvykkyyksiltään eri lähtötilanteissa luomaan data-avaruuksia. Suomen kannattaisi muodostaa datan käytössä ja digitalisaatiossa kehittyneimpien maiden kanssa yhteisö, joka kiihdyttäisi data-avaruuskehitystä ja siihen liittyvää EU-politiikkaa. Yhteisöön voisivat kuulua esimerkiksi pohjoismaat sekä Benelux-maat, joissa on samankaltaisia haasteita ratkaistavana, saman mittaluokan resurssit käytössä sekä osassa maista jo olemassa olevia data-avaruuksia, joihin kytkeytyä.

Lähteet

Otto, B. et al. 2016. Industrial Data Space – Digital Sovereignty Over Data. Fraunhofer. (haettu 22.3.2024).

DSSC. 2024. Glossary 3.0. Data Spaces Support Centre. (haettu 19.3.2024).

DSSC. 2023. Starter Kit for Data Space Designers. Data Spaces Support Centre. (haettu 19.3.2024).

EC. 2024. Second staff working document on data spaces. European Commission. (haettu 19.3.2024).

Pitkänen O, Luoma-Kyyny J. 2022. Rulebook for a fair data economy. Sitra. (haettu 25.3.2024).

Haastatellut

Mikael af Hällström, kehittämisen asiantuntija, Verohallinto

Esko Kaarlonen, pääarkkitehti, Valtiokonttori

Harri Ketamo, perustaja ja puheenjohtaja, Headai

Jukka Kyhäräinen, hankejohtaja, ulkoministeriö

Ilkka Lakaniemi, johtaja, Tiedon ja innovaatioiden tutkimuskeskus, Aalto-yliopisto

Janne Lautanala, ekosysteemi- ja teknologiajohtaja, Fintraffic

Krister Lindén, tutkimusjohtaja, Helsingin yliopisto

Harri Nieminen, yhteiskehittämisen päällikkö, VTT

Anu Passi-Rauste, markkinointijohtaja, Headai

Juha Salmelin, ekosysteemijohtaja, Nokia

Jaana Sinipuro, toimitusjohtaja, DataSpace Europe

Fredrik Södö, teknologia- ja kehitysjohtaja, Fingrid Datahub

Anna Vuopala, hallitusneuvos, opetus- ja kulttuuriministeriö

Liite 1: Data Spaces Alliance Finland

Tämän selvityksen julkaisuajankohtana 10.4.2024 käynnistettiin kansallinen yhteistyöverkosto Data Spaces Alliance Finland tuomaan yhteen suomalaisten data-avaruushankkeiden käynnistäjiä ja kehittäjiä sekä niitä tukevia toimijoita. Allianssi toteuttaa muun muassa Belgiassa, Hollannissa ja Itävallassa toimivaksi todettua yhteistyömallia, jossa paikalliset data-avaruushankkeiden tekijät ja tukijat on tuotu yhteen niin, että eri hankkeet oppivat nopeammin toisiltaan ja hankkeista pystytään viestimään selkeästi laajemmalle yleisölle. 

Allianssi tarjoaa yhtenäisen näkymän työkaluihin ja palveluihin yrityksille, jotka haluavat investoida ja kehittää dataan liittyvää liiketoimintaansa liittymällä olemassa oleviin tai käynnistämällä uusia data-avaruuksia. Data-avaruushankkeille allianssi tarjoaa tukea kasvuun, verkostoitumiseen ja yhdessä oppimiseen, sekä tehokkaan tavan seurata ja kytkeytyä eurooppalaisiin data-avaruuksiin. Kokoamalla keskeiset toimijat ja aktiiviset data-avaruushankkeet yhteen allianssi parantaa suomalaisen data-avaruustekemisen näkyvyyttä ja uskottavuutta sekä kotimaassa että kansainvälisesti.

Oheinen kuva tiivistää allianssin toimintamallin ja tavoitteet. Allianssin jäseniä voivat olla organisaatiot, jotka toimivat avainkumppanina jossain suomalaisessa data-avaruushankkeessa (tekijät) sekä organisaatiot, jotka rahoituksen ja resurssien kautta mahdollistavat suomalasia data-avaruushankkeita (tukijat). Allianssin kohderyhmää ovat yritykset ja organisaatiot, jotka hyödyntävät tai voisivat hyödyntää data-avaruuksia liiketoiminnassaan (käyttäjät).

Kuva 6. Data Spaces Alliance Finland -yhteistyöverkoston toimintamalli ja tavoitteet.

Data Spaces Alliance Finland on yhteistyöverkosto, joka tuo suomalaisten data-avaruushankkeiden käynnistäjät, kehittäjät ja hankkeita tukevat toimijat yhteen.

Tekijät ovat data-avaruushankkeiden käynnistäjiä ja kehittäjiä. He ovat allianssin jäseniä.

Tukijat ovat toimijoita, jotka rahoituksen ja resurssien kautta mahdollistavat data-avaruushankkeita. He ovat myös allianssin jäseniä.

Käyttäjät ovat yrityksiä ja organisaatioita, jotka hyödyntävät tai voisivat hyödyntää data-avaruuksia liiketoiminnassaan. He ovat allianssin toiminnan kohderyhmä.

Allianssilla on kolme tavoitetta.

1. Kasvu: enemmän suomalaisia organisaatioita liittyy mukaan data-avaruuksiin.

2. Kypsyminen: data-avaruushankkeet kehittyvät nopeammin.

3. Arvonluonti: data-avaruudet luovat enemmän arvoa käyttäjilleen ja yhteiskunnalle.

Allianssin 22 perustajajäsentä allekirjoittivat aiesopimuksen, joka luo kevyen hallintomallin toimijoiden tavoitteelliselle yhteistyölle. Data Spaces Alliance Finland -yhteistyöverkoston perustajajäsenet ovat: 1001 Lakes, Business Finland, CSC, DataSpace Europe, Fintraffic, Headai, Kela, Liikenne- ja viestintäministeriö, Loihde, Maanmittauslaitos, MyData Global, Nokia, Nordic Institute for Interoperability Solutions (NIIS), Platform of Trust, Siili Solutions, Sitra, SIX Mobile Work Machines, Smart City Innovation Cluster (SCIC), Struggle Creative, Teknologiateollisuus, TIEKE ja VTT. 

Liite 2: Lisätietoa suomalaisista data-avaruushankkeista

Liikenteen dataekosysteemi01 Liikenne ja logistiikka
Meriliikenteen data-avaruus01 Liikenne ja logistiikka
NEMO Merenkulun ilmoituspalvelu01 Liikenne ja logistiikka
Helsinki-Vantaan lentoaseman datahubi01 Liikenne ja logistiikka
DSpace 4Mobility01 Liikenne ja logistiikka
Mobility EDIC01 Liikenne ja logistiikka
Digivisio 203002 Osaaminen
Trusted Ecosystem for Skills Foresight02 Osaaminen
Jatkuvan oppimisen digitaalinen palvelukokonaisuus (JOD)02 Osaaminen
Jatkuvan oppimisen ja työllisyyden palvelukeskus (Jotpa)02 Osaaminen
DS4SKILLS02 Osaaminen
Prometheus-X and the EDGE SKILLS project02 Osaaminen
Potato-X maatalouden data-avaruus pilotti03 Maatalous ja ruokatuotanto
Agrifood Data Space Finland03 Maatalous ja ruokatuotanto
AgriDataSpace03 Maatalous ja ruokatuotanto
Fingrid Datahub04 Energia
Synergies04 Energia
CO2 DataHub -ekosysteemi05 Älykaupungit ja rakennettu ympäristö
Datamust05 Älykaupungit ja rakennettu ympäristö
Julkisen hallinnon data-avaruus työryhmä06 Julkinen sektori
Virtual Finlandin DataFinland -palvelu06 Julkinen sektori
Sustainable Industry X (SIX)07 Kiertotalous ja digitaalinen tuotepassi
CIRPASS-207 Kiertotalous ja digitaalinen tuotepassi
Fin-CLARIN-konsortio08 Kielimallit ja tekoäly
Alliance for Language Technologies (ALT EDIC) 08 Kielimallit ja tekoäly
Trusted European Media Data Space (TEMS)09 Media ja tekijänoikeudet
Towards European Health Data Space (TEHDAS 2)10 Terveys ja hyvinvointi
The European Open Science Cloud (EOSC)11 Tutkimus
Destination Earth12 Luonto ja ympäristö
Yrityksen digitalous13 Reaaliaikatalous
Finnish Advanced Manufacturing Network (FAMN) 14 Valmistava teollisuus
Location Innovation Hub15 Paikkatieto
Data Spaces Support Centre (DSSC)Data-avaruuksia tukeva hanke
Business Finlandin Data Economy -ohjelmaData-avaruuksia tukeva hanke

Julkaisun perustiedot

Otsikko

Suomalaisten data-avaruuksien tilannekuva

Alaotsikko

Edelläkävijöiden opit datatalouden infrastruktuurin kehittämiseen

Tekijät

Antti Poikola, Denny Wong, Viivi Lähteenoja, Marko Turpeinen

Julkaisupaikka

Helsinki

Julkaisuvuosi

2024

Julkaisija

Sitra

ISBN (PDF)

978-952-347-369-0

ISSN (PDF)

1796-7112

Sarja

Sitran selvityksiä

Julkaisun numero

240

Mistä on kyse?