SORVI – SUOMALAINEN AVOIMEN DATAN TYÖKALUPAKKI

Yhteiskunnan julkisten tietoaineistojen määrä on voimakkaassa kasvussa. Talouteen, päätöksentekoon, koulutukseen, terveydenhuoltoon, liikenteeseen ja paikkatietoon liittyvien aineistojen avoimuus ja yhdistely mahdollistaa havainnot, joihin yksittäisillä aineistoilla ei päästä käsiksi. Laaja saatavuus ja käyttö on omiaan nostamaan yhteisten tietovarantojemme arvoa. Laskennallisten työkalujen puute on osoittautunut pullonkaulaksi julkisten tietovarantojen laajemmalle hyödyntämiselle, joka edellyttää tavanomaisesti ainakin seuraavia toimenpiteitä: (1) haku; (2) esikäsittely; (3) analysointi ja (4) visualisointi. Nämä vaativat usein teknistä perehtymistä aineistojen esitysmuotoihin ja eri lähteistä saatavien ohjelmistojen käyttöön, mikä nostaa merkittävästi aineistojen käyttökynnystä ja heikentää avoimuutta.
 
Hankkeessa kehitettävä soRvi-paketti vastaa näihin haasteisiin tarjoamalla keskitetyn, kattavan ja avoimen kokoelman laskennallisia välineitä suomalaisten julkisten tietoaineistojen seulontaan ja yhdistelyyn. Hanke on toteutettu suomenkielisenä avoimen lähdekoodin projektina, jotta se palvelisi mahdollisimman laajasti suomalaista yleisöä. Vapaaehtoisvoimin kehitetty hanke tarjoaa välineitä jo esimerkiksi Maanmittauslaitoksen, Tilastokeskuksen, Suomen ympäristökeskuksen ja Helsingin seudun ympäristöpalveluiden aineistojen käsittelyyn. Hanke pohjautuu avoimen lähdekoodin R-laskentaympäristöön, jota käytetään laajalti tutkimus- ja yritysmaailmassa. Tämä sallii avointen aineistojen ja avointen analyysimenetelmien saumattoman yhdistämisen. Saatavilla on tuhansia data-analyysimenetelmiä, joita täydennetään nyt suomalaisen käyttäjäkunnan tarpeisiin vastaavalla avoimen datan työkalupakilla. Hankkeella on resurssien salliessa mahdollisuudet laajentua nopeasti kattamaan talouteen ja päätöksentekoon kytkeytyviä aineistoja mukaan lukien eduskunnan äänestyspäätökset, arvopaperiomistukset, kuntatason budjettiraportit, tilastolliset vuosikirjat, ääniaktiivisuus jne. Tämä tuottaisi uusia ja kaikkien saatavilla olevia välineitä päätöksentekoon kytkeytyvien tietovarantojen hyödyntämiseen kansalaishankkeissa, journalistisessa työssä ja eri tutkimusaloilla edistäen päätöksenteon läpinäkyvyyttä ja suomalaista demokratiaa.
 
Lisää tietoja löytyy hankkeen kotisivulta: http://sorvi.r-forge.r-project.org
 
Leo Lahti