Mitä on avoin data?

Avoin data yhteiskunnassa

Tiedätkö tarkkaan, kuinka paljon verorahoja on käytetty katulamppuun tai syöpätutkimukseen? Mikä on lyhyin, turvallisin ja luonnonkaunein pyöräilyreitti kodistasi töihin? Mitä hengittämäsi ulkoilma sisältää? Millä alueella on parhaat työmahdollisuudet tai missä on eniten puistoja pinta-alaan nähden?

Suurin osa tiedosta, jota tarvitaan näihin kysymyksiin vastaamiseen kerätään ja luodaan osana julkisen hallinnon toimintaa. Hallinnossa on paljon dataa, joka on arvokasta. Jotta sen sen arvo voidaan moninkertaistaa, tulee se avata koko yhteiskunnan käytettäväksi.

Avoin data on digitaalisessa muodossa olevaa informaatiota, joka on kaikkien vapaasti käytettävissä mihin tahansa käyttöön, kunhan sen alkuperäinen lähde mainitaan. Se voi olla esimerkiksi reaaliaikaista tietoa bussien sijainnista tai tilastotietoa suosituimmista nimistä. 

Julkinen hallinto hallinnoi laajoja, rahallisesti ja yhteiskunnallisesti arvokkaita tietovarantoja. Viranomaiset keräävät tietoa ensisijaisesti omaa käyttöään varten. Arvokkaat uudelleenkäytettävät tietovarannot syntyvät muun toiminnan sivutuotteena.

Julkisen hallinnon tietovarantojen avaaminen edistää ainakin kolmea eri tavoitetta:

  1. Demokratian ja hallinnon läpinäkyvyyden lisääntyminen
  2. Uusien markkinoiden ja innovaatioiden syntyminen
  3. Hallinnon sisäisen tehokkuuden lisääntyminen (sisäisten prosessien virtaviivaistaminen)

Tutustu Euroopan dataportaalin koulutukseen avoimesta datasta (englanniksi).

Mitä datalla tarkoitetaan?

Datalla tarkoitetaan digitaalisesti tallennettua, merkeistä ja symboleista koostuvaa koneellisesti luettavissa olevaa informaatiota, joka voi muodostaa esimerkiksi dokumentteja, tietokantoja, kuulemisten transkripteja ja audiotallenteita. Se voidaan ymmärtää raaka-aineena, jota jalostamalla syntyy merkityksellistä informaatiota.

Avoimen datan määritelmä

Avoin = Datalla on avoimen hyödyntämisen mahdollistava käyttölupa eli lisenssi. Käytännössä Creative Commons BY 4 tai CC0 1.0. Lisätietoa lisensseistä

Data = Koneluettavaa tietoa. Esimerkiksi taulukkoja, tekstiä, kuvia, karttoja, videoita, äänitiedostoja yms.

Dataa saa julkaista, mikäli se ei sisällä yksityisyydensuojan piiriin kuuluvaa henkilötietoa tai muusta syystä arkaluonteista tai salassa pidettävää aineistoa kuten liikesalaisuuksia tai kansalliseen turvallisuuteen liittyviä aineistoja.

Kun data julkaistaan uudelleenkäytön sallivalla lisenssillä maksutta ja koneluettavassa muodossa, voidaan puhua avoimesta datasta. Kaikki julkaistavissa oleva data voidaan avata, mutta kaikki verkon kautta julkaistu aineisto ei välttämättä täytä avoimen datan kriteerejä.

Avoin data voidaan määritellä Open Knowledgen ylläpitämän avoimen tiedon määritelmää (englanniksi) mukaillen seuraavasti:

  1. Avoin data on löydettävissä ja saatavilla Internetistä kokonaisena ja maksutta käyttökelpoisessa ja muokattavassa (siis koneluettavassa) muodossa.

  2. Avoin data on kaikkien vapaasti katseltavissa, ladattavissa, kopioitavissa, muokattavissa, jaettavissa ja käytettävissä missä tahansa lainmukaisessa toiminnassa ilman taloudellisia, juridisia, teknisiä, sosiaalisia tai käytännöllisiä rajoitteita.

  3. Avoimen datan käyttöehdot ja lisenssit takaavat datan tuottajalle tämän halutessa oikeuden tulla asianmukaisesti nimetyksi ja käyttäjälle varmuuden datan alkuperästä. Muunlaisia käyttöä rajoittavia ehtoja ei ole.

Mitä hyötyä on avoimesta datasta?

Kuka tahansa voi hyötyä avoimesta datasta. Voit esimerkiksi tutustua itseäsi kiinnostaviin aiheisiin avoimen datan avulla, käyttää avointa dataa materiaalina tutkimuksissa tai ladata tietoaineistoja omaan käyttöösi ja hyödyntää niitä esimerkiksi sovelluskehityksessä.

Datan avaaminen, eli sen tarjoaminen kaikkien käyttöön, edistää esimerkiksi hallinnon avoimuutta ja läpinäkyvyyttä, ja siten hyödyttää kaikkia kansalaisia. Avattu data edesauttaa myös demokratian toteutumista, kun kuka tahansa voi tarkastella esimerkiksi valtion hankintoja. Julkinen hallinto avaa suuria määriä dataa kaikkien saataville osittain jo lainsäädännön ohjaamana. 

Avointa dataa käyttämällä säästetään kustannuksissa ja luodaan tehokkaampia ja laadukkaampia palveluita kaikille kansalaisille. Avoimen datan avulla voidaan luoda uusia palveluita, jotka eivät muuten olisi mahdollisia ainakaan ilmaiseksi. Esimerkiksi erilaiset liikkumiseen liittyvät palvelut, kuten VR:n asema-aikataulut näyttävä junat.net tai reaaliaikaisen sadetilanteen kartalla näyttävä sataako.fi, hyödyntävät avointa dataa. Sen lisäksi avoin data luo uusia mahdollisuuksia innovaatiolle ja siten uusia yrityksiä ja työpaikkoja.

Lisää esimerkkejä avoimen datan hyödyntämisestä löydät sovellusgalleriastamme

Avoimen datan taustaa

Avoimen datan juuret ovat 1980- ja 1990-luvulla syntyneissä vapaita ohjelmistoja ja avointa lähdekoodia edistävissä liikkeissä. Tänä päivänä avoimuus on eräänlainen yhteiskuntaa läpileikkaava megatrendi, joka näyttää vahvistuvan monilla aloilla. 

Suomessa datan avaaminen alkoi kiihtyä vuonna 2009 Euroopan Unionin PSI-direktiivin (Julkisen sektorin tiedon uudelleenkäytön helpottaminen 2003 ja uudistus 2013) ja etenkin Britannian ja Yhdysvaltojen esimerkkien vauhdittamana. Vuonna 2009 ajatus alkoi arkipäiväistymään, kun useat maat (esimerkiksi Yhdysvallat, Englanti, Kanada ja Uusi-Seelanti) julkaisivat aloitteitaan avata hallinnon tietoja. Kansallisen avoimen tiedon politiikan kehittäminen alkoi vuonna 2011, kun Suomen hallitus julkisti periaatepäätöksen julkishallinnon digitaalisten tietoaineistojen saatavuudesta. Sen mukaan:

"tietoaineistojen tulee olla avoimesti saatavilla ja uudelleenkäytettävissä yhtenäisin, selkein ja kaikille tasapuolisin ehdoin, pääsääntöisesti maksutta."

Tämän jälkeen Kataisen hallitusohjelmaan kirjattiin julkisten tietovarantojen määrätietoinen avaaminen, joka edistää avointa tiedettä ja luo mahdollisuuksia uudenlaiselle yrittäjyydelle ja palveluinnovaatioille.

Ensimmäiset merkittävät kansalliset tietoaineistot avattiin toukokuussa 2012, kun Maanmittauslaitos avasi maastotietojaan. Tätä ennen oli jo avattu lukuisia paikallistason aineistoja muun muassa pääkaupunkiseudulla vuonna 2010 käynnistyneen Helsinki Region Infosharen toimesta.