Mitä on avoin data?

Avoimen datan mahdollisuuksien visualisointi

Tiedätkö tarkkaa, miten paljon verorahoja on käytetty katulamppuun tai syöpätutkimukseen? Mikä on lyhyin, turvallisin ja luonnonkaunein pyöräilyreitti kodistasi töihin? Mitä hengittämäsi ulkoilma sisältää? Missä alueella on parhaat työmahdollisuudet tai missä on eniten puistoja pinta-alaan nähden?

Suurin osa tiedosta, jota tarvitaan näihin kysymyksiin vastaamiseen kerätään ja luodaan osana julkisen hallinnon toimintaa. Hallinnossa on paljon dataa, joka on arvokasta. Jotta sen sen arvo voidaan moninkertaistaa, tulee se avata koko yhteiskunnan käytettäväksi.

Avoin data on digitaalisessa muodossa olevaa informaatiota, joka on kaikkien vapaasti käytettävissä mihin tahansa käyttöön, kunhan sen alkuperäinen lähde mainitaan.

Julkinen hallinto hallinoi laajoja, rahallisesti ja yhteiskunnallisesti arvokkaita tietovarantoja. Viranomaiset keräävät tietoa ensisijaisesti omaa käyttöään varten. Arvokkaat uudelleenkäytettävät tietovarannot muun toiminnan sivutuotteena. Julkisen hallinnon tietovarantojen avaaminen edistää ainakin kolmea eri tavoitetta:

  1. Demokratian ja hallinnon läpinäkyvyyden lisääntyminen
  2. Uusien markkinoiden ja innovaatioiden syntyminen
  3. Hallinnon sisäisen tehokkuuden lisääntyminen (sisäisten prosessien virtaviivaistaminen)

Avoimen datan taustaa

Avoimen datan juuret ovat 1980- ja 1990-luvulla syntyneissä vapaita ohjelmistoja ja avointa lähdekoodia edistävissä liikkeissä. Tänä päivänä avoimuus on eräänlainen yhteiskuntaa läpileikkaava megatrendi, joka näyttää vahvistuvan monilla aloilla. 

Suomessa datan avaaminen alkoi kiihtyä vuonna 2009 Euroopan Unionin PSI-direktiivin (Julkisen sektorin tiedon uudelleenkäytön helpottaminen 2003 ja uudistus 2013) ja etenkin Britannian ja Yhdysvaltojen esimerkkien vauhdittamana. Vuonna 2009 siitä alkoi arkipäiväistymään, kun useat maat (esimerkiksi Yhdysvallat, Englanti, Kanada ja Uusi-Seelanti) julkaisuvat niiden aloitteita avata hallinnon tietoja. Kansallisen avoimen tiedon politiikan kehittäminen alkoi vuonna 2011, kun Suomen hallitus julkisti periaatepäätöksen julkishallinnon digitaalisten tietoaineistojen saatavuudesta. Sen mukaan:

"tietoaineistojen tulee olla avoimesti saatavilla ja uudelleenkäytettävissä yhtenäisin, selkein ja kaikille tasapuolisin ehdoin, pääsääntöisesti maksutta.”

Tämän jälkeen Kataisen hallitusohjelmaan kirjattiin julkisten tietovarantojen määrätietoinen avaaminen, joka edistää avointa tiedettä ja luo mahdollisuuksia uudenlaiselle yrittäjyydelle ja palveluinnovaatioille.

Ensimmäiset merkittävät kansalliset tietoaineistot avattiin toukokuussa 2012, kun Maanmittauslaitos avasi maastotietojaan. Tätä ennen oli jo avattu lukuisia paikallistason aineistoja muun muassa pääkaupunkiseudulla vuonna 2010 käynnistyneen Helsinki Region Infosharen toimesta.

Mitä data on?

Datalla tarkoitetaan digitaalisesti tallennettua, merkeistä ja symboleista koostuvaa koneellisesti luettavissa olevaa informaatiota, joka voi muodostaa esimerkiksi dokumentteja, tietokantoja, kuulemisten transkripteja ja audiotallenteita. Se voidaan ymmärtää raaka-aineena, jota jalostamalla syntyy merkityksellistä informaatiota.

 

 

Avoimen datan määritelmä

"Avoin" = Tiedossa on avoimen hyödyntämisen mahdollistava käyttölupa eli lisenssi. Käytännössä Creative Commons BY 4 tai CC0 1.0.

"Data" = Koneluettavaa tietoa. Esimerkiksi taulukkoja, tekstiä, kuvia, karttoja, videoita, äänitiedostoja yms.

Dataa voidaan julkaista, mikäli se ei sisällä yksityisyydensuojan piiriin kuuluvaa henkilötietoa tai muusta syystä arkaluonteista tai salassapidettävää aineistoa kuten liikesalaisuuksia tai kansalliseen turvallisuuteen liittyviä aineistoja.

Kun data julkaistaan uudelleenkäytön sallivalla lisenssillä maksutta ja koneluettavassa muodossa, voidaan puhua avoimesta datasta. Kaikki julkaistavissa oleva data voidaan avata, mutta kaikki verkon kautta julkaistu aineisto ei välttämättä täytä avoimen datan kriteerejä.

Avoin data voidaan määritellä Open Knowledgen ylläpitämän avoimen tiedon määritelmää mukaillen seuraavasti:

  1. Avoin data on löydettävissä ja saatavilla Internetistä kokonaisena ja maksutta käyttökelpoisessa ja muokattavassa (siis koneluettavassa) muodossa.

  2. Avoin data on kaikkien vapaasti katseltavissa, ladattavissa, kopioitavissa, muokattavissa, jaettavissa ja käytettävissä missä tahansa lainmukaisessa toiminnassa ilman taloudellisia, juridisia, teknisiä, sosiaalisia tai käytännöllisiä rajoitteita.

  3. Avoimen datan käyttöehdot ja lisenssit takaavat datan tuottajalle tämän halutessa oikeuden tulla asianmukaisesti nimetyksi ja käyttäjälle varmuuden datan alkuperästä. Muunlaisia käyttöä rajoittavia ehtoja ei ole.