I. Kartoita ja selvitä

Kartoita ja selvitä

1.1. Tavoitteet

Kartoita ja selvitä -vaiheen jälkeen tiedät, mitkä organisaatiosi tietovarannot voit avata. Lisäksi vaiheen jälkeen tiedetään mitä tietovarantoja on olemassa ja miten ne on teknisesti toteutettu. Tätä tietoa tarvitaan, kun rakennetaan kokonaiskuvaa data infrstruktuurista tai esimerkiksi tietoarkkiarkkituurista.

1.2 Vastuut, rajoitteet ja velvoitteet

Aloita prosessi selvittämällä tiedon avaamiseen liittyvät reunaehdot ja määrittele vastuut, jotka tiedon avaamisesta mahdollisesti aiheutuvat organisaatiollesi. Kartoita myös tiedon avaamiseen liittyvät rajoitteet (lain asettamat rajoitteet, tekijänoikeudet ja käyttöoikeusrajoitukset)

Lainsäädäntö rajoittaa tiedon avaamista eniten. Eniten avaamista tyypillisesti ohjaa henkilötietoihin liittyvä lainsäädäntö, joka ohjaa, miten henkilötietoja sisältävää tietoa on käsiteltävä (mm. EU:n tietosuoja-asetus).

a) Vastuut

Selvitä, ketkä osallistuvat tiedon avaamisprosessiin ja mitkä ovat heidän vastuunsa. Tässä oppaassa on kaikkien päävaiheiden osalta erillinen lopputulos ja vastuuhenkilöt -kohta, jossa on esitelty alustava näkemys siitä, millaisia rooleja tiedon avaamisen eri vaiheisiin tarvitaan. Käy nämä läpi ja arvioi kunkin roolin tarpeellisuutta omassa tiedon avaamisessa. Huomaa, että yksittäisellä henkilöllä voi olla useita rooleja.

b) Lainsäädännölliset rajoitteet

Lainsäädännölliset velvoitteet rajoittavat tiedon avaamista eniten. Esimerkiksi henkilötietolaki määrää, miten henkilötietoja sisältävää tietoa on käsiteltävä.

Jotkut tiedot ovat salassa pidettäviä. Mieti kuitenkin, saatko muokattua näitä tietoja siten, että niiden salassapidon edellytykset poistuvat tiedon laadun kuitenkaan kärsimättä. Esimerkiksi merenmittauksen tuloksena saatavat tarkat syvyyyspistetiedot voivat olla maan turvallisuuden kannalta arkaluontoista materiaalia ja sellaisenaan salassa pidettäviä. Kun aineistoa harvennetaan riittävästi, saadaan tuloksena syvyyyspistejoukko, joka ei ole enää puolustuspoliittisesti arkaluontoista materiaalia, ja tietoa voidaan hyödyntää siviilikäytössä vesillä liikuttaessa.

c) Tekijänoikeusrajoitteet ja käyttöoikeusrajoitteet

Varmistu, että organisaatiollasi on kaikki tiedon julkaisemiseen tarvittavat oikeudet. Jos näin ei ole, selvitä, voitko saada tarvittavat oikeudet.

Selvitä tekijänoikeudet, jos organisaatiosi käyttää oman tietonsa pohjana muista lähteistä saamaansa tietoa. Varmistu tällöin, että hankitut tiedon käyttöoikeudet kattavat organisaatiosi oman käytön lisäksi myös tiedon käytön julkaisuissa.

Myös organisaatiosi käyttämät järjestelmät saattavat rajoittaa tiedon julkaisemista. Esimerkkitilanteessa organisaatiosi tuottaa sisäiseen käyttöönsä raportteja, joissa näytetään karttapohjalla erilaisia tietoja. Organisaatiosi käytössä olevan karttamoottorin lisenssiehdoissa sallitaan vapaa sisäinen käyttö, mutta lisenssiehdot eivät suorasanaisesti anna lupaa ulkoisten julkaisujen tekemiseen. Tällöin on mahdollista, että organisaatiosi ei saa jakaa tuottamiaan karttamuotoisia jalosteita vapaasti avoimena tietona, vaikka kaikki kartan päälle piirretty tieto olisikin organisaatiosi itse tuottamaa.

Asiaan liittyvää tärkeää lainsäädäntöä ja ohjeistusta:

Tietoturva- ja tietosuojaohjeistus:

1.3 Tietovarantojen ja -järjestelmien kartoitus

Jaa tietovarantojen ja järjestelmien kartoitus kahteen vaiheeseen. Selvitä ensimmäisessä vaiheessa, mitä aiemmissa hankkeissa on kartoitettu. Toisessa vaiheessa kartoita tietovarannot ja -järjestelmät kenttätasolta niiltä osin, mitä et ensimmäisen vaiheen aikana saanut selville.

Etsi vastaukset ainakin seuraaviin kysymyksiin:

  1. Mitä koneluettavia tietoja on olemassa?
  2. Kuka niistä vastaa tai keneltä saat lisätietoja?
  3. Mikä on tiedon kattavuus ja keskimääräinen laatutaso?

Olemassa oleva tieto tietovarannoista ja tietojärjestelmistä

Kattavimman tiedon tietovarannoista saat organisaation kokonaisarkkitehtuurikuvauksista (tietoarkkitehtuuri). Ota ne kartoituksen pohjaksi.

Vaikka kokonaisarkkitehtuurikuvausta ei olisi tehty, on organisaatioilla yleensä tietojärjestelmistään olemassa ainakin lista tai kartta, jota tarvitaan operatiivisen toiminnan pohjaksi. Käytä tätä listaa kartoituksen pohjana, vaikka järjestelmien sisältämä tieto ei siitä välttämättä selviäkään tarkasti.

Huomioi, että koneluettava tieto on todennäköisesti tietotyötä tekevän organisaation arvokkaimpia resursseja. Siksi sen hallinnan tehostaminen luo useita erilaisia tapoja tehostaa toimintaa. Usein tietojen avaamisesta suurimmat hyödyt ovat syntyneet datan avaajan omien prosessien tehostumisena, kun organisaation tiedonhallinta ja sen avulla koko toiminta on tehostunut.

Käytännön esimerkki: Helsingin kaupunki

Helsingin kaupunki on selvittänyt omien tietojärjestelmien kokonaistilannetta. Kaupungilla on 700-900 erilaista (laskentatavasta riippuen) tietojärjestelmää toiminnan tukena ja toimintaa mahdollistamassa. Avoimen listan näistä löydät täältä: https://www.avoindata.fi/data/fi/dataset/helsingin-kaupungin-tietojarjestelmaluettelo 

Kaupungissa yli 40 000 työntekijää tekee joka päivä näiden tietojärjestelmien avulla töitä. On helppo ymmärtää, että tehostamalla tiedonhallintaa vaikutetaan merkittävästi siihen, miten organisaatio toimii ja millaisia mahdollisuuksia se luo laajemmin kaupunkilaisille ja yrityksille mm. älykäs-kaupunki -teeman alla.

Tietojärjestelmien ja tietovarantojen kartoitus

Kartoituksen ensimmäinen haaste on ymmärtää, millaisia tietoja on ylipäätään olemassa. Et välttämättä muista tai näe tiedon olemassaoloa, kun teet kartoitusta.

Käytä tässä apuna esimerkiksi alla olevaa kuvaa (klikkaamalla se suurenee koko näyttöön), jossa on esitetty yksi jäsennys julkishallinnon tietovarannoista. Hyödynnä jäsennystä tutkimalla, onko organisaatiollasi vastaavia tietoja hallussaan.

julkishallinnon tietovarannot

Kuvassa keskellä on henkilöitä, rakennuksia, yrityksiä, paikkoja ym. koskevat perustiedot (perustietovarannot).

Toisella kehällä on hallinnollisia tietovarantoja, joita ovat esimerkiksi lainsäädäntöä, palveluja, organisaatoita ja julkista taloutta koskevat tiedot.

Kolmannella kehällä on syvälle substanssiin meneviä tietovarantoja useilta eri toimialoilta, esimerkiksi liikenteen, ympäristön, terveyden, koulutuksen ja kulttuurin aloilta.

Uloimmalla kehällä ovat strategiset tietovarannot, jotka koskevat päätöksiä, tilannekuvaa, toimintaympäristön tilaa ja toimenpiteiden vaikuttavuutta.

Käy tämän tarkastelun jälkeen järjestelmällisesti läpi organisaatiosi eri osien kanssa tiedot, joita niillä mahdollisesti on hallussaan.

 

1.4 Tiedon kuvaaminen ilmaisella työkalulla

‍Kun koneluettava tieto on usein organisaation arvokkain resurssi, niin sen kuvaaminen ja parempi hallinta vaikuttaa merkkittävästi koko organisaation toimintaan. Valtiolla on asetettu tavoitteita digitalisoinnin yhdeksän periaatetta, kuten:

  1. poistamme turhan asioinnin
  2. tuotamme asiakkaalle hyötyä nopeasti 
  3. pyydämme uutta tietoa vain kerran 
  4. hyödynnämme jo olemassa olevia julkisia ja yksityisiä sähköisiä palveluita 
  5. avaamme tiedon ja rajapinnat yrityksille ja kansalaisille.

Samaan aikaan laindännössä on usein otettu kantaa siihen, mitä tietoja julkinen hallinto kerää osana toimintaansa.

Jotta tiedon kokonaisuus voitaisiin saada haltuun, on tuotettu yhteentoimivuus-työkalut, jossa voi kuvata käsitteitä, sanastoja ja tietomalleja.

Tietovarannon voi kuvata tietomalliksi ja siitä voi luoda sovellusprofiilin, joka kuvaa avoimen datan tietotuotetta (eli julkaisua).

Lisätietoja: https://yhteentoimiva.suomi.fi/fi/

Organisaation tiedon kuvaaminen mahdollisimman tarkasti auttaa kaikenlaiseen tiedonhallinnan tehostumiseen. Sen avulla on helpompi sekä edistää avointa dataa että esimerkiksi MyDataa ja suunnitella rajapintoja.

1.5 Tietovarantojen luokittelu avattavuuden suhteen

Kun olet saanut selville, mitä tietovarantoja organisaatiollasi on, luokittele tietovarannot sen perusteella, mitkä niistä voit avata. Älä tee tässä vaiheessa vielä lopullista avauspäätöstä. Saatat huomata myöhemmissä vaiheissa, että tiedon julkaiseminen on liian kallista tai mutkikasta tai että tiedon julkaiseminen ei tuota lisäarvoa.

Tietovarannot voidaan luokitella avattavuuden suhteen kolmeen eri pääluokkaan:

a) Tietovarannot, jotka voi avata sellaisinaan

Osa tiedoista voidaan avata ilman minkäänlaisia esteitä. Tällöin organisaatiollasi on tiedon tekijänoikeus tai muutoin riittävät oikeudet tietoon, eikä tieto sisällä mitään salassapidettävää.

b) Tietovarannot, joita tarvitsee muokata ennen avaamista

Osa tiedoista ei ole kokonaisuudessaan julkaisukelpoisia. Poista tiedoista julkaisukelvottomat osat. Huolehdi, että osien poistamisen jälkeen jäljelle jää datan hyödyntäjälle arvoa luova osa-kokonaisuus, joka kannattaa julkaista.

Useissa tilanteissa esimerkiksi henkilötiedot täytyy poistaa tietovarannoista ennen tietojen avaamista. Tapauksesta riippuen voit poistaa tiedot useammalla eri tavalla. Aineistosta, jossa on sekaisin esimerkiksi elinkeinonharjoittajien ja yritysten tietoja, on suotavaa poistaa elinkeinonharjoittajien tiedot. Voit poistaa elinkeinonharjoittajaa koskevan tiedon kokonaan tai vaihtoehtoisesti jättää tiedon paikalleen, mutta poistaa tiedon, ketä elinkeinonharjoittajaa tieto koski. Voit myös poistaa kaikki elinkeinonharjoittajia koskevat tiedot, ja ilmoittaa kuitenkin niitä koskevan summatiedon, esimerkiksi näin: "Aineistosta on poistettu elinkeinonharjoittajia koskevat laskut. Näitä oli yhteensä 213 kappaletta kokonaisarvoltaan 1,7 miljoonaa euroa."

c) Tietovarannot, joita ei voi avata

Tietovarannot, joita ei voi tai kannata avata missään muodossa. Tällaista tietoa on esimerkiksi kansalliseen turvallisuuteen liittyvä tieto tai henkilötietoja sisältävä tietoaineisto, josta ei henkilötietojen poistamisen jälkeen jää jäljelle mitään julkaisemisen arvoista.

1.6 Datan jaotteluja

Suomen suurimmat kaupungit ovat tehneet suositukset avoimien ohjelmointirajapintojen käytöstä. Avointen ohjelmointirajapintojen avulla kaupungit voivat antaa tuottamiaan tietoja kenen tahansa käyttöön. Suosituksissa otetaan kantaa muun muassa rajapinnan laatuun, palvelulupaukseen, lisensseihin, yhdenmukaistamiseen ja teknisiin asioihin.

Share-PSI:n parhaissa käytännöissä on kuvailtu kriteerejä, jotka helpottavat arvokkaan tiedon tunnistamista. Kriteerit pohjautuvat kolmeen eri osa-alueeseen:

  • Tiedon uudelleenkäytettävyys
  • Tiedon arvo omistajan näkökulmasta
  • Tiedon arvo sen käyttäjälle

Tukeudu uudelleenkäytettävyyttä arvioidessasi Tim Berners-Leen 5 tähden malliin (alla oleva taulukko). Laadukkaasti avatun avoimen datan tulisi saavuttaa vähintään kolme tähteä tässä arviointimallissa (data on saatavilla avoimessa formaatissa).

Laatu Kuvaus
★★★★★ Data sisältää sisällöllisen linkityksen toisiin datoihin 
★★★★ Data sisältää yksilöllisiä tunnisteita, joihin voi viitata (URL)
★★★ Data on saatavilla avoimessa formaatissa (CSV, JSON, XML)
★★ Data on rakenteellisessa muodossa (esimerkiksi Excel-taulukko)
Data on saatavilla missä tahansa muodossa avoimella lisenssillä (esimerkiksi skannattu kuva tai PDF)

 

Arvioi tiedon omistajan näkökulmasta, täyttääkö avaaminen jonkin seuraavista ehdoista:

  1. tiedon jakaminen lisää läpinäkyvyyttä tai julkaisemiseen on laillinen velvoite
  2. tieto liittyy omistajan julkiseen tehtävään 
  3. tiedon jakaminen vähentää kuluja.

Jos ainakin yksi ehdoista täyttyy, voidaan tieto nähdä arvokkaana.

Tiedon todellinen arvo muodostuu pitkälti sen kysynnän ja uudelleenkäytettävyyden perusteella. Jos arvioit, että julkaistavalla tiedolla on suuri potentiaalinen kohdeyleisö ja tietoa voidaan hyödyntää erilaisia palveluita rakennettaessa, on tieto arvokasta.

Arvokkaita tietovarantoja ovat esimerkiksi julkisen liikenteen tiedot, julkisen sektorin menot (ostolaskut) tai paikkatieto. Esimerkiksi ostolaskuista on olemassa avoimen datan visualisointi osoitteessa http://www.tutkihankintoja.fi/.

Muut kriteerit

Avointa tietoa voidaan luokitella eri kriteereillä. Näillä kriteereillä on vaikutusta prosessin myöhempiin vaiheisiin. Perehdy seuraaviin luokitteluihin, kun kartoitat avattavia tietovarantoja:

a. Staattinen ja dynaaminen tieto

Staattinen tieto on luonteeltaan pysyvää ja se ei muutu usein tai paljon. Sen voi ladata kertaalleen, minkä jälkeen lataaja käyttää ladattua kopiota. Tietoa päivitetään tiedon lähteeltä staattisuuden asteesta riippuen. Esimerkiksi vuosittain päivitettävät tilinpäätöstiedot ovat varsin staattista tietoa. Samoin esimerkiksi Suomen postinumerot.

Dynaaminen tieto muuttuu usein. Tiedon käyttäjä haluaa tyypillisesti hakea aina tuoreimman version tiedosta. Dynaamista tietoa ovat esimerkiksi bussien ja junien reaaliaikaiset sijainnit.

Staattisen tiedon osalta järjestelmälle asetettavat tekniset laatuvaateet ovat dynaamista tietoa pienemmät. Jos tilinpäätös-tietoja jakava palvelin on toisinaan muutaman tunnin ajan pois käytöstä, aiheutuu tästä usein vain vähäinen haitta tiedon hyödyntäjälle. Jos sen sijaan bussien reaaliaikaiset sijainnit lakkaavat päivittymästä, joukko muitakin palveluita muuttuu toimintakyvyttömiksi ja pahimmillaan koko kaupunki ruuhkautuu.

Myös riskitasoissa on eroja. Arkaluontoisen staattisen tiedon, kuten esimerkiksi organisaatioiden työntekijöiden sairauspoissaolojen ja tarkkojen diagnoosien, jakamista vahingossa ei voi perua. Kerran ladattu tieto pysyy tiedon lataajilla. Sen sijaan vahingossa luovutettu epätoivottava dynaaminen tieto on usein korjattavissa tietoa luovuttavan rajapinnan sulkemisella.

b. Julkaisuvalmis tieto vs. raakatieto

Organisaatiosi julkaisuvalmis tieto on loogisiksi kokonaisuuksiksi koostettua tietoa yhdessä tai useammassa rekisterissä. Organisaatiosi käyttää tätä tietoa jo johonkin tarkoitukseen. Käy myös julkaisuvalmiin tiedon prosessi läpi: varmista tiedon laatu ja suodata pois arkaluontoinen materiaali.

Raakatieto on tietoa, jota organisaatiollasi on, mutta jota ei ole vielä koottu yhteen paikkaan. Raakatiedon osalta joudut tekemään määrittelytyötä julkaisuvalmista tietoa enemmän. Jätä raakatieto avausjärjestyksessä julkaisuvalmista tietoa myöhäisempään ajankohtaan, jos huomaat, että raakatieto ei erityisesti näytä kiinnostavan käyttäjäkuntaa.

c. Itse tuotettu tieto ja koostettu tieto

Osa organisaatiosi käsittelemistä tiedoista on syntynyt sen sisällä, osa taas koostuu erilaisista ulkoisista lähteistä saaduista tiedoista, joita koostetaan, yhdistellään ja jatkojalostetaan. On tärkeää, että tunnistat jälkimmäisen kategorian, sillä sinun on varmistettava, että saat jakaa muualta saatua tietoa osana organisaatiosi tiedon avaamista. Myös resurssien käytön kannalta on järkevää, että organisaatiosi ei julkaise samaa tai lähes samaa tietoa kuin jokin toinen organisaatio.

Esimerkkinä toisiinsa kytkeytyneistä tiedoista voidaan mainita Liikenneviraston onnettomuustilastot (liikennevirasto.fi):

"Liikenneviraston onnettomuustilastot perustuvat poliisin kirjaamiin onnettomuustietoihin, joita täydennetään Liikenteen turvallisuusviraston sekä Tilastokeskuksen tiedoilla. Tietojen sisällöstä ja laadusta vastaa Tilastokeskus, josta onnettomuustiedot saadaan kerran kuukaudessa.

Aineisto sisältää yksityiskohtaista tietoa onnettomuudesta, onnettomuuden osapuolista ja henkilöistä. Liikennevirastossa onnettomuustietoihin liitetään tierekisteristä tapahtumapaikan tie- ja liikenneoloja kuvaavat tiedot."

Käytä apunasi oheista kuvaa, kun mietit, miten tietoaineiston koko ja päivitystiheys vaikuttavat avaamisen teknisiin valintoihin. Pienelle, harvoin päivitettävälle tietoaineistolle riittävät eräajot, kun taas suuret ja usein päivitettävät tietoaineistot kannattaa avata rajapinnan kautta.

Tietoaineiston koon vaikutus teknisiin valintoihin

 

1.7 Tietovarantokatsauksen julkaisu

Kun olet koonnut katsauksen organisaatiosi tietovarannoista, jossa kuvaat tietosisällön ominaisuuksia ja luokittelet tiedon avoimuuden, julkaise katsaus. Katsauksen julkaiseminen laajentaa kohdeyleisön tietämystä organisaatiosi hallussa olevista tietovarannoista ja edesauttaa kysynnän tunnistamista. Jos katsauksesi ei päädy yleisön saataville, yleisöltä jää puuttumaan kokonaiskuva olemassa olevista tietovarannoista. Jos yleisö ei voi määritellä tarpeitaan, et tiedon omistajana pysty priorisoimaan avattavia tietoja kysyntään perustuen.

Voit julkaista tietovarantokatsauksen esimerkiksi avoindata.fi-palvelun kautta sijoittaen katsauksen yhteentoimivuuden aineistoihin.

 

1.8 Lopputulos ja vastuuhenkilöt

Kartoitus- ja selvitysvaiheen lopputuloksena saadaan

Kartoita ja selvitä

Arvioi ja valitse

Valmistele ja avaa

Seuraa ja kehitä

Tietojärjestelmäluettelot

Käyttäjätarpeiden ja kysynnän kartoitus

Avattu tietoaineisto

Avoimen tiedon vuosikatsaus

Tietovarantoluettelot

Suunnitelma tietovarantojen avaamisesta

Avatun tietoaineiston ylläpitosuunnitelma

 

Selvitys siitä, minkä tietovarantojen käytölle on lainsäädännöllisiä tai muita rajoituksia

Suunnitelma tietovarantojen avaamisen kustannuksista kehysvalmistelua varten

Palautemenetelmät

 
 

Määritelmä avaamisen tavoitteista

   

Kartoitus- ja selvitysvaiheen vastuuhenkilöt ovat

 

Kartoita ja selvitä

Arvioi ja valitse

Valmistele ja avaa

Seuraa ja kehitä

Johto

 

X

   

Lakimies

X

X

X

 

Kokonaisarkkitehtuurista vastaava

X

     

Sidosryhmät

     

X

Taloushallintoasiantuntija

 

X

   

Tiedon avaamisesta vastaava

 

X

   

Tiedon käyttäjät

     

X

Tiedon omistaja

X

 

X

X

Tietohallintoasiantuntija

X

X

X

 

Tietojärjestelmätoimittaja

   

X

 

Tietoturva-asiantuntija

X

     

Ulkopuolinen konsultti

   

X

 

Viestintäasiantuntija

 

X

X