5. Julkaiseminen

Metatietojen kuvaus

Tässä vaiheessa kuvataan, miksi ja miten organisaation on hyvä kuvata avattava tietoaineisto sekä missä meta- eli kuvailutiedot voidaan julkaista.

Avattavan tietoaineistojen metatietojen kuvaukseen ei ole olemassa tiedonhallintalautakunnan suositusta, mutta esimerkiksi avoindata.fi-palvelussa julkaistavissa metatiedoissa käytetään EU-maiden yhteistä DCAT-AP 2.0 -tietomallia.

Tietoa jo avanneet organisaatiot ovat julkaisseet tietoaineiston julkaisemisen yhteydessä on tietoaineistosta kuvailutietoa kuten julkaistun tietoaineiston otsikko, konteksti, tuottaja, sisältö ja rakenne. Kuvailutietoja kutsutaan myös metatiedoiksi tai metadataksi.

Tietoa jo avanneet organisaatiot ovat julkaisseet metatiedot tietoaineiston ohessa joko dataportaalissa (kuten avoindata.fi), organisaation omilla verkkosivuilla tai molemmissa.

Kattavilla metatiedoilla edistetään datan löydettävyyttä sekä uudelleenkäyttöä.

Metatiedot antavat datan käyttäjille, niin ihmisille kuin koneillekin, hyödyllistä lisäinformaatiota tietoaineistosta. Ne auttavat ymmärtämään dataa ja siten helpottavat datan uudelleenkäyttöä. Metatietojen avulla kuvaillaan muun muassa datan alkuperää, sen rakennetta sekä datan käyttöön kohdistuvia oikeuksia ja lisenssejä. Julkaistaessa dataa internetissä sen alkuperäinen konteksti katoaa helposti, jonka takia on erityisen tärkeää tarjota käyttäjälle metatietoja.

Metatiedot kannattaa tarjota suomen kielellä, mutta mahdollisuuksien mukaan myös ruotsiksi ja englanniksi. Erityisesti englanninkielisistä metatiedoista on hyötyä mahdollisille kansainvälisille datan hyödyntäjille. Avoindata.fi-palveluun kuvatut tietoaineistot löytyvät automaattisesti myös Euroopan dataportaalista, joten data on myös kansainvälisesti näkyvissä. Metatietojen olisi hyvä olla saatavilla sekä ihmis- että koneluettavassa formaatissa.

Tietoaineiston metatiedoissa on hyvä tuoda esille myös tiedon tuotantoprosessi ja mahdolliset tietoaineiston tuottamiseen liittyvät laskentakaavat tai vastaavat mikäli mahdollista.

Tietoaineiston metatietokuvaukseen kannattaa mahdollisuuksien mukaan liittää tiedon laadun kuvaus julkishallinnon yhteisten laatukriteerien mittaristoa hyödyntäen.

Metatietokäytännöt avoindata.fi-palvelussa

Julkaistaessa tietoa avoindata.fi-palvelussa metatiedot pitää täyttää vähintään pakollisiin metatietokenttiin. Nämä metatiedot näytetään käyttäjälle tietoaineiston ja data-aineiston sivuilla. Halutessaan tietoaineistolle voi lisätä myös erillisen tekstitiedoston, jossa voi kuvailla aineistoa tarkemmin.

Avoindata.fi-palvelussa tietoaineistoilta vaaditut metatiedot perustuvat DCAT-AP 2.0 -tietomalliin. DCAT-AP on EU-maiden yhteinen sopimus siitä, mitä metatietoja avoimen datan tietoaineistoista tulisi tarjota. Sen tarkoituksena on yhtenäistää eri maiden metatietovaatimuksia ja siten helpottaa datan hyödyntämistä. Se perustuu W3C:n luomaan DCAT-standardiin (englanniksi)

Avoindata.fi on luonut ja dokumentoinut oman DCAT-AP-laajennoksensa (englanniksi). Laajennoksen ansiosta myös avoindata.fi on DCAT-AP yhteensopiva, palvelun haku toimii paremmin ja tietoaineistot löytyvät helposti Euroopan dataportaalista, jonne aineistot harvestoidaan. Metatietomallia tietoaineistojen kuvailemiseen on myös kuvattu avoindata.fi-palvelun viitekehyksessä (Google docs)

Lisätietoja DCAT-AP:sta ja avoindata.fi:n laajennoksesta.

Euroopan dataportaali tarjoaa lisätietoja DCAT-metatietomallista sekä koulutusvideoita (englanniksi)

Metatietokäytännöt Helsinki Region Infoshare -palvelussa

Datalle kannattaa antaa mahdollisimman yleistajuinen nimi. Lisäksi datasta kannattaa kirjoittaa yleistajuinen sanallinen kuvaus, jossa kerrotaan muun muassa,

  • mistä ja millaisesta datasta on kyse,
  • miten se on laadittu tai kerätty ja
  • onko datassa jotain erityistä, jota käyttäjän tulisi tietää, jotta hän osaa tulkita dataa oikein.

Kuvauksessa kannattaa kertoa avoimesti myös datan puutteista sekä mahdollisista virheistä. Olisi myös hyvä, että datan ominaisuustiedot sekä datassa käytetyt lyhenteet kuvataan ja kirjoitetaan auki. Datan metatiedot kannattaa kääntää myös englanniksi.

HRI:n käyttämä metatietomalli.

Metatietokäytännöt Suomen ympäristökeskuksessa

SYKEssä on käytössä tallennustyökalu metatietojen kuvaamiseen (metadataeditori) ja erillinen loppukäyttäjille tarkoitettu metatietopalvelu

Metatietoja on mahdollista tuottaa tietoaineistoista ja -järjestelmistä, rajapintapalveluista, ympäristöraportoinneista sekä tutkimusdatasta. Näille kaikille on toteutettu omat metatietoprofiilit. Tietoaineistojen ja rajapintapalveluiden metatietoprofiilit noudattavat INSPIRE-direktiivin vaatimuksia. 

Sekä metadataeditori että metatietopalvelu tarjoavat avoimet rajapinnat metatietojen harvestointiin. Rajapintojen kautta SYKEn aineistojen ja rajapintojen kuvauksia siirretään Maanmittauslaitoksen ylläpitämään Paikkatietohakemistoon (INSPIRE-direktiivin mukaiset metatiedot), DVV:n ylläpitämään avoindata.fi-palveluun (SYKEn avoimien aineistojen metatiedot) sekä CSC:n Etsin.fi-palveluun.

Harvestoinnin kautta SYKEn avoimet aineistot löytyvät myös paikkatietohakemistosta ja sitä kautta Euroopan paikkatietohakemistosta. Avoindata.fi:n kautta SYKEn aineistot löytyvät myös Euroopan dataportaalista.
SYKEn metatietojärjestelmään kuuluu metadataeditori ja metatietojen loppukäyttäjille tarkoitettu metatietopalvelu. Kumpikin palvelu tarjoaa rajapinnan metatietojen harvestointiin

Metatietokäytännöt Paikkatietohakemistossa

INSPIRE-direktiivin mukaan EU:n jäsenmaiden on laadittava metatiedot direktiivin piiriin kuuluvista paikkatietoaineistoista ja -palveluista sekä julkaistava ne hakupalvelussa. Maanmittauslaitoksen toteuttama Paikkatietohakemisto-palvelu mahdollistaa paikkatiedon tuottajille metatietojen tallentamisen ja jakelun sekä INSPIREN mukaisille että myös muille paikkatietoaineistoille. 

Aineistoista kuvataan muun muassa maantieteellinen ja ajallinen kattavuus, tuotantoprosessi ja saatavuuteen liittyviä rajoituksia. Paikkatietopalveluista kuvataan esimerkiksi tarjottavat aineistot ja linkit itse palveluun. 

Palvelussa on lähes 300 käyttäjää, jotka edustavat noin 150 organisaatiota. Metatiedot on julkaistu lähes 1 400 paikkatietoaineistolle tai -palvelulle. Niistä kolmasosa ei kuulu direktiivin velvoittamiin tietoihin. 

Metatietokäytännöt Tilastokeskuksessa

Luotettavien tilastojen tekeminen ja niiden tulkitseminen vaatii paljon taustatietoja tilastoista ja niiden kuvaamista asioista. Tietoa tilastoista -osioon on koottu Tilastokeskuksen tilastojen metatiedot. Metatietopalvelu sisältää seuraavia metatietokokonaisuuksia.

Tilastokeskus ylläpitää ja julkaisee kansallisia luokitussuosituksia. Niistä useimmat perustuvat EU-direktiiveillä vahvistettuihin kansainvälisiin standardeihin. Luokitussuosituksia käyttämällä edistetään eri aikoina ja eri alueilta tuotettujen tilastotietojen vertailtavuutta.

Luokitukset muodostuvat nimikkeistä eli luokkien nimistä, niille annetuista koodeista eli numero- tai kirjaintunnuksista sekä luokkien kuvauksista eli määritelmistä. Luokittelulla tarkoitetaan tilastoaineistoissa esiintyvien yksittäisten tietojen jaottelua määrättyjen ominaisuuksien mukaan eri ryhmiin siten, että kukin yksikkö kuuluu vain yhteen ryhmään. Luokittelun yhteydessä ryhmät nimetään ja niille annetaan tunnukset. Tilastokeskuksen luokituksia on julkaistu myös avoimen rajapintapalvelun kautta.

Yhteentoimivuusalustan hyödyntäminen

Digi- ja väestötietoviraston ylläpitämä Yhteentoimivuusalusta mahdollistaa yhtenäisen tietosisältöjen kuvailun ja määrittelyn sekä toimijoiden tehokkaan ja läpinäkyvän yhteistoiminnan tiedonhallinnassa. Se koostuu sanastoista, koodistoista ja tietovirroissa ja muussa tiedonhallinnassa tarvittavista tietomalleista. 

Yhteentoimivuusalusta on tarkoitettu sekä julkisen hallinnon että yksityissektorin käyttöön. Alusta on maksuttomasti käytettävissä terminologiseen sanastotyöhön, koodistojen hallintaan ja tietomallinnukseen. Tietosisältöjen tuottajat vastaavat kukin omista tietomäärityksistään sekä niiden ajantasaisuudesta ja laadusta.

Yhteentoimivuusalustalla olevat valmiit tietomääritykset ovat vapaasti hyödynnettävissä. Valmiiden koodistojen ja tietomallien hyödyntäminen omassa järjestelmäkehityksessä on kustannustehokasta ja parantaa yhteentoimivuutta eri toimijoiden järjestelmien kanssa. Yhdenmukaisten käsitteiden käyttö helpottaa palveluiden suunnittelua ja ymmärrettävyyttä.

Yhteentoimivuusalustalla hyödynnetään yhteentoimivuusmenetelmää. Menetelmän avulla luodaan ja ylläpidetään tiedon semanttista yhteentoimivuutta eli tiedon käsittelyä siten, että sen merkitys tietovirroissa säilyy samana. Yhteentoimivuusmenetelmä on yhteinen tapa hallita, tuottaa ja ylläpitää digitaalisten palveluiden ja tietovirtojen taustalla tarvittavia tietomäärityksiä ja metatietoja.

Keskeistä on tietosisältöjä kuvaavien tietomääritysten yhdenmukaisuus ja uudelleenkäyttö: aiemmin tehtyjä sanastoja, koodistoja ja tietomalleja hyödynnetään mahdollisimman paljon. Yhteentoimivuusmenetelmän mukaiset tietosisällöt on kuvattu Yhteentoimivuusalustalle, joka on avoin verkkoalusta koneymmärrettävien tietomääritysten tekemiseen.

Yhteentoimivuusmenetelmä ohjaa organisaatioiden yhteisten ydinkäsitteiden, ydinluokkien ja koodistojen tekemistä ja sitä, miten jonkin organisaation tekemät kuvaukset voidaan yleistää kaikkien käyttöön. Samalla se ohjaa myös sitä, miten näitä yhteisiä kuvauksia voidaan hyödyntää organisaatioiden omien kuvausten tekemisessä.

Yhteentoimivuusalustan julkiseen dokumentaatioon on koottu tarpeellista tietoa siitä, kuinka Yhteentoimivuusalustalle voi liittyä ja perusohjeistus siitä, kuinka päästä alkuun työkalujen käytössä.

Julkaisu ja viestintä

Tässä vaiheessa kuvataan, miten ja missä avattava tietoaineisto on hyvä julkaista sekä miten siitä on hyvä viestiä.

Avattavan tietoaineiston julkaisuun ja viestimiseen ei ole olemassa virallisia suosituksia.

Tietoa jo avanneet organisaatiot ovat lähtökohtaisesti julkaisseet avattavan tietoaineiston kuvailu- eli metatietoineen julkisessa dataportaalissa, jotta tietoaineisto olisi mahdollisimman helposti ja nopeasti löydettävissä. Tiedon jakamista varten perustettuja dataportaaleja löytyy Suomesta useita. Tunnetuimpia dataportaaleja ovat muun muassa Digi- ja väestöviraston ylläpitämä avoindata.fi-palvelu, pääkaupunkiseudun kaupunkien Helsinki Region Infoshare -palvelu, Maanmittauslaitoksen ylläpitämä Paikkatietohakemisto ja Suomen ympäristökeskuksen dataportaali. Sen lisäksi, että organisaatio julkaisee tietoaineistonsa kuvailutiedot jossain dataportaalissa, voi organisaatio julkaista tietoa myös omilla verkkosivuilla.

Avoindata.fi-palvelu toimii kansallisena avoimen datan yhteyspisteenä, josta löytyvien tietoaineistojen kuvailutiedot harvestoidaan ja julkaistaan Euroopan komission hallinnoimassa DataEurope.eu-palvelussa. Avoindata.fi sisältää paljon muissa suomalaisissa dataportaaleissa julkaistujen tietoaineisten kuvailutietoja - tietoja harvestoidaan muun muassa Helsinki Region Infoshare -palvelusta ja Paikkatietohakemistosta.

Valtion hallinnon tekemistä datan avauksista on hyvä viestiä avoindata.fi-palvelussa. Sitä kautta viesti tavoittaa suuren määrän datan hyödyntämisestä kiinnostuneita.

Organisaation on hyvä markkinoida avaamiaan tietoaineistoja eri viestintätavoin ja kannustaa niiden hyödyntämiseen. Lisäksi on hyvä rohkaista käyttäjiä kertomaan käyttösovelluksista, joihin he ovat dataa hyödyntäneet. Mahdollisia käyttösovellusesimerkkejä on hyvä tuoda esille esimerkiksi sosiaalisessa mediassa ja inspiroida näin muita sovelluskehittäjiä sekä datan hyödyntäjiä.

Julkaiseminen avoindata.fi:ssä

Avoindata.fi on kansallinen avoimen datan palvelu. Sen tavoitteena on koota kaikki suomalainen avoin data yhteen paikkaan. Kansallisessa portaalissa on se hyöty, että organisaation ei tarvitse käyttää omia resurssejaan portaalin kehittämiseen ja ylläpitoon. Lisäksi erilaiset hyödyntäjät löytävät aineistot helposti. Avoindata.fi-palvelu perustuu avoimeen lähdekoodiin ja on käytettävissä kolmella eri kielellä.

Avoindata.fi-palvelu tarjoaa muun muassa

  • Maksuttoman julkaisualustan avoimille tietoaineistolle. 
  • Kansainvälistä näkyvyyttä. Euroopan dataportaali harvestoi avoindata.fi-palvelua, eli kaikki palveluun ladattu data löytyy myös Euroopan kansainvälisestä avoimen datan portaalista.
  • Tilastoja. Avoindata.fi:stä saa erilaisia tilastoja muun muassa palvelun käytöstä sekä organisaatioiden ja tietoaineistojen suosittuudesta.
  • Tukimateriaaleja datan avaamiseen ja julkaisemiseen

Avoindata.fi:n käyttö on mahdollista myös rajapinnan kautta. Lisätietoja avoindata.fi:n käyttämisestä rajapinnan kautta.

Julkaiseminen HRI-palvelussa

Pääkaupunkiseudun kaupunkien (Helsinki, Espoo, Vantaa ja Kauniainen kuntayhtymineen) avoimet datat julkaistaan hri.fi:ssä, josta datojen metatiedot harvestoituvat automaattisesti avoindata.fi:hin.

Avatuista datoista ja suuremmista päivityksistä kannattaa viestiä mahdollisimman laajasti. Jos mahdollista, niin esimerkiksi rajapintojen versiopäivityksistä kannattaa viestiä jo etukäteen. Sopivia viestintäkanavia ovat organisaation omien verkkosivujen ja intranetin lisäksi muun muassa uutiskirjeet, sosiaalisen median kanavat ja erilaiset tapahtumat. Viestintää voivat tehdä useammat tahot: esimerkiksi pääkaupunkiseudulla datan avaajataho sekä HRI-palvelu viestivät avauksesta.

Julkaiseminen Paikkatietoikkuna.fi-palvelussa

Paikkatietoikkuna on kansallinen paikkatietoportaali, joka esittelee paikkatietoaineistoja ja -palveluja sekä niiden hyödyntämismahdollisuuksia. Paikkatietoikkuna on keskeinen osa Suomen INSPIRE-toimeenpanoa. INSPIRE-direktiivin velvoittamia ovat viranomaiset, jotka hallinnoivat tai ylläpitävät direktiivin soveltamisalaan kuuluvia paikkatietoaineistoja. Lisää INSIPIRE-direktiivin velvoitteista Maanmittauslaitoksen verkkosivuilta.

Palvelun kautta voi muun muassa katsella eri karttatasoja päällekkäin, julkaista kartan omalla verkkosivulla, luoda tilastoteemakarttoja ja tehdä yksinkertaisia paikkatietoanalyyseja. Käytettävissä on yli 2000 karttatasoa yli 60 eri organisaatiolta. Karttatasot tuodaan tarjolle eri toimijoiden julkaisemien rajapintapalvelujen kautta, jolloin Paikkatietoikkunassa olevat paikkatiedot ovat yhtä ajantasaisia kuin tiedontuottajien omissa palveluissa.

Paikkatietoikkuna on tarkoitettu paikkatiedon ammattilaisille ja kaikille kartoista ja paikkatiedosta kiinnostuneille. Sillä on arkisin yli 3000 päivittäistä kävijää, jotka käyttävät sitä hyvin monenlaisiin tarkoituksiin vapaa-ajalla ja työtehtävien hoitamisen tueksi. Lisätietoja Paikkatietoikkunasta.