Sanasto

Anonymisointi

Datan muokkaaminen siten, että yksittäisiä henkilöitä ei voi tunnistaa siitä. Tällä tarkoitetaan tunnistetietojen poistamista, eli esimerkiksi henkilötunnusten, nimien ja osoitteiden poistamista datasta.

API eli Application Programming Interface

API eli ohjelmointirajapinta on rajapinta, jonka avulla eri ohjelmat voivat kommunikoida keskenään. Ohjelmat voivat esimerkiksi tehdä pyyntöjä tai vaihtaa tietoja.

Avoin data

Avoin data on digitaalisessa muodossa olevaa koneluettavaa tietoa, joka on kaikkien vapaasti käytettävissä mihin tahansa tarkoitukseen, kunhan sen alkuperäinen lähde mainitaan. Avoin data voi olla esimerkiksi väestönlaskentatietoja, karttatietoja tai vaikkapa reaaliaikaista dataa bussien sijainneista.

Avoin lisenssi

Lisenssi, joka sallii tietoaineiston vapaan levittämisen, muokkauksen ja käytön, myös kaupallisiin tarkoituksiin. Suosittelemme avoimen datan tietoaineistojen lisenssiksi Creative Commons Nimeä 4.0 (CC BY 4.0) tai Creative Commons CC0 1.0 -lisenssiä.

Avoin lähdekoodi (open source)

Avoin lähdekoodi tarkoittaa tietokoneohjelmien avoimia tuottamis- ja kehitysmenetelmiä, jotka tarjoavat käyttäjälle mahdollisuuden tutustua ohjelman lähdekoodiin ja muokata sitä omien tarpeidensa mukaisesti. Avoimen lähdekoodin periaatteisiin kuuluu myös vapaus käyttää ohjelmaa mihin tahansa tarkoitukseen ja kopioida ja levittää sekä alkuperäistä että muokattua versiota. (Lähde: Wikipedia.)

Data

Datalla tarkoitetaan digitaalisesti tallennettua, merkeistä ja symboleista koostuvaa koneellisesti luettavissa olevaa potentiaalista informaatiota, joka voi muodostaa esimerkiksi dokumentteja, tietokantoja ja audiotallenteita. Se voidaan ymmärtää raaka-aineena, jota jalostamalla syntyy merkityksellistä informaatiota. (Lähde: P2PU.)

Data-aineisto

Data-aineisto on yksi tietoaineiston osa. Se on tiedosto, joka sisältää itse datan. Tietoaineistolla voi olla useita data-aineistoja, joista osa voi sisältää saman datan eri muodoissa, ja osa erityyppistä dataa. Esimerkiksi tietoaineisto “suosituimmat nimet” voisi sisältää neljä data-aineistoa: suosituimmat etunimet sekä sukunimet erillisinä Excel-taulukkoina ja CSV-tiedostoina.

Datakategoria

Datakategoriat ovat tapa luokitella avointa dataa erilaisiin teemoihin, kuten liikenne tai ympäristö ja luonto. Jokainen tietoaineisto kuuluu vähintään yhteen kategoriaan, mikä helpottaa datan löytämistä sivustolta. Lisätietoa datakategorioista löydät Tietoaineistojen kategoriat -sivulta.

Harvestointi

Harvestoinnilla tarkoitetaan datan automaattista keräämistä eri sivustoilta yhteen paikkaan, kuten avoindata.fi:hin. Avoindata.fi harvestoi esimerkiksi Paikkatietohakemistoa, joilloin Paikkatietohakemiston aineistot löytyvät automaattisesti myös Avoindata.fi:stä. Harvestointi helpottaa datan löytämistä, sillä voit etsiä dataa keskitetysti yhdestä paikasta monen eri sivuston sijaan.

Informaatio

Informaatiolla tarkoitetaan esimerkiksi tekstiä tai bittijonoa, joka on laadittu kuvaamaan tiettyä asiantilaa. Mitä tarkemmin informaatio kuvaa asiantilaa, sitä suurempi on sen informaatiosisältö. Informaatio jalostuu datasta. (Lähde: Tieteen termipankki)

Ketterä ohjelmistokehitys

Ketterällä ohjelmistokehityksellä tarkoitetaan menetelmiä, joissa tuotekehitystä suunnitellaan ja toteutetaan lyhyissä sykleissä. Menetelmille on ominaista mahdollisimman nopea arvontuotto ja muutoksiin reagointi sekä tiivis asiakasyhteistyö. Ketteriä ohjelmistokehityksen menetelmiä on useita, esimerkiksi Scrum ja Kanban. (Lähde: Kari Hara)

Koneluettavuus

Koneluettava data on nimensä mukaisesti tarkoitettu koneen käsiteltäväksi, eli käytännössä erilaisissa sovelluksissa hyödynnettäväksi. Koneluettava data on tietoa, joka on tallennettu sellaiseen muotoon, että kone pystyy sitä käsittelemään (esim. JSON, XML, CSV). Esim. PDF-muoto ei välttämättä ole koneluettava, sillä vaikka ihmisen on helppo lukea sitä, niin koneellisesti sitä ei pysty tulkitsemaan. (Lähde: HRI.)

Käyttölupa

Ks. Lisenssi

Käyttösovellus

Käyttösovellukset ovat esimerkiksi sovelluksia, visualisaatioita ja tutkimuksia, jotka hyödyntävät avoimen datan tietoaineistoja. Yleensä avoimen datan sovelluksia luovat tutkijat ja sovelluskehittäjät, mutta parantuneiden kehitys- ja visualisointityökalujen ansiosta kuka vain voi hyödyntää tietoaineistoja.

Lisenssi

Lisenssillä määritellään käyttöehdot, joilla avattua dataa saa käyttää. Lisenssistä käytetään myös sanaa käyttölupa. (Lähde: HRI.)

Metadata eli metatieto

Metadata on tietoa tiedosta, eli aineiston kuvailutiedot. Metadataan kuuluu datan sisältöä tai rakennetta kuvaavat tiedot, joiden pohjalta dataa pystyy hyödyntämään oikein. Metadataa voi olla esimerkiksi valokuvien sijaintitiedot sekä tiedot siitä, millaisella kameralla kuva on otettu. Metadata mahdollistaa myös tietoaineiston löytämisen erilaisin hakukriteerein. (Lähde: HRI.)

Omadata (MyData)

Omadata-periaatteen mukaan ihmisillä on oltava mahdollisuus hallita, hyödyntää ja luovuttaa eteenpäin heistä kerättäviä henkilötietoja (esim. terveystiedot, energiatiedot tai ostotiedot). Omadata ei ole koskaan avointa dataa. (Lähde: Wikipedia.)

Ohjelmointirajapinta

Ks. API

Organisaatio

Ks. Tuottaja

Raakadata

Raakadata on koneellisesti luettavissa oleva dataa, johon ei kohdistu tekijänoikeuksia. (Lähde: JHS-189.)

Rajapinta

Rajapinta on käytäntö tai liittymäpinta, jonka kautta on mahdollista siirtää dataa laitteiden ja sovellusten tai sovelluksen ja käyttäjän välillä. (Lähde: TSK.)

Tieto

Tieto on todenmukaista ja perusteltavaa informaatiota, jolle vastaanottaja on antanut merkityksen. Tieto jalostuu informaatiosta. (Lähde: TSK.) 

Tietoaineisto

Tietoaineistot ovat avoindata.fi-palvelun varsinaista sisältöä, eli avointa dataa. Tietoaineisto on yksilöitävissä oleva kokoelma tietoa, esimerkiksi aineisto, joka sisältää tiedon suomalaisten nimien yleisyydestä. Jokainen tietoaineisto kuuluu jollekin tuottajalle sekä vähintään yhteen avoimen datan kategoriaan.

Tuottaja

Tuottajalla tarkoitetaan avoindata.fi-palveluun luotua organisaatiota, jota käytetään tietoaineistojen julkaisemiseen ja hallinnointiin. Tuottaja voi olla paitsi julkisen hallinnon organisaatio tai yksityinen yritys, myös esimerkiksi yhdistys tai yksityishenkilö.

WFS-rajapinta

WFS eli Web Feature Service -rajapinta on standardoitu ohjelmistoriippumaton rajapinta, jonka kautta paikkatietoaineistoja voidaan jakaa vektorimuotoisina, eli pisteinä tai viivoina. Tällaisia paikkatietoaineistoja ovat esimerkiksi GPS-laitteiden reittiviivat. WFS-rajapintaa käytetään usein ajantasaisten karttatietojen jakamiseen. (Lähde: HRI.)

WMS-rajapinta

WMS eli Web Map Service -rajapinta on standardoitu ohjelmistoriippumaton rajapinta, joka mahdollistaa paikkatiedon jakamisen kuvina tietoverkon yli. WMS-rajapinnan kautta paikkatietoja voi jakaa rasterimuotoisena, eli pikseleistä koostuvina. Tällaisia paikkatietoaineistoja ovat esimerkiksi ilma- ja satelliittikuvat. WMS-rajapintaa käytetään usein ajantasaisten kartta-aineistojen jakamiseen. (Lähde: HRI.)

Yhteentoimivuus (interoperability)

Yhteentoimivuudella tarkoitetaan tietojärjestelmien kykyä viestiä keskenään sellaisella tavalla tai siinä laajuudessa, että ne voivat rutiininomaisesti käyttää toistensa tietoja.