Sanasto

Anonymisointi (Data anonymization)
Datan sisältämien tunnistetietojen poistaminen tai muuntaminen siten, että henkilöitä ei voi sen jälkeen enää tunnistaa tai erottaa tietoaineistosta. (Lähde: https://tieteentermipankki.fi/wiki/Avoin_tiede:anonymisointi)

API (Application Programming Interface)
Ohjelmointirajapinnat eli API:t (Application Programming Interface) ovat dokumentoituja rajapintoja, joiden avulla ohjelmistot, sovellukset tai järjestelmät voivat vaihtaa keskenään tietoa tai toimintoja.
(Lähde: Application Programming Interfaces in Governments: Why, what and how)

Avoin data (Open data)
Avoin data on digitaalisessa muodossa olevaa koneluettavaa tietoa, joka on kaikkien vapaasti käytettävissä mihin tahansa tarkoitukseen, kunhan sen alkuperäinen lähde mainitaan. Avoin data voi olla esimerkiksi väestönlaskentatietoja, karttatietoja tai vaikkapa reaaliaikaista dataa bussien sijainneista.

Avoin lisenssi (Open licence)
Lisenssi, joka sallii tietoaineiston vapaan levittämisen, muokkauksen ja käytön, myös kaupallisiin tarkoituksiin. Suosittelemme avoimen datan tietoaineistojen lisenssiksi Creative Commons Nimeä 4.0 (CC BY 4.0) tai Creative Commons CC0 1.0 -lisenssiä.

Avoin lähdekoodi (open source)
Avoin lähdekoodi tarkoittaa tietokoneohjelmien avoimia tuottamis- ja kehitysmenetelmiä, jotka tarjoavat käyttäjälle mahdollisuuden tutustua ohjelman lähdekoodiin ja muokata sitä omien tarpeidensa mukaisesti. Avoimen lähdekoodin periaatteisiin kuuluu myös vapaus käyttää ohjelmaa mihin tahansa tarkoitukseen ja kopioida ja levittää sekä alkuperäistä että muokattua versiota. (Lähde: Wikipedia.)

Data
Datalla tarkoitetaan digitaalisesti tallennettua, merkeistä ja symboleista koostuvaa koneellisesti luettavissa olevaa potentiaalista informaatiota, joka voi muodostaa esimerkiksi dokumentteja, tietokantoja ja audiotallenteita. Se voidaan ymmärtää raaka-aineena, jota jalostamalla syntyy merkityksellistä informaatiota. (Lähde: P2PU.)

Data-aineisto (dataset)
Data-aineisto on yksi tietoaineiston osa. Se on tiedosto, joka sisältää itse datan. Tietoaineistolla voi olla useita data-aineistoja, joista osa voi sisältää saman datan eri muodoissa, ja osa erityyppistä dataa. Esimerkiksi tietoaineisto “suosituimmat nimet” voisi sisältää neljä data-aineistoa: suosituimmat etunimet sekä sukunimet erillisinä Excel-taulukkoina ja CSV-tiedostoina.

Datakatalogi (Data Catalog)
Datakatalogi on strukturoitu metadatarekisteri, johon on yhdistetty metadataa useampien julkisten organisaatioiden hallussa olevista aineistoista. Datakatalogit voivat olla:
1) kansallisia (esimerkiksi avoindata.fi ja data.gov.uk)
2) seudullisia (Washington D.C. tai Helsinki Region Infoshare)
3) kaupunkien ylläpitämiä (San Francisco)
4) yksityisten tahojen ylläpitämiä (Sunlight Foundation - National datacatalog). (Lähde: Julkinen data - johdatus tietovarantojen avaamiseen).

Datakategoria
Datakategoriat ovat tapa luokitella avointa dataa erilaisiin teemoihin, kuten liikenne tai ympäristö ja luonto. Jokainen tietoaineisto kuuluu vähintään yhteen kategoriaan, mikä helpottaa datan löytämistä sivustolta. Lisätietoa datakategorioista löydät Tietoaineistojen kategoriat -sivulta.

Esitysmuoto

Harvestointi
Harvestoinnilla tarkoitetaan datan automaattista keräämistä eri sivustoilta yhteen paikkaan, kuten avoindata.fi:hin. Avoindata.fi harvestoi esimerkiksi Paikkatietohakemistoa, joilloin Paikkatietohakemiston aineistot löytyvät automaattisesti myös Avoindata.fi:stä. Harvestointi helpottaa datan löytämistä, sillä voit etsiä dataa keskitetysti yhdestä paikasta monen eri sivuston sijaan.

Informaatio
Informaatiolla tarkoitetaan esimerkiksi tekstiä tai bittijonoa, joka on laadittu kuvaamaan tiettyä asiantilaa. Mitä tarkemmin informaatio kuvaa asiantilaa, sitä suurempi on sen informaatiosisältö. Informaatio jalostuu datasta. (Lähde: Tieteen termipankki)

Ketterä ohjelmistokehitys
Ketterällä ohjelmistokehityksellä tarkoitetaan menetelmiä, joissa tuotekehitystä suunnitellaan ja toteutetaan lyhyissä sykleissä. Menetelmille on ominaista mahdollisimman nopea arvontuotto ja muutoksiin reagointi sekä tiivis asiakasyhteistyö. Ketteriä ohjelmistokehityksen menetelmiä on useita, esimerkiksi Scrum ja Kanban. (Lähde: Kari Hara)

Koneluettavuus
Koneluettava data on nimensä mukaisesti tarkoitettu koneen käsiteltäväksi, eli käytännössä erilaisissa sovelluksissa hyödynnettäväksi. Koneluettava data on tietoa, joka on tallennettu sellaiseen muotoon, että kone pystyy sitä käsittelemään (esim. JSON, XML, CSV). Esim. PDF-muoto ei välttämättä ole koneluettava, sillä vaikka ihmisen on helppo lukea sitä, niin koneellisesti sitä ei pysty tulkitsemaan. (Lähde: HRI.)

Käyttölupa
Ks. Lisenssi

Käyttösovellus
Käyttösovellukset ovat esimerkiksi sovelluksia, visualisaatioita ja tutkimuksia, jotka hyödyntävät avoimen datan tietoaineistoja. Yleensä avoimen datan sovelluksia luovat tutkijat ja sovelluskehittäjät, mutta parantuneiden kehitys- ja visualisointityökalujen ansiosta kuka vain voi hyödyntää tietoaineistoja.

Lisenssi
Lisenssillä määritellään käyttöehdot, joilla avattua dataa saa käyttää. Lisenssistä käytetään myös sanaa käyttölupa. (Lähde: HRI.)

Metadata eli metatieto
Metadata on tietoa tiedosta, eli aineiston kuvailutiedot. Metadataan kuuluu datan sisältöä tai rakennetta kuvaavat tiedot, joiden pohjalta dataa pystyy hyödyntämään oikein. Metadataa voi olla esimerkiksi valokuvien sijaintitiedot sekä tiedot siitä, millaisella kameralla kuva on otettu. Metadata mahdollistaa myös tietoaineiston löytämisen erilaisin hakukriteerein. (Lähde: HRI.)

Omadata (MyData)
Omadata-periaatteen mukaan ihmisillä on oltava mahdollisuus hallita, hyödyntää ja luovuttaa eteenpäin heistä kerättäviä henkilötietoja (esim. terveystiedot, energiatiedot tai ostotiedot). Omadata ei ole koskaan avointa dataa. (Lähde: Wikipedia.)

Ohjelmointirajapinta
Ks. API

Organisaatio
Ks. Tuottaja

Raakadata
Raakadata on koneellisesti luettavissa oleva dataa, johon ei kohdistu tekijänoikeuksia. (Lähde: JHS-189.)

Rajapinta
Rajapinta on käytäntö tai liittymäpinta, jonka kautta on mahdollista siirtää dataa laitteiden ja sovellusten tai sovelluksen ja käyttäjän välillä. (Lähde: TSK.)

Tieto
Tieto on todenmukaista ja perusteltavaa informaatiota, jolle vastaanottaja on antanut merkityksen. Tieto jalostuu informaatiosta. (Lähde: TSK.) 

Tietoaineisto
Tietoaineistot ovat avoindata.fi-palvelun varsinaista sisältöä, eli avointa dataa. Tietoaineisto on yksilöitävissä oleva kokoelma tietoa, esimerkiksi aineisto, joka sisältää tiedon suomalaisten nimien yleisyydestä. Jokainen tietoaineisto kuuluu jollekin tuottajalle sekä vähintään yhteen avoimen datan kategoriaan.

Tuottaja
Tuottajalla tarkoitetaan avoindata.fi-palveluun luotua organisaatiota, jota käytetään tietoaineistojen julkaisemiseen ja hallinnointiin. Tuottaja voi olla paitsi julkisen hallinnon organisaatio tai yksityinen yritys, myös esimerkiksi yhdistys tai yksityishenkilö.

WFS-rajapinta
WFS eli Web Feature Service -rajapinta on standardoitu ohjelmistoriippumaton rajapinta, jonka kautta paikkatietoaineistoja voidaan jakaa vektorimuotoisina, eli pisteinä tai viivoina. Tällaisia paikkatietoaineistoja ovat esimerkiksi GPS-laitteiden reittiviivat. WFS-rajapintaa käytetään usein ajantasaisten karttatietojen jakamiseen. (Lähde: HRI.)

WMS-rajapinta
WMS eli Web Map Service -rajapinta on standardoitu ohjelmistoriippumaton rajapinta, joka mahdollistaa paikkatiedon jakamisen kuvina tietoverkon yli. WMS-rajapinnan kautta paikkatietoja voi jakaa rasterimuotoisena, eli pikseleistä koostuvina. Tällaisia paikkatietoaineistoja ovat esimerkiksi ilma- ja satelliittikuvat. WMS-rajapintaa käytetään usein ajantasaisten kartta-aineistojen jakamiseen. (Lähde: HRI.)

Yhteentoimivuus (interoperability)
Yhteentoimivuudella tarkoitetaan tietojärjestelmien kykyä viestiä keskenään sellaisella tavalla tai siinä laajuudessa, että ne voivat rutiininomaisesti käyttää toistensa tietoja.