Tilastot

Tietoa Avoindata-palvelun tilastoista

Tilastot päivitetään kerran päivässä ja kunkin tilaston sivulta näet, milloin tilasto on viimeksi päivitetty. Kaikki tilastot ovat ladattavissa csv- tai json-tiedostona.

Avoindata-palvelu käyttää esimerkiksi vierailuiden ja latausten analytiikan keräämiseen Matomo-työkalua. Kuten muutkin analytiikkatyökalut, myös Matomo voidaan estää selainasetuksilla ja -laajennoksilla. Tällöin valitettavasti Avoindata-palvelu ei saa tietoa kyseisen vierailijan toiminnasta palvelussa ja ei pysty näyttämään tietoja palvelun tilastoissa.

Avoindata-palvelun rajapintatilastoja on alettu keräämään huhtikuussa 2023.

Palvelusta löytyy seuraavanlaisia tilastoja:

  • Hallinnonalakooste
  • Vierailijoiden sijainnit maittain
  • Rikkinäiset linkit
  • Vanhentuneet tietoaineistot
  • Eniten katsotut tietoaineistot
  • Ladatuimmat data-aineistot
  • Suosituimmat hakusanat
  • Avoimuus (Five Stars)

Hallinnonalakooste

Hallinonalakoosteeseen on koottu valtion eri hallinnonalojen sekä niiden alla olevien virastojen tietoaineistojen lukumäärä. Tilasto sisältää muun muassa tiedon tietoaineistojen määrästä tiettynä ajankohtana, tietoaineistojen laatua kuvaavan tiedon sekä tiedon käytetyistä tiedostomuodoista.  

Tilastossa laatu kuvastaa tietoaineistojen saamien tähtien keskiarvoa. Tietoaineistojen laatu perustuu niihin tiedostomuotoihin, jotka on arvioitu Tim-Berners Leen viiden tähden mallin mukaisesti asteikolla 0-5 tähteä.   

Tilastoon pääset tästä.

Vierailijoiden sijainnit maittain

Tilasto sisältää maakohtaisten istuntojen määrän seurannan alusta alkaen sekä istuntojen jakautumisen eri maiden välillä. Istuntojen määrää voi tarkastella myös kuukausitasolla.  

Vierailijoiden sijainnin seuranta on aloitettu vuonna 2017. Bottien liikenne on suodatettu pois tilastoista.  

Tilastoon pääset tästä.

Rikkinäiset linkit

Tilastossa on laskettu data-aineistojen viittaamat verkko-osoitteet, joiden avaaminen aiheuttaa virheen.   

Tulokset on lajiteltu tuottajakohtaisesti ja valitsemalla tuottajan, rikkinäisiä linkkejä voi tarkastella tietoaineistokohtaisesti. Kyseiseen näkymään on myös eroteltu mm. virheen tila, syy ja määrä sekä ensimmäisen ja viimeisen virheen päivämäärä.  

Tilastoon pääset tästä.

Vanhentuneet tietoaineistot

Tilastoon on koostettu tietoaineistot, jotka ovat vanhentuneet. Vanhentunut tietoaineisto tarkoittaa tietoaineistoa, jonka tietoihin merkitty voimassaoloajan päättyneen.  

Tilastosta on nähtävissä tietoaineiston luontipäivämäärä ja päivämäärä milloin tietoaineisto on vanhentunut. Myös tietoaineiston sivunäytöt ja latausmäärät löytyvät tilastosta.  

Tilastoon pääset tästä.

Tietoaineistojen katselukerrat

Tilastosta löytyy tietoaineistojen katselukerrat organisaatioittain. Tilastoon on koottu tietoaineistojen  

  • näyttökerrat yhteensä, eli tietoaineistosivun sivulatausten määrä 
    • esimerkiksi tietoaineisto sivulle tuleminen ja sen uudelleen lataaminen tuottaa kaksi näyttökertaa
  • uusien kävijöiden määrä ja niiden osuus kaikista kävijöistä 
    • uudella kävijällä tarkoitetaan tässä tilastossa kävijää, joka tulee sivustolle ensimmäistä kertaa. Koska Avoindata-palvelu ei käytä evästeitä, voi sama vierailija vierailla palvelussa useampana päivänä ja nämä vierailut lasketaan uusiksi vierailuiksi. Jos taas saman istunnon aikana vierailija katselee tietoaineistoa useaan otteeseen, lasketaan tällainen vierailu yhdeksi uudeksi kävijäksi.
  • tietoaineistojen latausmäärät eli käyttäjän tekemien latausten määrä Avoindata-palvelun käyttöliittymästä
    • tämä ottaa huomioon vain palveluun lisättyjen tiedostojen lataukset 
    • jos tietoaineistoon kuuluu useita tiedostoja, lasketaan latausmääriin kaikkien näiden tiedostojen latausmäärät yhteensä
  • rajapintakutsujen määrä eli yksittäisen tietoaineiston metatietojen haku rajapinnasta  
    • tämä pitää sisällään vain datastore_search_sql-kutsut siltä osin, mitä rajapintakutsuja voidaan tilastoida

Valitsemalla organisaation, voi tarkastella tarkemmin katselukertojen jakautumista kyseisen organisaation tietoaineistojen välillä.  

Oletuksena näytetään aina tilastot edellisen kuukauden ajalta. Tuloksia voi myös tarkastella edelliseltä viikolta tai vuodelta tai tietyltä vuodelta.  

Tilastoon pääset tästä.

Data-aineistojen latausmäärät

Tilasto sisältää data-aineistojen latauskerrat sekä rajapintakutsujen määrät organisaatioittain. Tilastoon on koottu data-aineistojen  

  • lataukset eli niiden tiedostojen latausmäärät, jotka on lisätty Avoindata-palveluun 
    • jos tietoaineistoon kuuluu useita tiedostoja, lasketaan latausmääriin kaikkien näiden tiedostojen latausmäärät yhteensä 
  • rajapintakutsujen määrät eli kuinka monta kertaa tietoaineiston sisältöä on haettu rajapinnan kautta  
    • tämä koskee vain niitä tietoaineistoja, jotka ovat datastoressa eli ovat taulukkomuotoista dataa 
    • tämä myös pitää sisällään vain datastore_search_sql-kutsut siltä osin, mitä rajapintakutsuja voidaan tilastoida

Valitsemalla organisaation voi tarkastella yksittäisten data-aineistojen latausmääriä ja rajapintakutsujen määriä. Kyseisestä näkymästä näkee myös mihin tietoaineistoon data-aineistot kuuluvat.  

  • Organisaatiotasolla viimeisin vierailu on viimeisin päivämäärä, jolloin tietoaineisto on katseltu tai ladattu käyttöliittymästä tai rajapinnan kautta.

Oletuksena näytetään aina tilastot edellisen kuukauden ajalta. Tuloksia voi myös tarkastella edelliseltä viikolta tai vuodelta tai tietyltä vuodelta.  

Tilastoon pääset tästä.

Suosituimmat hakusanat

Tilasto sisältää palvelussa käytetyt suosituimmat hakusanat, hakusanalla tehtyjen hakukertojen määrän sekä viimeisimmän päivämäärän, jolloin sanaa on haettu. Tilastoon on listattu 50 suosituinta hakusanaa valitulta aikaväliltä.  

Oletuksena näytetään aina tilastot edellisen kuukauden ajalta. Tuloksia voi myös tarkastella edelliseltä viikolta tai vuodelta tai tietyltä vuodelta.  

Tilastoon pääset tästä.

Avoimuus (Five Stars)

Tilasto kertoo tietoaineistojen avoimuuden, joka on arvioitu automaattisesti Tim Berners-Leen viiden tähden mallilla silloin kun tietoaineisto lisätään palveluun. Tietoaineiston saama tähtien määrä perustuu tietoaineiston/rajapinnan tiedostomuotoon sekä valitun lisenssin tyyppiin. Mitä enemmän tietoaineistolla on tähtiä, sitä avoimempi tietoaineiston on.

Tiedostomuotojen avoimuus on määritelty Tim-Berners Leen viiden tähden mallin mukaisesti asteikolla 0-5 tähteä:  

  • 0 tähteä: tiedoston lisenssi ei ole avoin tai tiedostomuoto ei ole dataa  
  • 1 tähti: tiedostolla on avoin lisenssi, mutta se ei ole koneluettavassa tiedostomuodossa  
  • 2 tähteä: tiedostolla on avoin lisenssi ja se on koneluettavassa muodossa, mutta vaatii tietyn sovelluksen käyttämistä  
  • 3 tähteä: tiedoston avaaminen ei vaadi tietyn sovelluksen käyttämistä  
  • 4 tähteä: tiedostoon voidaan linkittää  
  • 5 tähteä: tietoaineisto on linkitettyä dataa (RDF, SparQL)  

Tilastosta voi tarkastella organisaatiokohtaisesti tähtien jakaumaa, niiden keskiarvoa sekä sitä kuinka moni tietoaineisto on arvioimatta. Organisaatioiden alta on nähtävissä tarkemmin kunkin yksittäisen tietoaineiston saama tähtien määrä sekä syy tähtien määrälle.  

Tilastoon pääset tästä.