Kohti linkitettyä avointa paikkatietoa
Linkitetystä tiedosta (linked data) on puhuttu kohta vuosikymmen. Monien odotuksena oli, että linkitetty tieto yleistyisi ja leviäisi yhtä nopeasti kuin kaiken maailman Web-sivustot 1990-luvulla. Linkitetyssä tiedossa on lähtökohtaisesti kyse huomattavasti vaikeammasta asiasta. Todennäköisesti myös linkitetyn tiedon hyödyt eivät ole kaikille toimijoille itsestään selvyyttä. Yksilöivät tunnisteet ovat linkitetyn tiedon peruspilareita.
Tim Bernes-Lee on määritellyt linkitetyn tiedosta neljä pääsääntöä:
- Käytä URI-tunnisteita asioiden nimeämiseksi.
- Käytä http URI-tunnisteita, jotta ihmiset voivat tarkastella näitä nimiä.
- Kun joku tarkastelee URI-tunnistetta, tarjoa hyödyllistä tietoa käyttäen standardeja (RDF, SPARQL).
- Tarjoa linkkejä muihin URI-tunnisteisiin, jolloin voi löytää lisää asioita.
Ilmeisesti linkitetyn tiedon tutkimuksen ja muun hype:n johdatuksena EU:n komission on kirjannut paikkatiedon yksilöivien tunnisteiden käytöstä Inspire-toimeenpanosääntöihin seuraavaa:
Inspire-direktiivi (2007/2/EY) edellyttää soveltamisalallaan yksilöiviä ulkoisia kohdetunnisteita, jolla tarkoitetaan alkuperäisen tiedon tuottajan julkaisemaa yksilöivää tietojärjestelmäriippumatonta kohdetunnistetta. Näiden tunnisteiden avulla ulkopuoliset sovellukset voivat viitata paikkatietokohteeseen.
Helposti sanottu Brysselissä. Vaikeampi toteuttaa jäsenmaissa. Suomessa on totuttu noudattamaan lainsäädäntöä sekä perinteistä härmäläistä että yleiseurooppalaista. Joten pari vuotta sitten nousi esiin kansallisen paikkatietojen yksilöivien tunnisteiden suosituksen tuottaminen. Hikeä ja kyyneliä säästämättä JHS-suositushanke on saanut tuotettua suositusehdotuksen palautekierrokselle.
Miksi pitäisi kiinnostua yksilöivistä tunnisteista?
Jokaisen suomalaisen viranomaisen, jonka vastuulla on paikkatietojen ylläpito, tulisi ehdottomasti tutustua suositusehdotukseen. Yksilöivien tunnisteiden avulla voidaan siirtyä aivan uudenlaiseen (paikka)tietojen hyödyntämiseen. Loputon tietoaineistojen kopiointi, vanhentuneiden tietoaineistojen käyttö päätöksenteossa ja monet muut ongelmat voidaan (ainakin teoreettisesti) ratkaista avoimella linkitetyllä tiedolla.
Paikkatiedon yksilöivät tunnisteiden toteuttaminen on lakisääteinen tehtävä Inspire-viranomaisille. Nyt palautekierroksella oleva JHS-suositusehdotus suosittelee kansallisen toteutuksen. Suosituksia voi käyttää myös muiden, ei-Inspire-aineistojen yksilöivien tunnisteiden muodostamiseen.
Inspire-säädökset koskevat kaikkia EU:n jäsenmaita. Yksilöivien tunnisteiden toteuttaminen on merkittävä liiketoimintapotentiaali. Tämä on sitä paikkatietoinfrastruktuurin rakentamista, johon useat suomalaiset paikkatietoalan palveluyritykset ovat keskittyneet. Mutta huomattavasti suuremmat mahdollisuudet liittyvät avoimen linkitetyn tiedon hyödyntämiseen eri toimialueilla. Mielikuvitus on rajoitteena.
Uudenlaisen paikkatietoinfrastruktuurin rakentaminen on alkanut. Valitettavasti tulokset eivät tule muutamien vuosineljännesten aikana. Nyt ruvetaan rakentamaan tietoinfrastuktuuria, jonka laajamittainen hyödyntäminen tapahtuu 2020-luvulla. Aika on siitä hyvä luonnonvara, että sitä riittää kalenterissa määrättömästi. Vuoteen 2020 on aikaa vain 20 vuosineljännestä, nyt on aika aloittaa. Ainakin suunnittelu.
Tarvitsetko lisätietoja?
Dokumenttien lukeminen on puuduttavaa. Joten helpointa on katsoa muutama 3 minuutin video:
Ordnance Survey: Why Linked Data?
Europeana: Linked Open Data – What is it?
Jos kantti kestää, niin JHS-suositusehdotuksen palautekierroksen aloitusseminaari on myös taltioitu jälkipolville.
Posted on 12.12.2014, in Yleistä and tagged jhs, linked data, linkitetty tieto. Bookmark the permalink. 2 kommenttia.
Ennustettavassa tulevaisuudessa kohtalonkysymys useille paikkatiedon tuottajille on: Onko datasi linkitettyä? Seurausta digitalisaatiosta ja siksikin, että ”paikkatieto ei yksin ole mitään” kuten viimeaikaisissa sessioissa on toistuvasti ääneen sanottu.
Paikkatiedon yksilöivät tunnisteet kovaan käyttöön
Referenssiä reaalimaailman kohteiden yksilöiviin tunnisteisiin ja ajanmukaiseen teknologiakehitykseen pohjautuvasta, peruspaikkatiedon kansallisesta kehittämisestä edustaa esim. Irlannin karttalaitoksen (Ordnance Survey Ireland) PRIME2-kehittämisstrategia joka on jo toimeenpanovaiheessa:
http://www.osi.ie/About-Us/Quality-and-Standards/Standards-based-Prime2.aspx,
PRIME2 Data Concepts and Data Model Overview: http://www.osi.ie/OSI/media/OSI/Prime2_Docs/Prime2.pdf
“This breakthrough in spatial data management technology is a step change in the way that National Mapping Authorities can automate their data production and maintenance processes. This innovative approach will provide OSi with greater flexibility and scalability for the future growth of our organisation, enhancing services, data quality and value to the State.”
Colin Bray, CEO, Ordnance Survey Ireland
“The data structure facilitates spatial analysis, linkage of geographic objects to external data and the creation of products/services via connected Digital Cartographic Models (DCMs), where selective generalisation can take place without the need to create or store additional geographic datasets (a capture once, use many times philosophy). “
– – – –
Omat kommenttini liittyen JHS-suositusluonnokseen Paikkatiedon yksilöivät tunnisteet, jossa esitetään hyvin samansuuntaista URI-käytäntöä (Linked data):
Paikkatiedon yksilöivät tunnisteet kovaan käyttöön
I Yhteensopivuus ja yhteiskäyttö
Paikkatietoalaan kohdistuvat keskeiset muutosajurit (säästö- ja tehostusvaatimukset, digitalisaatio, Kansallinen palveluväylä, 3D- ja sensoridata) edellyttävät laajaa yhteentoimivuutta sen sijaan, että paikkatiedot muodostaisivat entistä selkeämmin muusta informaatioinfrastruktuurista ja digitalisaatiosta eriytyvän ”siilon”. Miten tätä näköalaa voidaan välttää? Miten paikkatietoklusterin ulkopuoliset yhteydet järjestetään laajempaan käyttöön? Miten palveluja voidaan kehittää käyttäjäystävälliseksi ja käyttötarkoitusta palveleviksi, ja ilman että eri aineistoja tarvitsee yhdistellä ja muokata erikseen?
Yhteentoimivuuden ja yhteiskäytön parantamisen keskeinen elementti ovat koneluettavat yksilöivät tunnisteet (ID- tai URI-tunnisteet), jotka on todettu tulevaisuuden MTJ:n yhteistuottamisen sekä yhteensopivuuden edellytykseksi ja mahdollistajaksi. Vähemmälle huomiolle jää se, että yksilöivät tunnisteet mahdollistavat linkitetyn tiedon myös tiedon yhteiskäytössä ja jakelussa pelkästään tietokanta-pohjaisuuteen suuntaavaan tiedonhallinnan rinnalle. Tällä on oleellista merkitystä siksi, että varsinkin laajojen tietomassojen sisältämät tietokannat eivät näytä tulevaisuudessakaan olevan kovin ketteriä tai muutossietoisia. Tarvitaan ehkä myös analyysiä siitä mihin tietojoukkoihin kohdistuvat palvelutarpeet voidaan hoitaa linkitysten avulla.
Kansallisessa paikkatietoinfrastruktuurissa tarvitaan linkitetyn tiedon hallintakomponenttia, jonka merkitystä merkitystä korostaa myös se, että Inspire-toimeenpanosäännöt edellyttävät yksilöiviä tunnisteita suurelle joukolle peruspaikkatietoja, jotka suppeimmillaankin on implementoitava organisaatioiden olemassa oleviin tietokantoihin viimeistään n. vuoteen 2020.
Palautetieto, sähköinen asiointi:
ID-hallinnalle merkittäviä ulkoisia tehtäviä on esimerkiksi palautetiedon kohdentaminen paikkatietokohteisiin tai alkuperäiseen tietolähteeseen URI-tunnisteen rakenteen mukaan, mikä mahdollistaa ja edistää mm. myös tiedon keruun joukkoistamista (crowdsourcing) vaikkapa mobiilisovellusten avulla, taikka kohteiden yksilöinti sähköisessä asioinnissa.
II Elinkaaritietojen merkitys
Elinkaaritietojen tarkempi erittely kuin muutosajankohtiin on olennaista muutoshallinnassa. Yksilöivien tunnisteiden versioinnilla voidaan eritellä tiedon loppukäyttäjille merkitykselliset muutostapahtumalajit, mikä digitalisaation edetessä korostuu. Versiointikriteerit ilmaisevat mihin käyttäjätarpeisiin tuotantojär-jestelmät pystyvät vastaamaan herätetietona toimintaprosesseille tai analyysikäytössä. Versioinnilla eritellään myös tiedon korjaus, jossa ei ole kyse reaalimaailman kohteen muutoksista.
III Linked Data-infrastruktuuri
Yksilöiviä tunnisteita voidaan käyttää ja hyödyntää paikkatietokohteiden lisäksi niiden kuvaamille reaalimaailman kohteille ja käsitteille. Tietomallien harmonisointia ja yhteentoimivuutta voidaan tehostaa, kun paikkatietokohteet mallinnetaan myös käsitetasolla antamalla kohdeluokkien edustamille käsitteille yksilöivät URI-tunnisteet, ja niille viittaus kansalliseen asiasanasto- ja ontologiapalvelun (Finto) käsitteisiin, joka tällä tasolla harmonisoi ja verkottaa tietomalleja kansallisesti. Tämän mekanismin avulla harmonisointia voidaan koordinoida ja välttää päällekkäistä työtä, sekä edelleen päällekkäistä tiedon tuottamista, ja ennen kaikkea se mahdollistaa paikkatiedon linkittämistä muihin tietolajeihin.
Käsite-ID:n avulla voidaan harvestoida ja koostaa samaa käsitettä koskevaa tietoa. Käsite-ID:n avulla paikkatiedot liitetään näin yleiseen kansalliseen tiedonhaun väylään (Finto.fi, Yleinen suomalainen ontologia-YSO) parantamaan paikkatiedon liittämistä eri toimialojen tarpeisiin ja muihin tietolajeihin.
Reaalimaailman kohteiden yksilöivien tunnisteiden avulla voidaan linkittää ja harvestoida eri tiedontuottajien samaa kohdetta koskevaa tietoa, jolla voidaan rikastaa sovelluksia tai tietopalvelua.
Ajantasainen RDF-tietokanta tiedon yhteiskäyttöön ja jakeluun:
JHS-suositusluonnoksen Paikkatietojen yksilöivät tunnisteet URI-kaavan /doc/-polkukomponentin id-linkitykset ovat RDF-tietokannassa. URI-viittaukset ohjataan tähän tietokantaan, josta sovellukset voivat koneluettavasti hakea kyseisen tiedon tuottajan paikkatietokohteen halutun esitysmuodon (GML, JSON jne.). Jos paikkatietokohteelle luodaan uusi versio, se voidaan päivittää samalla (esim. html update-file -muodossa) RDF-tietokantaan, joka on siten aina ajan tasalla. Myös aikaisemmat versiot säilyvät RDF-tietokannassa.
RDF-tietokantaan suositellaan vietäväksi myös paikkatietokohdetta vastaavan reaalimaailman kohteen /id/-URI ja sen edustaman käsitteen /def/-URI, ja tarpeen mukaan URI-viitaukset muihin paikkatietokohteisiin, jotka kuvaavat samaa reaalimaailman kohdetta. Viittausten avulla paikkatietokohteeseen liittyvää tietoa voidaan hakea ja koostaa koneellisesti muista tietolähteistä.
Tiedon tuottajan URI-palvelu
URI-kaavan /doc/-polkukomponentin id-linkitykset sisältävä RDF-tietokanta on tiedon tuottajan URI-palvelussa, JHS-suositusluonnoksen Paikkatietojen yksilöivät tunnisteet liitteessä 2 kuvataan esimerkki suosituksessa määriteltyjen vastauskäytänteiden mukaisen vastauksen antavan tiedontuottajan URI-palvelun teknisestä toteutuksesta. Kaikki paikkatiedot.fi-alkuiset URI-viittaukset uudelleenohjataan RDF-tietokantoihin.
Suositusluonnoksen mukaan tiedon tuottaja perustaessaan uuden paikkatietokohteen tekee samalla em. linkitykset paikkatietokohteen /doc/-polkukomponenttiin. RDF-skeema ja rajapintojen esittäminen RDF-syntaksissa on ohjeistettu JHS-suositusluonnoksen liitteessä 2.
IV Tieto- ja palvelutuotteet ja niiden jakelu
Linkitetty tietorakenne edistää alueellisia analyysejä sekä tuotteiden ja palvelujen kehittämistä.
PS. Suositusluonnoksen palautekierros päättyi juuri tuloksena palautetta kiitettävästi 12 organisaatiolta (kuntia ja valtion organisaatioita ja HY/Kansalliskirjasto).
PPS. Valitettavasti en onnistunut liittämään paria havainnollistavaa kuvaa yo. tekstiin tässä välineessä.