Osana yhteistyötä Lounaistiedon kanssa olemme Turun yliopistolla Ohjelmistotekniikan laboratoriossa osallistuneet Varsinais-Suomen retkeilydatan teknisen hallinnan tukeen jo vuosia. Olemme myös esimerkiksi toteuttanut (ja koodannut) kartta.virma.fi -palvelun yhdessä Lounaistiedon kanssa jo päättyneessä Digi-SAAPAS -projektissa, jossa toimme Virma-retkeilydatat mobiilipuhelimiin hyödynnettäväksi. Nyt uudessa projektissa Digitaalisen retkeilydatan yhteentoimivuuden kehittäminen (Digiretki) tätä retkeilydatan parantamista jatketaan, ja tavoitteena on, että esimerkiksi retkeilykohteiden tiedot saadaan siirrettyä kansalliseen luontoon.fi-matkailupalveluun kaikkien hyödynnettäväksi.
Turun yliopisto auttaa projektissa ratkaisemaan tämän siirron tekniset haasteet. Haasteita löytyykin useita. Esimerkiksi samoja reittejä voi olla molemmassa palvelussa eri reittien haaroilla tai geometrioilla. Mitä tällöin tehdään? Ja vaikka reitti olisi jo oikein, niin metadata voi puuttua suuntaan tai toiseen; kummassa on tällöin oikeaa tietoa?
Haasteiden ratkaisemiseksi olemme suunnitelleet tiedonsiirtoratkaisun, jossa Varsinais-Suomen Virma-järjestelmän retkeilykohdedata siirretään kansalliseen Luontoon.fi-palveluun Jyväskylän yliopiston ylläpitämän Lipas-järjestelmän kautta. Tämän mahdollistaminen on edellyttänyt sekä tietokantarakenteiden uudistamista että datan deduplikointityötä.
Tekniseltä puolelta datan deduplikoinnissa keskeistä on ollut löytää ne kohteet, jotka tarkoittivat samaa paikkaa, vaikka niiden geometriat tai nimitiedot poikkeaisivat. Ratkaisussa hyödynnetään QGIS-ohjelmistoa ja sen paikkatietoanalyysin työkaluja, joilla etsitään kohteiden päällekkäisyyksiä niiden geometrisen sijainnin perusteella. Tämän lisäksi kohteiden samankaltaisuutta arvioidaan myös niiden metatietojen avulla, kuten kohteen tyypin (esim. luontopolku tai uimaranta) ja nimitietojen perusteella. Näin tunnistetaan todennäköiset duplikaatit, jotka voidaan rajata pois tiedonsiirrosta.
Tietokantaa on uudistettu tukemaan paremmin sen yhteensopivuutta muiden järjestelmien, kuten Lipas– ja luontoon.fi-järjestelmien, kanssa. Tehdyt muutokset mahdollistavat esimerkiksi tietojen seurannan eri lähdejärjestelmien välillä, muutosten versionhallinnan sekä tietojen oikeellisuuden varmistamisen. Näin uudistettu tietomalli ja datan deduplikointi luo perustan virheettömälle tiedonsiirrolle.
Teknisiä ratkaisuja kehitetään tiiviissä yhteistyössä Jyväskylän yliopiston Lipas-tiimin kanssa. Työn aikana on kartoitettu järjestelmien tietomallien ja tyyppikategorioiden vastaavuuksia sekä on määritelty tiedonsiirron parhaat käytännöt.
Mielestämme yllättävän tärkeä apu haasteiden ratkomiselle on ollut kentällä käynti. Käytännön saavutettavuushaasteet avautuivat tällöin aivan uudella tavalla, kuin mitä tietokannan totuusarvot ja kentät voisivat ikinä tehdä. Esimerkiksi tarkka määritelmä saavutettavuudelle on standardisoitu ja tietojen puutteessa ei voi vain katsoa satelliitista ja reitin korkeusprofiilista saavutettavuutta, kuin mitä voisi nopeasti ajatella. Vaikka reitti ei näyttäisi korkealta datassa, niin osa reitistä voi esimerkiksi viettää sivusuuntaan pahasti tai olla kivikkoinen/kuoppainen. Ehkä jatkossa voidaan laittaa robotti ajamaan kokonaisen isonkin reitistön kaikki haarat, vaikka kerran parissa vuodessa, ja jos se ei pääse maaliin, niin reitti ei selvästikään ole saavutettava.
Vuonna 2026 työt jatkuvat vielä: vaikka tiedonsiirtoratkaisu on toteutettu, jokainen kohde ja reitti on vielä tarkistettava manuaalisesti. Samalla ratkaisu dokumentoidaan ja testataan, jotta siitä voi hyötyä myös muutkin alueet. Myös muuallakin Suomessa voi olla suuria retkeilydatakokonaisuuksia, jotka olisivat tärkeää saada osaksi kansallista Luontoon.fi-palvelua.
Keskeisenä lopputavoitteena on, että projektin jälkeen erityisesti Varsinais-Suomen retkeilydataa voidaan edelleen ylläpitää helposti (ja useamman toimijan kanssa), ja että datan laatu olisi parempi kuin koskaan ennen.
Kirjoittajat ja lisätietoja:
Projektitutkija Lauri Koivunen lamkoi(ät)utu.fi
Tutkimusavustaja Emmi Ylikoski eoylik(ät)utu.fi