BRT - OSM match
OpenStreetMap (OSM) data
OpenStreetMap (OSM) is een open gegevensbron met een open bewerkbare geografische database van de wereld.
Polygonen en punten in OSM
Gegevens in OpenStreetMap worden opgeslagen in een eenvoudige gegevensstructuur die bestaat uit nodes, ways en relations. Een "node" vertegenwoordigt een enkel punt op de kaart en draagt zijn geografische locatie en een uniek identificatienummer. Een "way" vertegenwoordigt een polylijn of gesloten polygoon op de kaart. Ways slaan hun eigen locatie niet op, maar ze hebben een geordende lijst met node-ID's. Een "relation" vertegenwoordigt ook een polygoon, maar wordt gebruikt om uit te leggen hoe andere elementen samenwerken.
Nodes worden dus voor twee doeleinden gebruikt. Ten eerste kunnen ze puntachtige entiteiten aanduiden, zoals interessante punten. In dit geval bevat de node wat aanvullende informatie over wat het vertegenwoordigt. Ten tweede kunnen ze gewoon als onderdeel van een way worden geplaatst om hun vorm te coderen. Een node kan beide doelen tegelijkertijd hebben. Ways en relations worden gebruikt om niet-puntachtige entiteiten weer te geven, namelijk polylijnen en polygonen.
Ways of relations (polygonen) en nodes (punten) kunnen verschillende soorten objecten vertegenwoordigen. De volgende tabellen tonen de punten en polygonen van OSM in Nederland van het type building, amenity, leisure of shop, samen met hun brand. Bovendien bevatten polygonen van OSM links naar andere open datasets zoals de BAG en wikidata.
Datamodel OSM
Beschikbare domein ontologiën voor OpenStreetMap (OSM)
Er zijn op verschillende momenten ontologiën en Linked Data implementaties beschikbaar gesteld voor Open Street Map. De belangrijkste voor nu zijn:
- Sophox
- LinkedGeoData
- Geovectors
Implementatie 1: Sophox
URL Github: Klik
Voordelen:
- Momenteel de versie die het meest actief wordt ge-promote op de OSM wiki
- Lijkt één van de meest actuele implementaties
Nadelen:
- SPARQL endpoint en bijbehorende services lijken offline/onbeheerd (zie onderstaand)
Belangrijkste keuzes in ontology:
- Een pure OSM ontology, met dezelfde terminologie als gebruikt wordt in OSM (ways/nodes/relations met key-value pairs als tags)
- Geen versimpelingen/aannames over de gerelateerde data
- Sterke focus op integraal gebruik met wikidata
- Als URI's worden de daadwerkelijke URI's van objecten en wiki (definities) gebruikt
Voorbeelden: OSM Wiki Sophox
Implementatie 2: LinkedGeoData
URL: Klik
Voordelen:
- Uitgebreid ecosysteem beschikbaar rondom beschikbaar stellen OSM als LD
- Ecosysteem wordt nog zo af en toe aangepast
Nadelen:
- Lijkt qua data stale sinds November 2015
- Lijkt zeer academisch van aard
- Ontology lastig te herproduceren
Belangrijkste keuzes in ontology:
- Lijkt versimpelingen toe te passen op de OSM data (bijv. object is een supermarket ipv heeft tag:building=supermarket)
- Eigen URI strategie
Implementatie 3: GeoVectors
Github URL: Klik
Voordelen:
- Sterke focus op machine learning mogelijkheden
- Zeer recent in ontwikkeling
Nadelen:
- Doel van deze corpus is niet beschikbaar stellen tbv integraal gebruik, maar focust zich op mogelijk maken ML applicaties
Belangrijkste keuzes in ontology:
- Beperkte ontology met focus op ML
- Eigen URI strategy
Additionële ontologiën
Om de omgezette data zoveel mogelijk aan te laten sluiten bij andere ontologiën, zullen wij tevens gebruik van de standaarden rondom datamodellering (DCAT voor metadata, SKOS voor definities en RDF/RDFS/OWL waar relevant voor het kennis/informatiemodel), maar ook op:
Conclusies
Gegeven de wens zo dicht mogelijk bij de OSM ontology te blijven lijkt de Sophox ontology het meest voor de hand liggende om snel hergebruik te kunnen maken en onszelf niet te verliezen in ingewikkelde transformatieslagen.