Datamodel OSM

Beschikbare domein ontologiën voor OpenStreetMap (OSM)

Er zijn op verschillende momenten ontologiën en Linked Data implementaties beschikbaar gesteld voor Open Street Map. De belangrijkste voor nu zijn:

  • Sophox
  • LinkedGeoData
  • Geovectors

Implementatie 1: Sophox

URL Github: Klik

Voordelen:

  • Momenteel de versie die het meest actief wordt ge-promote op de OSM wiki
  • Lijkt één van de meest actuele implementaties

Nadelen:

  • SPARQL endpoint en bijbehorende services lijken offline/onbeheerd (zie onderstaand)

Belangrijkste keuzes in ontology:

  • Een pure OSM ontology, met dezelfde terminologie als gebruikt wordt in OSM (ways/nodes/relations met key-value pairs als tags)
  • Geen versimpelingen/aannames over de gerelateerde data
  • Sterke focus op integraal gebruik met wikidata
  • Als URI's worden de daadwerkelijke URI's van objecten en wiki (definities) gebruikt

Voorbeelden: OSM Wiki Sophox

Sophox Issues

Implementatie 2: LinkedGeoData

URL: Klik

Voordelen:

  • Uitgebreid ecosysteem beschikbaar rondom beschikbaar stellen OSM als LD
  • Ecosysteem wordt nog zo af en toe aangepast

Nadelen:

  • Lijkt qua data stale sinds November 2015
  • Lijkt zeer academisch van aard
  • Ontology lastig te herproduceren

Belangrijkste keuzes in ontology:

  • Lijkt versimpelingen toe te passen op de OSM data (bijv. object is een supermarket ipv heeft tag:building=supermarket)
  • Eigen URI strategie

Implementatie 3: GeoVectors

Github URL: Klik

Voordelen:

  • Sterke focus op machine learning mogelijkheden
  • Zeer recent in ontwikkeling

Nadelen:

  • Doel van deze corpus is niet beschikbaar stellen tbv integraal gebruik, maar focust zich op mogelijk maken ML applicaties

Belangrijkste keuzes in ontology:

  • Beperkte ontology met focus op ML
  • Eigen URI strategy

Additionële ontologiën

Om de omgezette data zoveel mogelijk aan te laten sluiten bij andere ontologiën, zullen wij tevens gebruik van de standaarden rondom datamodellering (DCAT voor metadata, SKOS voor definities en RDF/RDFS/OWL waar relevant voor het kennis/informatiemodel), maar ook op:

Conclusies

Gegeven de wens zo dicht mogelijk bij de OSM ontology te blijven lijkt de Sophox ontology het meest voor de hand liggende om snel hergebruik te kunnen maken en onszelf niet te verliezen in ingewikkelde transformatieslagen.

Hoe ziet dat eruit?

Maar hoe ziet dit data model er nu uit? Bekijk daarvoor de volgende visualisaties. De eerste plaat beschrijft de klassenstructuur en de URI-dereferencable objecten die hier uit volgen. Zo kan je met een URI als https://www.openstreetmap.org/way/290232358 direct terug naar de bron.

Hint: Klik ook eens op onderstaand plaatje voor een link naar een real-time visualisatie over de actieve objecten van ieder type.

Klassenstructuur

Objectstructuur

Ieder object is op zijn buurt opgebouwd met een aantal aspecten, zoals:

  • De geometrie van het OSM object
  • De bijbehorende tags in de vorm van key/value pairs

Objectstructuur

Zie bijvoorbeeld ook eens dit object.

Alle mogelijke keys

Alle mogelijke sleutels zijn in onderstaande query te vinden (Let op: We limiteren de resultaten hier op maximaal 10 stuks. Klik op "Try this query yourself" om deze limitatie weg te halen.

Alle mogelijke keys in OSM

Alle mogelijke values bij een tag

Voor ObjectProperties (zie boven) geldt dat we kunnen zien welke mogelijke waardes er aan een object hangen. De structuur is als volgt weergegeven:

Tag structuur

Voor iedere key zijn alle velden te queryen met onderstaande query.

Mismatch analyse over gebouwtypes in BRT en OSM

BRT bevat 79 verschillende gebouwtypes en OSM 321. Van die slechts 28 gebouwtypes komen ze overeen. De gebouwtypen die alleen in BRT staan en de gangbare gebouwtypen zijn te zien in de volgende tabellen. Hier worden als veelvoorkomende gebouwtypes de objecten beschouwd die exact dezelfde naam hebben.

Er zijn gebouwtypen in BRT en in OSM die meerdere categorieën samen bevatten of die op een andere manier zijn gestructureerd. Er is bijvoorbeeld een gebouwtype 'huizenblok' in BRT om huizen weer te geven, terwijl er in OSM meerdere categorieën zijn om huizen weer te geven, zoals 'apartments', 'house', 'residential', 'detached', 'semidetached house'. Een ander voorbeeld is het gebouwtype 'parkeerdak, parkeerdek, parkeergarage' in BRT, waar in OSM 3 gebouwtypes zijn die daarmee overeenkomen, 'garage', 'garages', 'parking'.

Gebouwtypes alleen in BRT
bezoekerscentrum kas, warenhuis luchtwachttoren pompstation ruïne verkeerstoren
boortoren kerncentrale, kernreactor manege postkantoor stadskantoor, hulpsecretarie waterradmolen
brandtoren kliniek, inrichting, sanatorium markant gebouw psychiatrisch ziekenhuis, psychiatrisch centrum stationsgebouw werf
elektriciteitscentrale klokkentoren observatorium radarpost tankstation windmolen: korenmolen
fort klooster, abdij overig radartoren telecommunicatietoren windmolen: watermolen
gemaal koeltoren overig religieus gebouw radiotoren, televisietoren tol zendtoren
gemeentehuis koepel parkeerdak, parkeerdek, parkeergarage recreatiecentrum transformatorstation
gevangenis kunstijsbaan peilmeetstation reddingboothuisje uitzichttoren
huizenblok lichttoren politiebureau remise veiling
Gebouwtypes gebruikelijk in BRT en OSM
bunker factory palace synagogue
castle fire station school tank
chapel hospital sheepfold tower
chimney hotel silo university
church lighthouse sports hall water tower
crematorium mosque stadium wind turbine
dock museum swimming pool windmill