Publikowanie danych przestrzennych jako Linked Open Data

Adam Iwaniak
Uniwersytet Przyrodniczy we Wrocławiu
Wydział Inżynierii Środowiska i Geodezji
Instytut Geodezji i Geoinformatyki
Polska

Iwona Kaczmarek
Uniwersytet Przyrodniczy we Wrocławiu
Wydział Inżynierii Środowiska i Geodezji
Instytut Geodezji i Geoinformatyki
Polska

Marek Strzelecki
Uniwersytet Przyrodniczy we Wrocławiu
Wydział Inżynierii Środowiska i Geodezji
Instytut Geodezji i Geoinformatyki
Polska

Jaromar Łukowicz
Uniwersytet Przyrodniczy we Wrocławiu
Wydział Inżynierii Środowiska i Geodezji
Instytut Geodezji i Geoinformatyki
Polska

Streszczenie

Udostępnianie informacji publicznej jest tematem wiodącym od wielu lat na całym świecie. Podejmowane na świecie inicjatywy, służące udostępnianiu danych rządowych, w tym danych przestrzennych, wskazują na istotne korzyści wynikające z otwarcia publicznych zasobów. Najlepszym dowodem jest fakt, iż coraz więcej krajów rozpoczyna działania zmierzające do „uwolnienia” swoich zasobów. Open Data, czy też w przypadku danych rządowych Open Government Data to inicjatywy mające na celu udostępnienie danych dla społeczeństwa w postaci, która umożliwia ich swobodne wykorzystanie bez ograniczeń. Oznacza to, że dane udostępniane są na otwartych licencjach i w otwartych standardach. Pozwala to potencjalnym użytkownikom na kreowanie nowych usług i produktów, np. w postaci użytecznych aplikacji czy serwisów bazujących na dostępnych danych przestrzennych, co jest motorem pobudzającym biznes i gospodarkę. W dobie serwisów społecznościowych, jest to również metoda na weryfikację danych urzędowych i podniesienie ich jakości. Istotą udostępniania danych Open Data jest nie tylko stosowanie otwartych standardów do ich publikacji. Niemniej ważną kwestią jest publikacja danych, które mogłyby być nie tylko czytelne dla człowieka (ang. human-readable), ale również przetwarzane przez maszyny (ang.machine-readable). Podejście to opiera się na wykorzystaniu technologii rozwijającego się Semantic Web i określane jest mianem Linked Data. Publikowanie danych otwartych w technologii Linked Data zyskało nazwę Linked Open Data (LOD).
Publikacja danych przestrzennych w chmurze LOD wiąże się ze spełnienie kilku warunków, uznanych jako ogólne wytyczne w zakresie tworzenia Linked Open Data. Po pierwsze, dane muszą zostać udostępnione na otwartej licencji, umożliwiającej ich dowolne wykorzystanie. Po drugie, dane muszą mieć formę ustrukturyzowaną. Po trzecie muszą być udostępniane w otwartych standardach, np. WKT zamiast Shapefile. Po czwarte, reprezentacja danych musi być możliwa w modelu RDF (ang. Resource Description Framework) oraz każdy obiekt musi mieć nadany unikalny identyfikator URI. Ostatnią kwestią jest łączenie udostępnianych zasobów z innymi poprzez tworzenie relacji pomiędzy nimi. Grupa technologii w zakresie Linked Open Data obejmuje standard do reprezentacji danych RDF, język zapytań SPARQL, globalny identyfikator URI oraz języki do modelowania ontologii OWL i RDFS. Wykorzystanie ww. technologii stanowi nowe podejście w zakresie reprezentacji, pozyskiwania, integracji i wyszukiwania danych przestrzennych. Pomimo, niedojrzałych jeszcze rozwiązań technicznych w tym zakresie, inicjatywa Linked Open Data wkracza wielkimi krokami w obszar geoinformacji. Podejmowane działania w wielu krajach na świecie, wskazują, że udostępnianie rządowych danych przestrzennych jako Open Data jest potrzebne i niewątpliwie przynosi korzyści ekonomiczne. Istnieje jednak silna potrzeba zapoczątkowania wielkiej zmiany, przede wszystkim w sposobie myślenia, co rzeczywistości może stanowić największą przeszkodę i trudność.

Słowa kluczowe:

linked open data; dane przestrzenne; RDF

Pełny tekst:

PDF

Bibliografia

Berners-Lee T., Hendler J., Lassila O., 2001: The Semantic Web. Scientific American: 29-37.

Berners-Lee T., 2006: Linked Data - Design Issues. Dostęp 28.02.2014r. http://www.w3.org/DesignIssues/LinkedData.html

Goczyła K., 2011: Ontologie w systemach informatycznych. Akademicka Oficyna Wydawnicza EXIT, Warszawa.

Komisja Europejska, 2011a: Komunikat prasowy, European Commission - IP/11/1524 12/12/2011, Agenda cyfrowa: Zamieniane danych rządowych w złoto. Dostęp 21.02.2014r. http://europa.eu/rapid/press-release_IP-11-1524_pl.htm?locale=en

Komisja Europejska, 2011b: Komunikat Komisji do Parlamentu Europejskiego, Rady, Europejskiego Komitetu Ekonomiczno-społecznego i Komitetu Regionów. Otwarte dane – siła napędowa innowacji, wzrostu gospodarczego oraz przejrzystego zarządzania, KOM(2011) 882 wersja ostateczna, Bruksela, 12.12.2011r. Dostęp 28.02.2014r.

http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=COM:2011:0882:FIN:PL:PDF

Open Geospatial Consortium, 2011: OGC GeoSPARQL – A Geographic Query Language for RDF Data. Dostęp 28.02.2014r. Dokument 11-052r3. http://www.opengeospatial.org/standards/requests/80

Salas J. M., Harth A., Norton B., Vilches L. M., León A. D., Goodwin J., Stadler C., Anand S., Harries D., 2012: Neo-Geo Vocabulary: Defining a shared RDF representation for GeoData. Public draft, NeoGeo. Dostęp 28.02.2014r. http://geovocab.org/doc/neogeo.html

W3C, 2006: W3C Semantic Web Interest Group: Basic Geo (WGS84 lat/long) Vocabulary, 2006. Dostęp 28.02.2014r.http://www.w3.org/2003/01/geo/

W3C, 2012: R2RML: RDB to RDF Mapping Language, R2RML: RDB to RDF Mapping Language. Dostęp 28.02.2014r. http://www.w3.org/TR/r2rml/

W3C, 2014: RDF 1.1 Concepts and Abstract Syntax, W3C Recommendation 25 February 2014. Dostęp 28.02.2014 r. http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/

Źródła internetowe

http://www.geonames.org/

http://linkedgeodata.org/

http://www.ogcnetwork.net/gml-sf

http://parliament.semwebcentral.org/

Linked Open Vocabularies (LOV). http://lov.okfn.org/dataset/lov/index.html

DBpedia. http://dbpedia.org/

Open Street Map. http://www.openstreetmap.org/