Linked Open Data

Linked Open Data (LOD) bezeichnet im World Wide Web frei verfügbare Daten, die per Uniform Resource Identifier (URI) identifiziert sind und darüber direkt per HTTP abgerufen werden können und ebenfalls per URI auf andere Daten verweisen. Idealerweise werden zur Kodierung und Verlinkung der Daten das Resource Description Framework (RDF) und darauf aufbauende Standards wie SPARQL und die Web Ontology Language (OWL) verwendet, so dass Linked Open Data gleichzeitig Teil des Semantic Web ist. Die miteinander verknüpften Daten ergeben ein weltweites Netz, das auch als „Linked [Open] Data Cloud“ oder „Giant Global Graph“ bezeichnet wird. Dort wo der Schwerpunkt weniger auf der freien Nutzbarkeit der Daten wie bei freien Inhalten liegt (Open Data), ist auch die Bezeichnung Linked Data üblich.

Idee offener vernetzter Daten

Offene vernetzte Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht und über das World Wide Web miteinander vernetzt sind. [1]

Grundkonzept

Während das WWW ein Netz aus Webseiten ist, soll mit Linked Open Data ein Netz aus Daten entstehen, die aus verschiedenen Quellen zusammen automatisch weiterverwendet werden können (Informationsintegration). Das Konzept von Linked Open Data geht im Wesentlichen auf Tim Berners Lee zurück, der auch Ende 2007 die Bezeichnung „Giant Global Graph“ (GGG) vorschlug. [2] Er prägte vier Regeln für Linked Data:

“1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those names.
3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)[3]
4. Include links to other URIs, so that they can discover more things.”

„1. Verwende zur Bezeichnung von Objekten URIs.
2. Verwende HTTP-URIs, so dass sich die Bezeichnungen nachschlagen lassen.
3. Stelle zweckdienliche Informationen bereit, wenn jemand eine URI nachschlägt (mittels der Standards RDF und SPARQL).
4. Zu diesen Informationen gehören insbesondere Links auf andere URIs, über die weitere Objekte entdeckt werden können.“

Tim Berners-Lee: Linked Data – Design Issues
Verknüpfung zwischen Linked Open Data Datenbeständen (September 2011)

Eine populäre Darstellung der Linked Open Data Cloud wurde im Oktober 2007 erstellt und seitdem mehrmals aktualisiert. [4] Sie enthält beispielsweise die Datenbestände von DBpedia und GeoNames.

Nachweise

  1. http://www.zeppelin-university.de/deutsch/lehrstuehle/ticc/TICC-101203-OpenGovernmentData-V1.pdf von Lucke/Geiger 2010, S. 4
  2. siehe Paul Miller: Who is afraid of the GGG?. In: Nodalities Blog vom 26. November 2007.
  3. Der Nachsatz „using the standards (RDF, SPARQL)“ wurde erst später eingeführt, siehe Version vom 15. November 2006.
  4. Richard Cyganiak und Anja Jentzsch: About the Linking Open Data dataset cloud. Oktober 2007 bis September 2011