Was muss ich lernen für Linked Open Data?

Um Linked Open Data zu verstehen, müssen wir uns ein paar Konzepte anschauen und verstehen. Für viele sind diese neu, für andere können diese bekannt vorkommen. Wenn Sie sich schon ein mal Metadaten angeschaut haben, dann sind Sie schon mit vielen Konzepten von Linked Open Data in Berührung gekommen.

Metadaten werden seit ein paar Jahren als RDF Dateien veröffentlicht und vielfach werden auch URIs verwendet. Dies sind die beiden wichtigsten Bausteine für Linked Open Data. Aber was genau ist Linked Open Data? Linked Open Data zielt darauf ab, Daten im Internet miteinander zu verknüpfen, um sie leichter zugänglich und nutzbar zu machen. Und mit der Verknüpfung einen Mehrwert zu schaffen. LOD ermöglicht es, Daten aus verschiedenen Quellen zusammenzuführen und zu integrieren, um neue Erkenntnisse zu gewinnen. Mit Hilfe von Tools wie SPARQL können diese Verknüpfungen abgefragt und „verfolgt“ werden um neue Informationen zu finden und zusammenzufügen.

Prinzipien von Linked Open Data

Die Prinzipen von Linked Data sind die Verwendung von URI als Identifikatioren und die Veröffentlichung von RDF-Daten über HTTP, um Verknüpfungen zwischen Ressourcen herzustellen. Ein weiteres wichtiges Konzept sind Linked Data Vocabularies, eine Liste von Properties und Classes die bereits standardisiert sind und von vielen Datenquellen verwendet werden, wie beispielsweise das Dublin Core Vocabulary, das viele Metadatenfelder für Bücher und andere Publikationen definiert.

Welche Begriffe muss ich verstehen und lernen?

Um LOD zu verstehen sollten Sie die folgenden Begriffe und deren Verwendung kennen:

  • RDF & Triples: Subjekt, Prädikat, Objekt
  • URI

RDF

Fangen wir an mit RDF(Resource Description Framework) welches das Grundgerüst von Linked Data ist. Es ist ein Datenmodell, das verwendet wird, um Informationen über Ressourcen im Web zu beschreiben und zu veröffentlichen. RDF stellt Informationen als sogenannte Triples dar, die aus drei Teilen bestehen: einem Subjekt, einem Prädikat und einem Objekt. Das Subjekt eines Triples ist die Ressource, über die die Informationen angegeben werden. Das Prädikat beschreibt die Art der Information, die im Objekt angegeben wird. Das Objekt ist der Wert, der mit dem Prädikat verknüpft ist.

URI

URI (Uniform Resource Identifier) sind globale Identifikatoren, die verwendet werden, um Ressourcen im Web zu identifizieren und zu referenzieren. URI werden zwar auch häufig als URLs (Uniform Resource Locators) bezeichnet, aber URLs sind eine spezielle Form von URIs, die den Ort einer Ressource im Web angeben.

Eine ausführlichere Beschreibung mit Beispielen von RDF und URI und dann auch SPARQL folgt in einem weiteren Post.