Artikel-Archiv

2/2014
Dokumentation + Kommunikation Advertorial

Linked Data – das Ende des Dokuments?

von Andreas Blumauer

Dokumente waren bisher stets das zentrale Informationsträger- und Präsentationsmedium zur Wissensvermittlung. Doch dieses rein sequentielle, ausschließlich intellektuell interpretierbare Format reicht in einer zunehmend vernetzten und komplexer werdenden Welt offensichtlich nicht mehr aus.

Dokumente waren bisher stets das zentrale Informationsträger- und Präsentationsmedium zur Wissensvermittlung. Doch dieses rein sequentielle, ausschließlich intellektuell interpretierbare Format reicht in einer zunehmend vernetzten und komplexer werdenden Welt offensichtlich nicht mehr aus.

Semantische Technologien und Semantic Web werden oft in einem Atemzug genannt, obwohl wesentliche Unterschiede bestehen: Geht es in beiden Fällen darum, Informationen und ihre Bedeutung verarbeiten zu können, so dreht sich im Semantic Web alles um die Frage, wie Entitäten (Produkte, Organisationen, Orte, etc.) sinnvoll und auf Standards basierend miteinander verknüpft werden können.

Zusätzlich zum allgemein bekannten ‚Web of Documents‘, dessen wesentliches Merkmal Hypertext ist, entwickelt sich also ein ‚Web of Data‘ (Semantic Web), in dem nicht mehr das Dokument im Mittelpunkt steht, sondern vielmehr Entitäten unterschiedlicher Kategorien, ihre verschiedenen Bezeichnungen und ihre Relationen zueinander.

Der Grundstein für das Web of Data wurde durch die Linked-Data-Initiative des W3C gelegt, das ein einfaches Framework, bestehend aus vier Regeln, entwickelt hat, um damit eine weltweite, verteilte Datenbank, eben das Web of Data realisieren zu können. Unter Berücksichtigung dieser Prinzipien wurde daraufhin als Nukleus für ein Web of Data die DBpedia veröffentlicht, die inzwischen in 119 Sprachen verfügbar ist. Als ‚semantische Schwester‘ der Wikipedia bildet sie den Kern der stetig wachsenden ‚Linked Open Data Cloud‘ (LOD Cloud), einem gigantischen Wissensgraphen, der nun allmählich in Organisationen eindringt und dort um unternehmensspezifisches Wissen erweitert wird.

Die BBC als europäisches Leitunternehmen hat 2008 mit BBC Music das erste kommerzielle Projekt vorgestellt, das unter Verwendung von Linked Data aufzeigt, welche neuartigen Verwertungsstrategien für Medienunternehmen mit Hilfe des Semantic Web möglich werden. Es folgten zahlreiche weitere Medienunternehmen wie Wolters Kluwer oder Elsevier, aber auch Betriebe aus der Automobilindustrie, der Pharmaindustrie oder der öffentlichen Verwaltung, die Linked-Data-Technologien intern und extern für verschiedene Aufgaben des Informationsmanagements einsetzen. Das Semantic Web hat also begonnen, Einzug in diverse Branchen zu halten.

Es können drei grundlegende Szenarien für den unternehmerischen Einsatz von Linked Data unterschieden werden:

  1. Daten in die Linked Data Cloud publizieren: Das Unternehmen publiziert eigene Daten und Inhalte in die Linked Data Cloud und erschließt sich damit neue Distributionswege für digitale Assets.
  2. 2. Linked Data als Datenintegrationsprinzip anwenden: Das Unternehmen verwendet die Linked-Data-Prinzipien und Semantic-Web-Technologien intern, um Datenintegration und Mashups (z.B. für ein Wissensportal) zu realisieren bzw. neue Möglichkeiten einer semantischen Suche zu erschließen.
  3. 3. Daten aus der Linked Data Cloud einbinden: Das Unternehmen konsumiert Daten aus der Linked Data Cloud, um damit z.B. interne Datenbanken oder Inhalte anzureichern.

Interne und externe Inhalte sinnvoll und kostenschonend zu verknüpfen, kann nur in einem interoperablen Framework wie dem Semantic Web gelingen. Der Einsatz von Semantic-Web-Technologien im Unternehmen kann daher aus zwei Perspektiven betrachtet werden: aus Sicht der Content-Verwertung und aus Sicht der Prozessunterstützung.

Im Rahmen der Content-Verwertung dienen Semantic-Web-Standards und Methoden der einheitlichen Strukturierung und Anreicherung von Datenbeständen. Sie ermöglichen es, ähnliche oder verwandte Objekte zueinander in Beziehung zu setzen und besser auffindbar zu machen. Bei der Prozessunterstützung nutzen unterschiedliche Services die wohlstrukturierte Datenbasis, um einerseits bestehende Dienste zu verbessern oder neue hervorzubringen, was häufig unter dem Thema „betriebliches Wissensmanagement" subsumiert wird. Im Zentrum der aktuellen Entwicklung stehen zwar noch immer Such- und Empfehlungsdienste, die noch stark an der klassischen Dokumentphilosophie haften, jedoch findet allmählich eine Transformation hin zum ‚Web of Data‘ auch innerhalb von Unternehmensgrenzen statt.


Diesen Artikel als PDF herunterladen

Unsere Empfehlungen