Help:RDF-Export
Auf Grundlage der semantischen Annotationen auf den Wikiseiten kann Semantic MediaWiki (SMW) maschinenlesbare Dokumente im OWL/RDF-Format erzeugen. Über die Spezialseite „RDF exportieren“ kann auf diese Dokumente zugegriffen werden. Zusätzlich ist ein Skript verfügbar, das diese Dokumente automatisch für den Export aller semantischen Daten generiert. Diese Hilfeseite erläutert wie Annotationen formal in der OWL Web Ontology Language interpretiert werden und wie eine geeignete RDF-Serialisierung erzeugt werden kann.
Nutzung der Exportfunktion
Nutzer können über die Spezialseite „RDF exportieren“ einfach auf die generierten RDF-Dokumente zurückgreifen, indem sie im dort vorhandenen Eingabefeld eine Liste der gewünschten Wikiseiten angeben. Der Export enthält eine OWL/RDF-Spezifikation sowie die verschiedenen beschreibenden Blöcke zu den exportierten Elementen (Seiten). Zusätzlich zu den angeforderten Wikiseiten wird der Export zudem Basisdeklarationen für alle weiteren Elemente, wie beispielsweise Instanzen, Attribute und Klassen enthalten. Es gibt zwei Einstellungen mit denen man den Umfang des Exports beeinflussen kann:
- Rekursiver Export
Jede Seite verfügt üblicherweise über Relationen zu verschiedenen anderen Seiten. Normalerweise werden diese anderen Seiten lediglich kurz deklariert. Auf diese Weise können Hilfsprogramme weitere RDF-Spezifikationen ermitteln, sofern dies gewünscht wird. Indem man den rekursiven Export aktiviert, werden auch die Informationen der verbundenen Seiten von vornherein mit exportiert. Da dieser auf alle im Export enthaltenen Seiten angewendet wird, kann diese Exportfunktion zu sehr umfangreichen Ergebnissen führen. - Rückverweise
Das RDF-Datenmodell stützt sich auf gerichtete Graphen. Beim Exportieren einer Seite werden üblicherweise nur die Aussagen exportiert in denen das zugehörige Element als Subjekt vorkommt. Dabei enthält der Export keine auf die exportierten Seiten verweisende Links. Dies schränkt RDF-Browser ein, da sie nicht auf alle Elemente zugreifen können, die über eine Verbindung verfügen, ohne dabei das vollständige RDF abrufen zu müssen. Aus diesem Grund kann man den Export von Rückverweisen aktivieren. Somit werden alle Seiten, die über Verbindungen zu einer der exportierten Seiten verfügen, ebenso exportiert.
Der Systemadministrator kann die Verfügbarkeit der beiden oben benannten Exportoptionen beschränken und auch die Verwendung der entsprechenden, weiter unten beschriebenen, GET-Parameter durch die Nutzer unterbinden. Der Grund hierfür ist, dass die benannten Optionen, besonders in Kombination angewendet, zum Export weiter Teile des Wikiinhalts als RDF führen. Bei großen Wikis kann dies zu unverhältnismäßigen Leistungsbeeinträchtigungen führen.
Zusätzlich zum Formular auf der Spezialseite „RDF exportieren“, kann man die RDF-Daten auch erhalten, indem man die passenden URLs direkt aufruft. Dies ist die Methode der Wahl, sofern man direkt auf die RDF-Spezifikationen verweisen möchte. In der Grundform wird dies durch Anhängen des Seitennamens (URL-kodiert) an die URL der Spezialseite „RDF exportieren“ gemacht. Um bspw. direkt auf die RDF-Spezifikationen der Seite „SMWCon Spring 2012“ auf semanticweb.org zu verweisen, gibt man folgenden Link an:
http://semanticweb.org/index.php/Special:ExportRDF/SMWCon_Spring_2012
Alternativ kann man den Seitennamen auch mit dem GET-Parameter „page“ innerhalb der URL aufrufen, wie z. B.
http://semanticweb.org/index.php?title=Special:ExportRDF&page=SMWCon_Spring_2012
- Zusätzliche GET-Parameter
Ergänzend zu den GET-Parametern „title“ und „page“ stellt die Spezialseite „RDF exportieren“ weitere Abfrageparameter bereit:
- Rekursiver Export kann aktiviert, bzw. deaktiviert werden, indem man den Parameter „recursive“ mit „0“ bzw. „1“ setzt
- Rückverweise können aktiviert, bzw. deaktiviert werden, indem man den Parameter „backlinks“ mit „0“ bzw. „1“ setzt
Beispiel:
http://semanticweb.org/index.php?title=Special:ExportRDF&page=SMWCon_Spring_2012&backlinks=1
Beide Parameter werden ignoriert, sofern sie vom Systemadministrator deaktiviert wurden. Sofern er keine Vorgaben gemacht hat, finden die wikiweiten Standardeinstellungen Anwendung ($smwgAllowRecursiveExport = false und $smwgExportBacklinks = true). Die Website semanticweb.org exportiert beispielsweise RDF-Daten stets mit Rückverweisen.
Der Standardinhaltstyp der über die Spezialseite „RDF exportieren“ exportierten Daten ist application/xml mit dem Zeichensatz charset=UTF-8 (content="text/html; charset=UTF-8"). Der ebenfalls mögliche Inhaltstyp application/rdf+xml kann festgelegt werden, indem man der URL den GET-Parameter „xmlmime=rdf“ hinzufügt. Dieser Inhaltstyp kann notwendig werden, sofern ein Dienstprogramm ihn benötigt, um die ausgegebenen Exportdaten verarbeiten zu können. Ein Beispiel für den Abruf einer Seite in diesem Format:
http://semanticweb.org/index.php?title=Special:ExportRDF&page=SMWCon_Spring_2012&backlinks=1&xmlmime=rdf
Alle Daten exportieren
Ergänzend zur Exportfunktion der Spezialseite „RDF exportieren“ ist auch ein Skript verfügbar, das den gleichzeitigen Export aller auf dem Wiki vorhanden semantischen Daten ermöglicht. Das Skript lautet SMW_dumpRDF.php und befindet sich im Verzeichnis „[Pfad zur Semantic-MediaWiki-Installation]/maintenance/“. In diesem Verzeichnis ist auch eine README-Datei mit zusätzlichen Informationen enthalten.
Das Skript SMW_dumpRDF.php kann entweder alle Daten exportieren oder darauf beschränkt werden lediglich bestimmte Elemente des RDF-Schemas, wie beispielsweise nur die Kategoriehierarchie oder nur die Attribute mitsamt deren zugehörigen Datentypen, zu exportieren. Die Einstellungsmöglichkeiten sind in der Datei selbst angegeben.
Um regelmäßig RDF-Exporte zu erstellen, kann cron genutzt werden, um die Ausführung des Skripts zu steuern. Für die Website semanticweb.org werden regelmäßig RDF-Exporte erstellt und unter http://semanticweb.org/RDF/ hinterlegt, wo man sie abrufen kann.
Einzelheiten zu den exportierten Daten
Wikiseiten auf Ontologieelemente kartieren
Der RDF-Export unterscheidet zwischen der Wikiseite an sich und dem auf ihr enthaltenen „Gegenstand“ … FEHLT
Es ist auch möglich ein externes Vokabular, wie beispielsweise „FOAF“ oder „Dublin Core“, in ein mit SMW betriebenes Wiki zu importieren und dessen Attribute und Relationen mit den vorhandenen zu verbinden. Auf diese Weise ist es möglich, die im Wiki vorhandenen Daten auf das externe Vokabular abgestimmt, z. B. als foaf:knows oder skos:concept, exportieren zu können.
Kategorien
Relationen der im Wiki vorhandenen Kategorien werden unter Verwendung von RDF/RDFS-Attributen exportiert.
- Die Zuweisung einer Kategorie zu einer regulären Seite wird als rdf:type exportiert und gibt dabei „ist eine Instanz einer Klasse“ an. Die Nutzung von Kategorien hat dabei eine gute Entsprechung zu „ist eine“ im Sinn von „Berlin ist eine Instanz der Klasse Städte“.
- Die Zuweisung einer Kategorie zu einer Kategorieseite wird als rdfs:subClassOf exportiert und gibt dabei „alle Instanzen einer Klasse sind auch die Instanz der jeweils anderen“ an. Die Nutzung von Kategorien hat dabei eine gute Entsprechung zu „ist eine“ im Sinn von „Hauptstädte sind Städte“.
Indes ist auch eine Vielzahl von Kategorisierungen in einem Wiki denkbar, die diesem semantischen Schema nicht folgen und somit ein Problem verursachen. Beispielsweise könnte sich die Seite Stadtentwicklung in der Kategorie Stadt befinden, beschreibt allerdings mitnichten eine Stadt. Auch könnte sich eine Kategorie Sehenswürdigkeiten in der Kategorie Stadt befinden und ebenso keine Seiten zu Städten an sich enthalten.
Einschränkungen bei OWL DL
… FEHLT
Property "Namespace" has a restricted application area and cannot be used as annotation property by a user.Property "Docinfo editor" (as page type) with input value "User:>Kghbln" contains invalid characters or is incomplete and therefore can cause unexpected results during a query or annotation process.