Help:Schlussfolgerung
Die semantische Suche kann dazu genutzt werden, Seiten auf Basis der Informationen zu ermitteln, die die Nutzer des Wikis auf ihr hinterlegt haben. Dies vereinfacht eine Vielzahl von Aufgaben, erfordert dennoch zunächst die manuelle Eingabe der Informationen. In manchen Fällen sollte das Wiki dadurch intelligenter genutzt werden können, indem man die Informationen auf Basis der vorhandenen Inhalte ableitet, ohne dass diese zuvor explizit erfasst wurden. Semantic MediaWiki (SMW) kann in einigen Fällen diese Informationen automatisch schlussfolgern. Dies wird auf dieser Seite erläutert.
Unterkategorien
MediaWiki unterstützt Kategoriehierarchien, die dabei helfen, die auf den einzelnen Seiten getroffenen Aussagen durch zuordnen entsprechender Kategorien zu vereinfachen. Ein Wiki könnte beispielsweise die Kategorien „Person“, „Frau“ und „Mann“ enthalten. Für einen Menschen ist es hierbei offensichtlich, dass die Kategorie „Frau“ ebenso zur Kategorie „Person“ gehört. Die Kategorie „Frau“ ist dabei die spezifischere Kategorie. Auf vielen Wiki gilt die Regel, dass auf einer Seite jeweils nur die spezifischste zutreffende Kategorie angegeben werden soll. Ansonsten würde eine Seite häufig in eine Vielzahl von Kategorien eingeordnet, die in vielerlei Hinsicht kaum handhabbar sind. Um angeben zu können, dass eine Kategorie spezifischer als eine andere ist, werden Kategoriehierarchien benötigt. Ein Nutzer kann angeben, dass eine Kategorie spezifischer ist als eine andere, indem er der spezifischeren Kategorie die übergeordnete Kategorie hinzufügt: Dies wird erreicht, indem man auf der Seite „Kategorie:Frau“, [[Kategorie:Person]]
einfügt. Weitere Informationen zur Kategorisierung befinden sich z. B. in der deutschsprachigen Wikipedia.
Standardmäßig nutzt SMW bei semantischen Abfragen die Informationen, die auf Unterkategorien zugeordneten Seiten hinterlegt wurden. Sofern man Seiten in einer Kategorie abfragt, werden auch alle Seiten abgefragt, die einer ihrer Unterkategorien zugeordnet wurden. Beim obig benannten Beispiel würden bei einer Abfrage der
[[Kategorie:Person]]
auch die Seiten in den Kategorien „Frau“ sowie „Mann“ abgefragt. Die tatsächlich im Hintergrund ausgeführte Abfrage lautete daher
[[Kategorie:Person]] OR [[Kategorie:Frau]] OR [[Kategorie:Mann]]
Im Fall einer tieferen Kategoriehierarchie würden auch die Unterkategorien der Unterkategorien abgefragt. Sofern beispielsweise die Kategorie Frau noch die Unterkategorie Mutter enthält, würde auch diese Kategorie abgefragt:
[[Kategorie:Person]] OR [[Kategorie:Frau]] OR [[Kategorie:Mutter]] OR [[Kategorie:Mann]]
Der Mechanismus von SMW zum Schlussfolgern über Unterkategorien kann vom Websiteadministrator eingeschränkt oder deaktiviert werden. Siehe hierzu die Parameter $smwgUseCategoryHierarchy, $smwgCategoriesAsInstances und $smwgQSubcategoryDepth. Im Regelfall wird nur die Maximaltiefe von zehn Hierarchieebenen bei der Nutzung von Kategoriehierarchien berücksichtigt ($smwgQSubcategoryDepth), so dass möglicherweise nicht alle denkbaren Abfrageergebnisse angezeigt werden, sofern im Wiki sehr tiefe Hierarchieketten vorhanden sind. Abhilfe könnte zum einen die Änderung der zu berücksichtigenden Hierarchieebenen schaffen und zum anderen die oben beschriebene manuelle Erfassung der Abfrage mit Hilfe des Operators OR
. Im letztgenannten Fall werden Änderungen der Kategoriehierarchie allerdings nicht automatisch berücksichtigt.
Es gibt auch Fälle in denen Kategorien sowie Kategoriehierarchien in einer Form eingesetzt werden, in der sie für das vorherig beschriebene Schlussfolgern nicht geeignet sind. Beispielsweise nutzt die Wikipedia die Kategorie Städte nicht nur zum Zusammenfassen aller Seiten zu Städten, sondern auch für Seiten, die mit Städten in irgendeiner Form in Zusammenhang stehen. Dies hier beschriebene Problem ist dabei kein Problem von Kategorien und Kategoriehierarchien an sich: Die semantische Abfrage [[Kategorie:Städte]]
wird weiterhin alle Seiten ausgeben, die mit diesem Thema verknüpft sind, indes nicht nur die Seiten zu Städten an sich. Man kann daher argumentieren, dass der Name der Kategorie uneindeutig und somit verwirrend ist. Letztlich ist dies ein Problem der Kategorie- und Kategoriehierarchieorganistion des Wikis an sich. Sofern ein Wiki über keine eindeutige Kategorie verfügt, in der ausschließlich Seiten zu Städten gesammelt werden, wird keine semantische Abfrage all Städte auf direktem Weg ausgeben können.
Ein großes Problem für das Schlussfolgern stellt das dar, was man gemeinhin „Semantische Drift“ nennt. Sie tritt dann auf, wenn der Zweck einer Kategorie nicht genau definiert ist, also nicht dokumentiert wurde, welche Seiten in ihr gesammelt werden sollten. Unterschiedliche Nutzer können daher unterschiedliche Interpretationen bezüglich der Bedeutung der Kategorie haben. Dies hat indes einen direkten Einfluss auf die Zuordnung von Unterkategorien. Beispielsweise können Nutzer vernünftigerweise zu der Einschätzung kommen, das die Kategorie „Priester“ im Sinne einer Berufsbezeichnung eine Unterkategorie der Kategorie „Religiöses Amt“ ist. Andere Nutzer wiederum könnten genauso die Kategorie „Weiblicher Priester“ der Kategorie „Priester“ im Sinne von Amtsträger zuordnen. Dies bedeutet allerdings auch, das alle Seiten in der Kategorie „Weiblicher Priester“ implizit auch der Kategorie „Religiöses Amt“ zugeordnet werden, was wiederum die Bedeutungen Berufsbezeichnung sowie Amtsträger durcheinanderbringt. Daher ist es sehr wichtig stets deutlich zu dokumentieren, was in eine Kategorie eingeordnet werden soll und was nicht, sowie im Zweifelsfall alternative Kategorien aufzuzeigen, die besser geeignet erscheinen.
Unterattribute
Wie bei den Kategorien können einzelne Attribute ebenso eine spezifischere Bedeutung haben als andere. Beispielsweise könnte ein Wiki das Attribut „Ist Hauptstadt von“ enthalten, welches die betreffenden Städte einem Staat zuordnet, sowie das Attribut „Liegt in“, das allgemein die Zuordnung eine Stadt zu einem Staat vornimmt. Alle Hauptstädte liegen naturgemäß auch in einem bestimmten Staat, was bedeutet, dass das Attribut „Ist Hauptstadt von“ ein Unterattribut von „Liegt in“ ist. Wenn ein Nutzer festlegt, dass eine Seite die Hauptstadt eines Staates beschreibt, sollte SMW schlussfolgern können, dass diese Seite implizit auch dem Attribut „Liegt in“ zugeordnet wurde.
Diese Verknüpfung wird mit Hilfe des Spezialattributs Unterattribut von auf der der Seite des Attributs „Ist Hauptstadt von“ ([[Attribut:Ist Hauptstadt von]]) vorgenommen:
[[Unterattribut von::Attribut:Liegt in]]
Sobald diese Zuordnung vorgenommen wurde, wird eine Abfrage nach [[Liegt in::Deutschland]] auch dessen Hauptstadt Berlin als Ergebnis ausgeben, selbst wenn das Attribut „Liegt in“ nicht explizit auf dieser Seite festgelegt wurde.
Was die „Semantische Drift“ angeht, so gilt bei Attributen Gleiches. Auch hier ist es sehr wichtig stets deutlich zu dokumentieren, was in mit einem Attribut zugeordnet werden soll und was nicht, sowie im Zweifelsfall alternative Attribute aufzuzeigen, die besser geeignet erscheinen.
Ausgabeanweisungen
Mit Hilfe von Ausgabeanweisungen können im Allgemeinen keine Schlussfolgerungen durchgeführt werden. Sie geben nur die Informationen zurück, die explizit auf einer Seite hinterlegt wurden. Einerseits ist dies das gewünschte Verhalten, kann aber andererseits auch zu Einschränkungen führen. Zur Umgehung bestimmter Einschränkungen kann man indes Vorlagen zum Hinterlegen der semantischen Annotationen nutzen. Beispielsweise kann man zwei Attribute mit einer Vorlage setzten, indem man
[[Ist Hauptstadt von::Liegt in::Deutschland]]
in ihr festlegt. Dies entspricht
[[Ist Hauptstadt von::Deutschland]] [[Liegt in::Deutschland]]
wird allerdings demgegenüber nur einen Link zur Seite Deutschland ausgeben.
Seitengleichheit: Weiterleitungen
Häufig kann es vorkommen, dass man Informationen auf Seiten mit unterschiedlichen Namen beschreiben könnte. Dies wäre beispielsweise bei Semantic MediaWiki der Fall, was synonym zu SMW ist. MediaWiki löst dieses Problem mit Hilfe von Weiterleitungen, wobei die eine Seite eine Weiterleitung auf die andere Seite mit der Beschreibung enthält, um so den Nutzer zur richtigen Seite zu leiten. Derartigen Synonymen kommt in semantischen Wikis eine größere Bedeutung zu, auf denen die Inhalte stärker organisiert sind und zudem strukturiert zugänglich gemacht werden sollen. Sofern unterschiedliche Nutzer bei ihren Annotationen unterschiedliche Seitennamen verwenden, wird es schwer Abfragen zu erstellen, die den gesamten Inhalt des betreffenden Wikis erschließen.
SMW behandelt daher alle Weiterleitungen zwischen Seiten als Synonyme. Dies bedeutet, dass es unerheblich ist, ob eine Seite oder eine Weiterleitung auf sie in einer Abfrage verwendet wird oder welche der beiden Seiten mit Annotationen versehen wurde. Softwareintern werden nur die Weiterleitzungsziele genutzt, wobei dabei alle Funktionen der Software die Weiterleitungen berücksichtigen. Im Fall doppelter Weiterleitungen funktioniert dies allerdings nicht. Sie sollten in jedem Fall aufgelöst werden.
Seit SMW 1.2.0 ist es auf die gleiche Weise auch möglich, Weiterleitungen zu Attributen und Kategorien zu verwenden. Somit kann eine Vielzahl von Synonymen für Attribute erstellt werden. Im Fall von Kategorien wird hiervon allerdings abgeraten, da die Funktionen von MediaWiki betreffend Kategorien entsprechende Weiterleitungen ignorieren und es somit zu unerwarteten Ergebnissen kommen kann.
Weiterleitungen zwischen unterschiedlichen Namensräumen, wie beispielsweise Weiterleitungen vom Hauptnamensraum auf Attribute, von Attributen auf Kategorien, usw., werden nicht semantisch unterstützt. Es handelt sich dabei schlicht um reguläre Weiterleitungen im Sinn von MediaWiki.
Für Systemadministratoren besteht auch die Möglichkeit das hier beschriebene Verhalten von SMW mit dem Konfigurationsparameter $smwgQEqualitySupport zu verändern, d. h. zu deaktivieren. Dies sollte allerdings nur aufgrund der unbedingten Notwendigkeit von Leistungssteigerungen erfolgen.
Schlussfolgerungen die nicht unterstützt werden
Es kommt machmal vor, dass ambitionierte Nutzer Attribute erstellen, die mit Hinblick auf das Ableiten von Informationen, eine bestimmte Bedeutung vermuten lassen. In diesem Zusammenhang muss darauf hingewiesen werden, das SMW keine der folgenden Funktionen unterstützt:
- Transitivität
- Domain- und Adressbereichsbeschränkungen
- Zahlenbeschränkungen
- funktionale Attribute
Selbst für den Fall das entsprechende Attribute erstellt werden und diese auf bekannte Attribute der Ontologiesprachen OWL, RDFS, SKOS, usw., verlinken wird SMW diese nicht nutzen können, um intelligentere Abfragen auszuführen. Um diesbezüglichen Missverständnissen vorzubeugen, sollten Namen von Attributen im Wiki nicht denen entsprechen, die von Ontologiesprachen verwendet werden. Sofern dies doch gemacht wird, sollte in der Dokumentation zum Attribut, auf die hier beschriebene Einschränkung hingewiesen werden.
In beschränktem Umfang kann man Abfragen erstellen, die ähnliches bewirken. Die Beispielseiten Germany und California enthalten Beispiele zu Abfragen mit inversen Beziehungen. Die Beispielseite Germany enthält zudem ein Beispiel für eine Teilabfrage, die sich in gewissem Umfang einer transitiven Beziehung annähert.
Property "Namespace" has a restricted application area and cannot be used as annotation property by a user.Property "Docinfo editor" (as page type) with input value "User:>Fany" contains invalid characters or is incomplete and therefore can cause unexpected results during a query or annotation process.