Semantic-Web im Tourismus

Webseiten sind mit die wichtigsten Kommunikationskanäle im Tourismus

Unzählige Webseiten von Reise- und Serviceanbietern, direkten Leistungsträgern und Tourismusverbänden bereiten für Reisende vielfältige Informationen auf. Dabei kann aber die Fülle an Daten auch zu einem Problem werden.

Wer bereits selbst eine Reise über das Internet geplant hat, weiß genau wie unübersichtlich die Suchmaschinenergebnisse sein können und wie mühsam das Zusammensuchen und Schlussfolgern der Informationen über das aktuelle Wetter, Aktivitäten, Gastronomie- und Veranstaltungsangebote am Zielort sein kann. Viel einfacher wäre es, wenn die Suchmaschine selbst diese Informationen für uns logisch verbinden und dabei unsere Wünsche und die aktuellen Rahmenbedingungen vor Ort wie Wetter, Auslastung und Anreisebedingungen berücksichtigen würde. Genau das ist das Ziel von Semantic-Web.

Doch was genau ist Semantic-Web? Wie können Webseitenbetreiber ein Teil des Semantic-Web werden und welche Vorteile bringt es für den Tourismus?

Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak, LOD Cloud 2014-08, Farbe verändert durch BayTM, CC BY-SA 3.0

Wie funktioniert die Suche im Web?

Um die oben gestellten Fragen zu beantworten, muss man zunächst verstehen, wie die Suche im World Wide Web funktioniert. Spezielle Suchalgorithmen, sogenannte Crawler, durchsuchen die HTML-Dokumente nach Stichworten. Gibt man dann in die Suchleiste einen Begriff ein, werden in der Ausgabe alle Webinhalte angezeigt, bei denen das Stichwort und der Suchbegriff übereinstimmen. Ob die Suchmaschinen mehr oder weniger passende Suchergebnisse (Search Engine Results Page = SERP) liefern, hängt davon ab, wie eindeutig die Suchbegriffe von dem Nutzer gewählt wurden. Das funktioniert gut für einfache Suchen, wie z. B. „Wetter München“, jedoch nicht, wenn noch zusätzliche Rahmenbedingungen wie z. B. Auslastung, Anreisemöglichkeiten oder Buchbarkeit berücksichtigt werden sollen. Das liegt daran, dass die Suchalgorithmen die Informationen zwar verarbeiten, jedoch die semantische Bedeutung der Inhalte nicht verstehen. Wenn wir zum Beispiel an „München“ denken, verstehen wir darunter eine Stadt in Bayern und denken dabei an unseren Lieblingsbiergarten oder ein Restaurant. Für die Suchmaschine ist dieses Wort nur eine Symbolreihe. Um zu denken wie der Mensch, müssen Computeralgorithmen lernen die semantische Bedeutung aus Inhalten zu extrahieren und diese in Beziehung mit anderen relevanten Informationen zu setzen.

Was ist das Ziel von Semantic-Web?

Und das ist das Ziel von Semantic-Web: die Informationssuche im Internet zu optimieren, indem im Web verfügbare Inhalte von Maschinen gelesen, interpretiert und mit anderen Inhalten verknüpft werden. Um das zu erreichen, müssen die Webinhalte maschinenlesbar und in einer spezifischen strukturierteren Form vorgehalten werden. Daten zu strukturieren, bedeutet beispielsweise für einen Biergarten, dass Basisangaben wie die Adresse, Geokoordinaten, Öffnungszeiten und mögliche Zahlungsarten einer einheitlichen semantischen Auszeichnung folgen. Eine im Tourismus etablierte Form der semantischen Auszeichnung ist schema.org und seine erweiterten Domain Specifications, die von der Open Data Tourismus Alliance (ODTA) kontinuierlich weiterentwickelt werden. Die ODTA ist eine Organisationsform im DACH-Raum mit Mitgliedern aus öffentlichen Tourismusorganisationen und Forschungseinrichtungen, die sich das Ziel gesetzt hat, die semantische Auszeichnung von Daten zu vereinheitlichen und ein Vorgehen zu erarbeiten, wie eine solche Vereinheitlichung der Datenbestände koordiniert werden kann.

Wie werde ich ein Teil von Semantic-Web?

Der erste Schritt zum Semantic-Web ist also die semantische Auszeichnung der Web-Inhalte nach schema.org, zum Beispiel durch die Integration von Schema-Markups in JSON-LD Format. Eine praktische Hilfestellung zur Codierung von In-Page-Markup auf der Website wird bereits in zahlreichen kostenlosen Online-Tutorials von Suchmaschinenanbietern bzw. Web- und Onlinemarketingagenturen bereitgestellt. So können auch kleine Webseitenbetreiber ohne erweiterte Programmierkenntnisse über ein nutzerfreundliches Formular JSON-LD Einträge generieren und diese dann den HTML-Dokumenten beifügen. Ein entsprechendes JSON-LD Schema kann unter diesem Link erstellt werden: https://jsonld.com/json-ld-generator/

Bei der Ausschreibung von neuen Webseiten oder einem Webseiten-Relaunch sollten Tourismusorganisationen oder Dienstleister darauf achten, dass die Auszeichnung der Inhalte nach schema.org als Vergabekriterium aufgenommen wird.

Das nachfolgende Beispiel anhand eines Spargelrezeptes auf der Webseite erlebe.bayern soll die praktische Umsetzung von semantischer Auszeichnung greifbarer machen und den Mehrwert aufzeigen. Die Abbildung unten zeigt, wie der Content für das Rezept für Grünkern-Salat mit Spargel durch semantische Auszeichnung nach schema.org für eine Suchmaschine “verständlich” gemacht wird.

Beispiel für semantische Auszeichnung

Somit kann der Crawler die jeweiligen Inhalte auf der Website erlebe.bayern sofort dem Datentyp “Rezept” zuordnen. Je mehr Eigenschaften (engl. Properties) in dem Code definiert sind, desto besser ist das Ranking in den Suchergebnissen (SERP). So würde eine Ergänzung des Codes mit zusätzlichen Properties wie “recipeIngredient” (Zutatenliste) und “cookTime” die Wahrscheinlichkeit steigern, dass das Rezept für Grünkern-Salat mit Spargel z.B. als Rich Snippet angezeigt wird. Rich Snippets sind visuell ansprechende Suchergebnisse mit zusätzlichen Informationen, die neben dem Titel, der Beschreibung und der URL ausgespielt werden. Jedoch hat bereits ein erforderliches Minimum an strukturierter Datenaufbereitung Einfluss auf das Ranking in den Suchergebnissen, wie die Suche für Grünkern-Salat mit Spargel zeigt.

Screenshot der Suche „Grünkernsalat mit Spargel“

Welche Vorteile bringt Semantic-Web für den Tourismus?

Durch die Anreicherung der Webseite mit strukturierten Daten kann ein Suchmaschinen-Crawler nicht nur die Inhalte schneller auffinden, sondern auch erkennen, worum es sich auf dieser Webseite handelt und in welcher Beziehung dieser zu anderen Informationen steht. Es entsteht das Web der Daten, in dem Inhalte nicht mehr isoliert pro Webseite, sondern webseitenübergreifend verfügbar sind. In dieser Weise lassen sich die Inhalte beliebig kombinieren, unabhängig aus welcher Quelle (App, Webseite, Datenportal) sie stammen. In Verbindung mit KI-gestützten Technologien, öffnet die strukturierte Datenhaltung eine neue Dimension von personalisierten Reiseangeboten. Wenn wir das oben erwähnte Beispiel betrachten, würde der Nutzer auf die Anfrage „Wetter München“ nicht nur die aktuelle Wetterlage vor Ort erfahren, sondern auch passende personalisierte Vorschläge für die Freizeitgestaltung in München erhalten. Jedoch sind aktuell die meisten Webinhalte noch unstrukturiert im Web verteilt. So haben zum Beispiel von 2.600 Hotels in Bayern, die in OpenStreetMaps mit einer Website gepflegt sind, nur 60 Hotels (das entspricht 2 %) maschinenlesbare, semantische Inhalte nach schema.org angelegt (Die Angaben basieren auf einer eigenen Auswertung von insgesamt 4.000 Hotels in Bayern, die in der freien Geodatenbank OpenStreetMaps eingetragen sind.). Dabei bleiben vor allem kleinere, regionale oder lokale Anbieter oft unentdeckt, die kein Budget für teures Online-Marketing haben.

Ausblick

Die Web-Technologien entwickeln sich rasant. So übernimmt das Voice-Search zunehmend die führende Rolle für Informationsbeschaffung. Dabei werden strukturierte Daten noch wichtiger, weil ein Computer-Bot für die Kommunikation mit dem Menschen die Inhalte der Frage verstehen und verknüpfen muss, um eine sinnvolle Antwort zu liefern. Somit müssen auch Reise- und Serviceanbieter sowie Tourismusorganisationen mit den kommenden Veränderungen Schritt halten, um für ihre Gäste jetzt und in naher Zukunft auffindbar zu bleiben.