Mein Ziel: Ein Experten-Chat-System erstellen, dass Fragen rund um die BayernCloud Tourismus beantworten kann. Natürlich ist dafür ein wenig technisches Verständnis notwendig, meine 15 Jahre Erfahrung als Softwareentwickler und -architekt also sicher hilfreich, aber auch ohne kann man hier schnell Erfolge erzielen, wenn man moderne KI-Werkzeuge benutzt.
Informationen sammeln: Der Crawl-Vorgang
Der erste Schritt besteht darin, die relevanten Informationen zu sammeln. Die Herausforderung dabei: Habe ich zu (m)einem Thema alle Informationen und Dokumentationen verfügbar? Sind alle Dokumente auch für die Öffentlichkeit bestimmt? Es ist nämlich wichtig zu beachten, dass keinesfalls interne Dokumente oder gar personenbezogene Daten genutzt werden. Daher habe ich zunächst die öffentlichen Webseiten der BayTM „crawlen“ (also automatisiert auslesen) lassen und so alle öffentlich zugänglichen Inhalte und Dokumentationen erfasst, die für das Thema wichtig waren. Diese Vorgehensweise ermöglicht es, die bereits vorhandenen Wissensressourcen voll auszuschöpfen, ohne neue Inhalte erstellen zu müssen.
Den Code zum Crawlen habe ich mit Hilfe einer KI erstellt und in Jupyter Notebooks, einem Tool, in dem du Code schreiben, testen und sofort ausführen kannst, laufen lassen. Das war erstaunlich praktisch und unkompliziert, da ich den Crawl-Prozess flexibel gestalten und sicherstellen konnte, dass nur öffentlich zugängliche Informationen verwendet werden. Natürlich ist (wie so oft beim Agieren mit KI-Systemen) die erste Antwort noch nicht die finale Lösung, aber mit dem Feedback der KI und dem Bereitstellen von Fehlermeldungen kann man innerhalb weniger Schleifen ein kleines Programm bauen, das die gewünschten Inhalte aus den durchsuchten Seiten bereitstellt.