Forschungsgruppe Schelmsrasen Projekt: Sitemap - Die Sitemap als Datenquelle

Web-Crawling-Projekt


Die Förderung des Projektes läuft am 13.06.2026 aus.


Vorteile einer HTML-Sitemap als Datenquelle:

  • Benutzerfreundlich: Eine HTML-Sitemap ist meist übersichtlich strukturiert und lässt sich sowohl von Menschen als auch von Webcrawlern leicht lesen.
  • Leicht zugänglich: HTML-Sitemaps sind öffentlich verfügbar und können ohne spezielle Berechtigungen oder API-Zugriffe genutzt werden.
  • Überblick über die Seitenstruktur: Sie zeigt oft eine hierarchische Gliederung der Website und ermöglicht so einen schnellen Eindruck über den Aufbau und Umfang der Seiten.
  • Crawling für SEO-Zwecke: Webcrawler, wie Suchmaschinen-Bots oder Scraper, können HTML-Sitemaps nutzen, um Inhalte einer Website systematisch zu erfassen.
  • Manuelle Auswertung: Für die Analyse der Website-Struktur durch Menschen bietet die HTML-Sitemap einen praktischen visuellen Anhaltspunkt.

  • lucy.tonyland.de
    • Zweck / Inhalt: Escort- und Charakterseiten Lucy
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Struktur und Links zu Profilen, Einsätze, Szenen

  • clara-und-tony.tonyland.de
    • Zweck / Inhalt: Geschichten / Szenen Clara & Tony
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Chronologische Szenenübersicht, Figurendaten

  • clara-ohne-tony.tonyland.de
    • Zweck / Inhalt: Geschichten Clara solo
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Struktur von Szenen, einzelne Figurendaten

  • tony-ohne-clara.tonyland.de
    • Zweck / Inhalt: Geschichten Tony solo
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Struktur von Szenen, Figurendaten

  • clara.tonyland.de
    • Zweck / Inhalt: Hauptseite Clara
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Überblick über Inhalte, Unterseiten, Navigation

  • tonyland.de
    • Zweck / Inhalt: Hauptseite Velvet/Tonyland Universum
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Gesamtstruktur der Seiten, Hauptnavigation

  • katzenratgeber.info
    • Zweck / Inhalt: Ratgeber Katze
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelübersicht, Themenstruktur

  • radsport-zeitung.de
    • Zweck / Inhalt: Radsport-News
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelübersicht, Themen und Kategorien

  • autoratgeber.biz
    • Zweck / Inhalt: Autorenratgeber / Tipps
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelstruktur, mögliche Themenextraktion

  • geld-mit-pc.de
    • Zweck / Inhalt: Finanz- / Online-Geld-Themen
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Inhalte für Scraping, Struktur von Tutorials

  • kaffee-roesten.de
    • Zweck / Inhalt: Kaffee & Rösttechnik
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelübersicht, Themenstruktur

  • 7ghz.de
    • Zweck / Inhalt: Experimentelle / Technik-Inhalte
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Überblick über Inhalte, Projektseiten

  • gaststaette-in-schweinfurt.rv92.de
    • Zweck / Inhalt: Gastronomie / Lokal
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Menü, Infos, Standortdaten

  • kleingarten.rv92.de
    • Zweck / Inhalt: Kleingarten-Themen
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelübersicht, Tipps und Ressourcen

  • tonyland.rv92.de
    • Zweck / Inhalt: Ergänzende Tonyland-Inhalte
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Struktur der Geschichten, Szenenübersicht

  • ph.rv1892.de
    • Zweck / Inhalt: Vereins-/Projektseite
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Struktur von Seiten / Inhalten

  • bs.rv1892.de
    • Zweck / Inhalt: Vereins-/Projektseite
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Struktur von Seiten / Inhalten

  • froesche.rv92.de
    • Zweck / Inhalt: Vereins-/Tierseiten
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelübersicht, Themenstruktur

  • forum.rv92.de
    • Zweck / Inhalt: Community-Forum
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Übersicht von Threads, Unterforen

  • zuendapp-combinette.de
    • Zweck / Inhalt: Oldtimer / Technik
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Artikelstruktur, Themenübersicht

  • rv1892.de
    • Zweck / Inhalt: Hauptseite Verein / Organisation
    • Sichtbarkeit / Zugriff: Öffentlich
    • Nutzung als Datenquelle: Gesamtstruktur der Seiten, Navigation

 

 

Kennen Sie schon?