Häufig gestellte Fragen (FAQ)
Wie gebe ich URLs in der Sitemap wieder?
Wie kann ich Zeitangaben erstellen?
Wie berechne ich den Zeitpunkt lastmod?
Wie groß darf meine Sitemap sein?
Was muss ich tun, nachdem ich meine Sitemap erstellt habe?
Müssen URLs in der Sitemap vollständig angegeben werden?
Meine Website enthält sowohl "http"- als auch "https"-Versionen von URLs. Muss ich beide auflisten?
URLs auf meiner Website sind mit Sitzungs-IDs versehen. Muss ich diese entfernen?
Hat die Position einer URL in einer Sitemap Einfluss auf ihre Verwendung?
Kann ich meine Sitemaps im zip-Format komprimieren oder muss gzip verwendet werden?
Gibt es ein XML-Schema, anhand dessen ich meine XML-Sitemap validieren kann?
F: Wie gebe ich URLs in der Sitemap wieder?
Wie bei XML-Dateien üblich, müssen alle Datenwerte (einschließlich URLs) Entity-Escape-Codes für die folgenden Zeichen verwenden: kaufmännisches Und-Zeichen (&), einfaches Anführungszeichen ('), doppeltes Anführungszeichen ("), kleiner als (<) und größer als (>). Stellen Sie außerdem sicher, dass alle URLs dem Standard RFC-3986 für URIs, dem Standard RFC-3987 für IRIs und dem XML-Standard entsprechen. Wenn Sie Ihre URLs mithilfe eines Skripts erstellen, können Sie sie in der Regel URL-escaped als Teil dieses Skripts angeben. Sie müssen sie außerdem als Entity-escaped angeben. So gibt beispielsweise das folgende Python-Skript http://www.beispiel.de/view?widget=3&count>2 als Entity-escaped an.
$ python Python 2.2.2 (#1, Feb 24 2003, 19:13:11) >>> import xml.sax.saxutils >>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")
Folgende URL ergibt sich aus dem obigen Beispiel:
http://www.example.com/view?widget=3&count>2
F: Spielt es eine Rolle, welche Zeichencodierungsmethode ich für die Erstellung meiner Sitemap-Dateien verwende?
Ja. Ihre Sitemap-Dateien müssen UTF-8-Codierung verwenden.
F: Wie kann ich Zeitangaben erstellen?
Verwenden Sie W3C Datetime-Codierung für die lastmod-Zeitstempel sowie alle anderen Daten und Uhrzeiten in diesem Protokoll. Zum Beispiel: 2004-09-22T14:12:14+00:00.
Mit dieser Codierung können Sie den Uhrzeitteil des ISO8601-Formats weglassen. 2004-09-22 zum Beispiel ist ebenfalls zulässig. Wenn sich allerdings Ihre Website häufig ändert, sollten Sie die Uhrzeit mit angeben, damit die Crawler genauere Informationen über Ihre Website erhalten.
F: Wie berechne ich den Zeitpunkt lastmod?
Bei statischen Dateien ist dies das Datum der tatsächlichen Aktualisierung der Datei. Um dieses Datum zu erhalten, können Sie den UNIX Datum-Befehl verwenden:
$ date --iso-8601=seconds -u -r /home/foo/www/bar.html >> 2004-10-26T08:56:39+00:00
Bei vielen dynamischen URLs können Sie das "lastmod"-Datum mühelos ermitteln, indem Sie die letzte Änderung der zugrunde liegenden Daten auswerten oder (ggf.) eine Näherung anhand periodischer Aktualisierungen aufstellen. Auch ein Näherungsdatum bzw. -zeitstempel kann Crawlern helfen, unveränderte URLs zu vermeiden. Dadurch wird der Bandbreiten- und CPU-Bedarf für Ihre Webserver verringert.
F: Wo lege ich meine Sitemap ab?
Es ist äußerst ratsam, die Sitemap im Stammverzeichnis Ihres HTML-Servers zu platzieren, d. h. unter http://beispiel.de/sitemap.xml.
In bestimmten Situationen können Sie verschiedene Sitemaps für verschiedene Pfade auf Ihrer Website erstellen, z.B. wenn auf Grund von Sicherheitsregeln in Ihrem Unternehmen der Schreibzugriff auf verschiedene Verzeichnisse aufgeteilt wird.
Wenn Sie die Berechtigung zum Hochladen von http://beispiel.de/path/sitemap.xml besitzen, gehen wir davon aus, dass Sie auch die Berechtigung zum Melden von Metadaten unter http://beispiel.de/path/ haben.
Alle in der Sitemap aufgeführten URLs müssen sich auf demselben Host befinden wie die Sitemap. Falls Ihre Sitemap beispielsweise unter http://www.beispiel.de/sitemap.xml aufgeführt ist, können URLs von http://subdomain.beispiel.de nicht enthalten sein. Falls Ihre Sitemap unter http://www.beispiel.de/eigenerordner/sitemap.xml aufgeführt ist, können URLs von http://www.beispiel.de nicht enthalten sein.
F: Wie groß darf meine Sitemap sein?
Sitemaps dürfen höchstens 50 MB (52,428,800 Byte) groß sein und nicht mehr als 50.000 URLs enthalten. Mithilfe dieser Beschränkungen wird vermieden, dass Ihr Webserver durch die Verarbeitung sehr umfangreicher Dateien lahm gelegt wird. Falls Ihre Website mehr als 50.000 URLs umfasst oder Ihre Sitemap größer als 50 MB ist, müssen Sie mehrere Sitemap-Dateien erstellen und eine Sitemap-Indexdatei verwenden. Verwenden Sie eine Sitemap-Indexdatei auch dann, wenn Sie gegenwärtig noch eine kleinere Website haben, aber ein künftiges Wachstum auf über 50.000 URLs oder eine Dateigröße über 50 MB planen. Eine Sitemap-Indexdatei darf höchstens 50.000 Sitemaps umfassen und 50 MB (52,428,800 Byte) nicht überschreiten. Verwenden Sie gzip zum Komprimieren Ihrer Sitemaps.
F: Meine Website beinhaltet Millionen von URLs; gibt es eine Möglichkeit, nur diejenigen einzureichen, die sich vor kurzem verändert haben?
Sie können die häufig geänderten URLs in einer kleinen Anzahl Sitemaps auflisten und diese Sitemap-Dateien dann in der Sitemap-Indexdatei mit dem Tag lastmod kennzeichnen. In diesem Fall durchsuchen die Suchmaschinen lediglich inkrementell die geänderten Sitemaps.
F: Was muss ich tun, nachdem ich meine Sitemap erstellt habe?
Nachdem Sie eine Sitemap erstellt haben, teilen Sie dies den Suchmaschinen mit, indem Sie die Sitemap entweder direkt einreichen, einen Ping ausführen oder den Speicherort der Sitemap in der robots.txt-Datei angeben.
F: Müssen URLs in der Sitemap vollständig angegeben werden?
Ja. Sie müssen das Protokoll (z.B. http) in Ihrer URL angeben. Sie müssen der URL zudem einen abschließenden Schrägstrich hinzufügen, wenn Ihr Webserver dies voraussetzt. Beispiel: Die Adresse http://www.beispiel.de/ ist eine gültige URL für eine Sitemap, die Adresse www.beispiel.de hingegen nicht.
F: Meine Website enthält sowohl "http"- als auch "https"-Versionen von URLs. Muss ich beide auflisten?
Nein. Nehmen Sie bitte nur eine URL-Version in Ihre Sitemaps auf. Wenn Sie mehrere URL-Versionen aufnehmen, kann dies ein unvollständiges Crawling Ihrer Website zur Folge haben.
F: URLs auf meiner Website sind mit Sitzungs-IDs versehen. Muss ich diese entfernen?
Ja. Wenn Sie Session-IDs in URLs einschließen, kann dies ein unvollständiges und redundantes Crawling Ihrer Website zur Folge haben.
F: Hat die Position einer URL in einer Sitemap Einfluss auf ihre Verwendung?
Nein. Die Position einer URL in der Sitemap hat wahrscheinlich keinerlei Auswirkungen darauf, wie sie von Suchmaschinen verwendet oder bewertet wird.
F: Auf einigen Seiten meiner Website werden Frames verwendet. Sollte ich die URLs der Framesets oder die URLs der Frame-Inhalte angeben?
Geben Sie bitte beide URLs an.
F: Kann ich meine Sitemaps im zip-Format komprimieren oder muss gzip verwendet werden?
Verwenden Sie gzip zum Komprimieren Ihrer Sitemaps. Die Sitemap-Datei darf komprimiert oder unkomprimiert nicht größer als 50 MB (52,428,800 Byte) sein.
F: Beeinflusst die Angabe "priority" in der XML-Sitemap das Ranking meiner Seiten in den Suchergebnissen?
Der Hinweis "priority" auf Ihrer Sitemap zeigt lediglich die Wichtigkeit einer bestimmten URL im Vergleich zu anderen URLs auf Ihrer Website an und hat keinen Einfluss auf das Ranking Ihrer Seiten in den Suchergebnissen.
F: Gibt es ein XML-Schema, anhand dessen ich meine XML-Sitemap validieren kann?
Ja. Ein XML-Schema für Sitemap-Dateien finden Sie unter http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd und ein Schema für Sitemap-Indexdateien unter http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Weitere Informationen zur Validierung Ihrer Sitemap.
F: Was tue ich, wenn ich eine andere Frage zur Verwendung des Protokolls oder zum Einreichen der Sitemap habe?
Weitere Informationen zur Einreichung und Verwendung von Sitemaps finden Sie in der Dokumentation der entsprechenden Suchmaschine.
Letzte Aktualisierung: 21. November 2016