Preguntas frecuentes
¿Cómo debo representar las URL en el Sitemap?
¿Tiene importancia el método de codificación que utilizo para crear mis archivos de Sitemap?
¿Cómo puedo calcular la fecha “lastmod” (de la última modificación)?
¿Dónde puedo colocar mi Sitemap?
¿Qué tamaño puede tener mi Sitemap?
¿Qué debo hacer tras crear el Sitemap?
¿Es necesario especificar las direcciones URL completas del Sitemap?
Mi sitio contiene versiones de URL tanto "http" como "https". ¿Debo especificar ambas?
Las URL de mi sitio incluyen ID de sesión, ¿tengo que eliminarlos?
¿Influye la posición que tiene la URL de un Sitemap en cómo se utiliza?
¿Puedo comprimir mis Sitemaps en formato zip o deben estar en formato gzip?
¿Hay algún esquema XML según el cual pueda validar mi Sitemap en XML?
P: ¿Cómo deben representarse las URL en el Sitemap?
Al igual que con los archivos XML, los valores de datos (incluidas las URL) deben utilizar codificación con caracteres de escape de entidad para los siguientes caracteres: símbolo de unión (&), comillas simples ('), comillas ("), menor que (<) y mayor que (>). También debe asegurarse de que todas las URL siguen el estándar RFC-3986 para URI, el estándar RFC-3987 para IRI y el estándar XML. Si utiliza una secuencia de comandos para crear sus URL, puede utilizar caracteres de escape en las URL como parte de esa secuencia de comandos. De todos modos tendrá que utilizar caracteres de escape de entidad. Por ejemplo, la siguiente entidad de secuencia de comandos Python emplea caracteres de escape para http://www.ejemplo.es/view?widget=3&count>2.
$ python Python 2.2.2 (#1, Feb 24 2003, 19:13:11) >>> import xml.sax.saxutils >>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")
La URL que se obtiene del ejemplo anterior es:
http://www.example.com/view?widget=3&count>2
P: ¿Tiene importancia el método de codificación que utilizo para crear mis archivos Sitemap?
Sí. Sus archivos Sitemap deben usar codificación UTF-8.
P: ¿Cómo se especifica la hora?
Emplee la codificación W3C de fecha y hora para las marcas horarias “lastmod” y todas las demás fechas y horas de este protocolo. Por ejemplo, 2004-09-22T14:12:14+00:00.
Esta codificación le permite omitir el fragmento de tiempo del formato ISO8601; por ejemplo, 2004-09-22 también es válido. Sin embargo, si su sitio cambia con frecuencia, le recomendamos que incluya el fragmento de tiempo para que los rastreadores dispongan de información completa acerca de su sitio.
P: ¿Cómo puedo calcular la fecha lastmod (de la última modificación)?
Para archivos estáticos, esta es la fecha real de actualización del archivo. Puede usar el comando de fecha UNIX para obtener esta fecha:
$ date --iso-8601=seconds -u -r /home/foo/www/bar.html >> 2004-10-26T08:56:39+00:00
Para muchas URL dinámicas, puede realizar fácilmente el cálculo de la fecha “lastmod” (de la última modificación) en función de cuándo se modificaron los datos subyacentes o mediante una aproximación basada en actualizaciones periódicas (si corresponde). Incluso si utiliza una fecha o marca horaria aproximada, puede ayudar a los rastreadores a que eviten las URL que no han cambiado. Esto reducirá las exigencias de ancho de banda y los requisitos de CPU de sus servidores web.
P: ¿Dónde puedo colocar mi Sitemap?
Le recomendamos encarecidamente que coloque su Sitemap en el directorio raíz de su servidor HTML, es decir, en http://ejemplo.es/sitemap.xml.
En determinadas situaciones, es posible que desee generar distintos Sitemaps para las distintas rutas de su sitio, por ejemplo, en caso de que los permisos de seguridad de su organización clasifiquen el acceso de escritura a distintos directorios.
Suponemos que si dispone del permiso para subir http://ejemplo.es/path/sitemap.xml, también tiene el permiso para comunicar metadatos en http://ejemplo.es/path/.
Todas las URL enumeradas en el Sitemap deben residir en el mismo host que el Sitemap. Por ejemplo, si el Sitemap se encuentra en http://www.ejemplo.es/sitemap.xml, no puede incluir URL de http://subdominio.ejemplo.es. Si el Sitemap se encuentra en http://www.ejemplo.es/micarpeta/sitemap.xml, no puede incluir URL de http://www.ejemplo.es.
P: ¿Qué tamaño puede tener mi Sitemap?
Los Sitemaps no pueden superar los 50 MB (52,428,800 bytes) y pueden contener un máximo de 50.000 URL. Estos límites contribuyen a garantizar que su servidor web no se queda bloqueado al servir un gran número de archivos. Esto significa que si su sitio contiene más URL de las mencionadas o si su Sitemap supera la cantidad de megabytes indicada, debe crear varios archivos de Sitemap y utilizar un archivo del índice de Sitemap. Aunque su sitio sea pequeño, debe usar un archivo del índice de Sitemap si tiene previsto incluir más de 50.000 URL o si el tamaño del archivo supera los 50 MB. Un archivo del índice de Sitemap puede contener un máximo de 50.000 Sitemaps y no debe superar los 50 MB (52,428,800 bytes). También puede utilizar gzip para comprimir sus Sitemaps.
P: Mi sitio tiene millones de URL, ¿hay algún modo de enviar únicamente las que se han modificado recientemente?
Puede incluir las URL que se modifican con frecuencia en unos pocos Sitemaps y, a continuación, utilizar la etiqueta lastmod en su archivo de índice de Sitemap para identificar estos archivos. De este modo, los motores de búsqueda pueden llevar a cabo rastreos incrementales únicamente de los Sitemaps modificados.
P: ¿Qué debo hacer tras crear el Sitemap?
Una vez que haya creado el archivo de Sitemap, haga saber a los motores de búsqueda que existen enviándoselos directamente, realizando un ping de los mismos o agregándolos a la ubicación de Sitemap en el archivo robots.txt .
P: ¿Es necesario especificar las direcciones URL completas del Sitemap?
Sí. Para ello es necesario incluir el protocolo, por ejemplo http, en su URL. También tendrá que incluir una barra diagonal al final de la URL si su servidor web así lo requiere. Por ejemplo, http://www.ejemplo.es/ es una URL válida para un Sitemap, mientras que www.ejemplo.es no lo es.
P: Mi sitio contiene versiones de URL tanto "http" como "https". ¿Debo especificar ambas?
No. Por favor, incluya únicamente una versión de cada URL en sus Sitemaps. Si incluye varias versiones de URL es posible que el rastreo de su sitio no se complete.
P: Las URL de mi sitio incluyen ID de sesión, ¿tengo que eliminarlos?
Sí. Si incluye ID de sesión en las URL es posible que el rastreo de su sitio sea incompleto y redundante.
P: ¿Influye la posición que tiene la URL de un Sitemap en cómo se utiliza?
No, la posición de una URL en el Sitemap no suele tener ningún efecto en la forma en que se utiliza ni en cómo la tienen en cuenta los motores de búsqueda.
P: Algunas de las páginas de mi sitio utilizan marcos. ¿Debo incluir las URL del conjunto de marcos o las URL de los contenidos de los marcos?
Por favor, incluya ambas URL.
P: ¿Puedo comprimir mis Sitemaps en formato zip o deben estar en formato gzip?
Por favor, use gzip para comprimir sus Sitemaps. No olvide que estos no deben superar los 50 MB (52,428,800 bytes), ya sean comprimidos o sin comprimir.
P: ¿La sugerencia "priority" del Sitemap en XML afectará a la clasificación de mis páginas en los resultados de búsqueda?
La sugerencia "priority" de su Sitemap sólo indica la importancia de una URL concreta respecto a las demás URL de su sitio y no afecta a la posición en la que aparecerán sus páginas en los resultados de búsqueda.
P: ¿Hay algún esquema XML según el cual pueda validar mi Sitemap en XML?
Sí. Dispone de un esquema XML para archivos de Sitemap en http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd y de un esquema para archivos de índice de Sitemap en http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. También puede obtener más información acerca de la validación de su Sitemap.
P: ¿Qué debo hacer si tengo otra pregunta acerca de la utilización del protocolo o el envío de un Sitemap?
Consulte la documentación disponible de cada motor de búsqueda para obtener más información sobre el envío y utilización de Sitemaps.
Última actualización: 21 de noviembre de 2016