Perguntas mais freqüentes

Como faço para representar os URLs no Sitemap?

O método que utilizo para gerar meus arquivos Sitemap é relevante?

Como faço para especificar o tempo?

Como faço para calcular a última data de modificação?

Onde eu coloco meu sitemap?

Qual o maior tamanho permitido para meu Sitemap?

Meu site tem dezenas de milhões de URLs; posso enviar somente os que foram alterados recentemente?

O que acontece após a criação do Sitemap?

Os URLs no Sitemap precisam estar completamente especificados?

Meu site tem uma versão "http" e uma versão "https" de URLs. Devo listar as duas versões?

Os URLs do meu site usam IDs de sessão. Devo removê-los?

A posição de um URL em um Sitemap influencia sua utilização?

Algumas páginas do meu site usam frames. Devo incluir URLs do conjunto de frames ou URLs de conteúdo do frame?

Posso compactar meus Sitemaps ou compactá-los com o gzip?

A dica "priority" em um Sitemap em XML altera a classificação das minhas páginas nos resultados de pesquisa?

Existe um esquema em XML que permite a validação de meu Sitemap em XML?

E se eu tiver outra dúvida sobre como usar o protocolo ou enviar um Sitemap?


P: Como faço para representar os URLs no Sitemap?

Assim como em todos os arquivos XML, quaisquer valores de dados (inclusive os URLs) devem usar códigos de escape de entidade para os caracteres listados a seguir: E comercial (&), aspas simples ('), aspas duplas ("), menor que (<) e maior que (>). Também é preciso certificar-se de que todos os URLs estão de acordo com a norma RFC-3986 para URIs, a norma RFC-3987 para IRIs e a norma XML . Se você estiver utilizando um script para gerar os URLs, você poderá fazer uso do escape do URL como parte desse script. Ainda assim, será preciso aplicar o escape de entidade. Por exemplo, escapes de entidade do script python http://www.exemplo.com.br/view?widget=3&count>2

$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)  
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")

O URL resultante do exemplo acima é:

http://www.example.com/view?widget=3&amp;count&gt;2

P: A codificação de caracteres usada para gerar meus arquivos Sitemap é relevante?

Sim. Seus arquivos de texto devem usar a codificação UTF-8.

P: Como faço para especificar o tempo?

Use a codificação de data e hora W3C para registrar a data e o horário da última modificação e todas as outras datas e horários neste protocolo. Por exemplo, 2004-09-22T14:12:14+00:00.

Essa codificação permite omitir os dados de tempo do formato ISO8601. Por exemplo, 2004-09-22 também é válido. Entretanto, se as alterações no site forem freqüentes, é recomendável incluir os dados de tempo para que os robôs de indexação tenham informações mais completas sobre o site.

P: Como faço para calcular a última data de modificação?

Nos arquivos estáticos, esta é a data de atualização do arquivo real. Você pode usar o comando date do UNIX para obter essa data:

$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00

Para muitos URLs dinâmicos, é facilmente possível calcular a última data de modificação com base em quando os dados subjacentes foram alterados ou usando algumas aproximações com base em atualizações periódicas (se aplicáveis). Usar dados de data ou registros de tempo aproximados pode ajudar os robôs de indexação a evitar a indexação dos URLs que não foram alterados. Isso reduzirá as exigências de largura de banda e CPU de seus servidores web.

P: Onde devo colocar o meu Sitemap?

É extremamente recomendável que você coloque seu Sitemap no diretório raiz do servidor HTML; ou seja, em http://example.com/sitemap.xml.

Em algumas situações, é preciso produzir diferentes Sitemaps para diferentes caminhos no site — por exemplo, se as permissões de segurança em sua organização compartimentarem o acesso à gravação a diferentes diretórios.

Supomos que se você tem permissão para fazer upload de http://example.com/path/sitemap.xml, tem permissão também de enviar relatórios de metadados em http://example.com/path/.

Todos os URLs listados no Sitemap devem residir no mesmo host do Sitemap. Por exemplo, se o Sitemap estiver localizado em http://www.example.com/sitemap.xml, ele não pode incluir URLs a partir de http://subdomain.example.com. Se o Sitemap estiver localizado em http://www.example.com/myfolder/sitemap.xml, ele não pode incluir URLs a partir de http://www.example.com.

Voltar ao início

P: Qual o limite máximo de tamanho para um Sitemap?

Os Sitemaps não devem ter mais de 50MB (52,428,800 bytes) e podem conter 50.000 URLs no máximo. Esses limites ajudam a assegurar que o servidor Web não fique ocupado demais atendendo arquivos muito grandes. Isso significa que se o site contiver mais de 50.000 URLs ou tiver mais de 50MB, você deverá criar vários arquivos de Sitemap e usar um arquivo de índice de Sitemap. Use um arquivo de índice de Sitemap mesmo que você tenha um site pequeno, mas planeje aumentá-lo para mais de 50.000 URLs ou um tamanho de arquivo de 50MB. Um arquivo de índice de Sitemap pode conter até 50.000 Sitemaps e não deve ultrapassar 50MB (52,428,800 bytes). Também é possível usar o gzip para compactar Sitemaps.

P: Meu site tem dezenas de milhões de URLs; posso enviar somente os que foram alterados recentemente?

Você pode relacionar os URLs alterados com freqüência em um pequeno número de Sitemaps e usar a tag lastmod em seu arquivo de índice de Sitemap para identificá-los. Os mecanismos de pesquisa poderão fazer a indexação incremental somente nos Sitemaps alterados.

P: O que acontece após a criação do Sitemap?

Once you have created your Sitemap, let search engines know about it by submitting directly to them, pinging them, or adding the Sitemap location to your robots.txt file.

P: Os URLs no Sitemap precisam estar completamente especificados?

Sim. Você precisa incluir o protocolo (por exemplo, http) no seu URL. Você precisa também incluir uma barra final no seu URL, se for uma exigência do servidor. Por exemplo, http://www.exemplo.com.br/ é um URL válido para um Sitemap, enquanto www.exemplo.com.br não o é.

P: Meu site tem uma versão "http" e a versão "https" de URLs. Devo fornecer os dois?

Não. Só coloque uma versão de URL nos Sitemaps. Incluir várias versões de URLs pode resultar em uma indexação incompleta do site.

P: Os URLs do meu site usam IDs de sessão. Devo removê-los?

Sim. Incluir IDs de sessão em URLs pode resultar em uma indexação incompleta e redundante do site.

P: A posição de um URL em um Sitemap influencia sua utilização?

Não. A posição de um URL no Sitemap provavelmente não afeta o modo como ele é usado ou considerado pelos mecanismos de pesquisa.

P: Algumas páginas do meu site usam frames. Devo incluir URLs do conjunto de frames ou URLs de conteúdo do frame?

Inclua ambos os URLs.

P: Posso compactar meus Sitemaps ou compactá-los com o gzip?

Use o gzip para compactar Sitemaps. Lembre-se: o Sitemap não deve ter mais de 50MB (52,428,800 bytes), compactado ou não.

P: A dica "priority" em um Sitemap em XML altera a classificação das minhas páginas nos resultados de pesquisa?

A dica de "prioridade" no Sitemap indica apenas a importância de um determinado URL em relação a outros URLs no seu próprio site e não afeta em nada a classificação das suas páginas nos resultados da pesquisa.

P: Existe um esquema XML que permite a validação de meu Sitemap em XML?

Sim. Um esquema XML está disponível para arquivos de Sitemap em http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd, e um esquema para arquivos de índice de Sitemap está disponível em http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Saiba mais sobre a validação do Sitemap.

P: E se eu tiver outra dúvida sobre como usar o protocolo ou enviar um Sitemap?

Consulte a documentação disponível de cada mecanismo de pesquisa para obter mais detalhes sobre o envio e o uso de Sitemaps.

Voltar ao início

Última atualização: 21-nov-2016