O que é o Google Sitemaps?
. A novidade agora é o Google Sitemaps.
Ele ainda é experimental, mas a idéia é informar ao Google toda vez que
o seu site é atualizado. Um "mapa do site" informará ao Google as
mudanças e com isto permitirá mais agilidade na indexação. Ao invés do
Google varrer a web atrás de novidade, bastara ele consultar o Sitemap
para saber se houve uma atualização.
Dicas sobre o Google Sitemaps
Para se extrair o melhor do Google Sitemaps,
é necessário que se gere um arquivo XML (Extensible Markup Language)
para transmitir ou enviar qualquer atualização de informações em seu
site para o Google. Os arquivos XML estão por toda a parte, inclusive
na página inicial da MR2. Eles são visualmente reconhecidos pelo
logotipo XML na cor laranja e geralmente associados aos Blogs, que
utilizam bastante o XML/RSS para divulgar seus conteúdos para o público
interessado.
Um dos mais interessados na difusão dessa facilidade é o Google.
Criando e estimulando o emprego do Sitemaps, o Google convoca os webmasters a assumir o processo de indexação e de atualização de seus sites. Basicamente, fazendo o trabalho do próprio Google!
Mas esta é uma iniciativa do bem. Com a rápida proliferação de sites, a
tarefa de indexar todo este material e de mantê-lo atualizado torna-se
um desafio cada vez maior, mesmo para mecanismos de busca que disponham
dos recursos e da tecnologia do Google. Com o Google Sitemaps, os
webmasters poderão se encarregar do processo de atualização e confiar que seus sites serão analisados pelo Google e lá indexados com as informações mais atualizadas.
Mas não se deve pensar que o Sitemaps favorecerá o ranking dos sites no Google.
Os webmasters continuarão a competir pelas principais posições com os
outros sites indexados pelo Google. Entretanto, com o Sitemaps, poderão
ter a certeza de que todas as páginas do site serão visitadas,
atualizadas, e indexadas mais rapidamente.
Existem outras vantagens na utilização do Google Sitemaps.
Para explicá-las melhor e de modo simples, consideremos que seu arquivo
XML, utilizado para fins do Sitemaps, tenha o seguinte código para cada
uma de suas páginas na web:
<url>
<loc>http://www.yoursite.com/</loc>
<priority>1.0</priority>
<lastmod>2005-07-03T16:18:09+00:00</lastmod>
<changefreq>daily</changefreq>
</url>
Juntamente
com a tag "url", ao início e no fim do código, aliada à indicação da
versão de seu XML, este é basicamente o formato de seu arquivo XML. O
tamanho do arquivo dependerá do número de páginas de seu site tenha.
Observemos este arquivo XML mais de perto
location (loc ou localização) - http://www.seusite.com.br - nome de sua página na web
priority (ou prioridade): você define a prioridade que deverá ser
considerada pelo Google para cada página. Suas prioridades para cada
página poderão ser as seguintes: 0.0 para a menos importante; 1.0 para
a mais prioritária; 0.5 para as que tiverem importância mediana. É um
ranking definido por você e referido apenas ao seu site. Mas que não
afeta a posição real de suas páginas no Google. Então, porque a
definição dessa prioridade é importante? Ora, certas páginas de seu
site são mais relevantes do que outras (a página "home", a mais
lucrativa, a página de login etc.). Desse modo, se você pré-definir a
prioridade de cada uma delas, contribuirá para ampliar a respectiva
importância dentro do Google, que as listará segundo a ordem de
relevância que você arbitrar.
lastmod (última modificação):
quando você atualiza a sua página, o registro da data em que ocorreu a
mudança evita trabalho ao Google, pois não re-indexará as páginas que
se mantiverem inalteradas.
changefreq (freqüência da modificação):
você poderá informar ao Google qual a periodicidade com que atualiza as
suas páginas: nunca, semanalmente, diariamente, a cada hora, e assim
por diante. Se você atualiza com muita freqüência as suas páginas, esta
informação é de extrema importância.
Qual a necessidade de um Gerador de Código XML?
Para que o arquivo XML de seu site seja constantemente atualizado, você
precisará de um gerador que realize a busca em seu site, liste todas as
URL e, automaticamente, alimente o Google com essas informações.
Existe um monte desses geradores por aí. Cada um apresenta um modo
próprio para a geração de arquivos sitemap, no formato XML.
Provavelmente, muitos outros estão surgindo enquanto você lê estas
linhas. Mas observemos as três maneiras de se gerar um arquivo XML.
A maneira mais difícil - O Gerador Python, do próprio Google
Difícil é uma expressão relativa, caso você conheça o seu servidor como
a palma de sua mão, assim como o processo de instalação de scripts.
Caso contrário ... Na realidade, o Google oferece um link para o
gerador de arquivo XML do próprio Google, para que você proceda ao
download e instale o arquivo em seu servidor. Uma vez feito isso, o
arquivo carregará o sitemap referido às páginas de seu site e informará
ao Google, de modo automático.
Para que este gerador trabalhe direito, a versão Python 2.2
deve estar previamente instalada em seu servidor - e muitos servidores
não dispõe desta facilidade. Se você sabe bem o que está fazendo, então
esta é a melhor das opções para instalar o Google Sitemap.
Você não necessitará de uma conta no Google para usar o Sitemaps, mas
será instado a fazê-lo para que possa acompanhar o progresso de seu
sitemap e acessar informações de diagnóstico. Se você já dispuzer de
outra conta no Google, como gmail, Google Alerts etc., basta usá-la e
habilitá-la para que dela acompanhe todo o processo.
Para incluir o seu arquivo de sitemap por meio de uma solicitação em
HTTP, envie sua solicitação para a seguinte URL:
https://www.google.com/webmasters/sitemaps/sitestatus?hl=pt-BR
A maneira mais fácil - Um Gerador Online
Estes Geradores também proliferam por toda parte e o Google os divulga
em seu site. Procure-os na Lista do Google de Geradores produzidos por
Terceiros.
Um dos mais fáceis de se usar está localizado em www.xml-sitemaps.com.
Com muita rapidez, este gerador online indexa até 500 páginas e lhe
propicia um arquivo XML de sitemap, o mesmo que o Google precisará para
indexar o seu site. Ele vasculha o seu site e indexa todas as páginas
em um arquivo XML que você poderá baixar no formato comprimido (ou não)
e efetuar dentro dele algumas pequenas mudanças, para incluir dados
como prioridade, freqüência de atualização etc.
Isto feito, basta fazer o upload do arquivo para o diretório-raiz do
servidor (aonde seu site está localizado fisicamente). Então notifique o Google Sitemaps de seu arquivo XML.
Naturalmente, a única desvantagem, se você inclui regularmente novas páginas em seu site,
é que também precisará incluir estas páginas em seu arquivo sitemap
XML. Isto não deverá constituir-se em problema, a menos que você
adicione páginas diariamente em seu site - então necessitará de uma
solução baseada em PHP ou no gerador Python, para que o trabalho ocorra
de modo automático.
O Google ainda é o maior motor de procura na WEB;
então, este é o principal motivo para que se tenha páginas indexadas e
rapidamente atualizadas e a razão de se utilizar o Google Sitemaps. Se
você deseja que seu site se mantenha competitivo, provavelmente este é
um dos caminhos a seguir.
Foram inseridos também novos serviços.
- Crawl info: Veja quando o Googlebot visitou pela última vez o seu site. Ele mostra também urls que não conseguiu indexar.
- Robots.txt file validation: Teste se o seu arquivo de Robots.txt e veja se ele esta com problemas.
- Website content: Veja quais são os principais conteúdos do seu site e veja os textos âncora que aponta para vocês.
- Top queries: Vejas as principais buscas que levam ao seu site.
- Indexing information:
Veja como seu site está indexados e que páginas estão incluídas nele.
Ele ainda aponta páginas com problemas para que possam ser corrigidas.
XML Sitemap Generator
Um simples mais poderoso gerador online de sitemaps para o novo beta proposto pelo Google. (em inglês)
http://www.xml-sitemaps.com/