Como indexar o site com o Relatório de Cobertura do Google

[Use como Guia] Você precisa saber Como indexar o site com o relatório de cobertura do Google, pois ao fazer isso, você está dando um “Xeque-Mate” e não tem outra… os “crawlers” vão correr atrás de seu site.

Esse Relatório de Pesquisa não precisar levar você para o hospício, mas você precisa manter pelo menos uma vez por mês seus olhos fixos nele para fazer melhorias necessárias.

Essa é a hora em que alguns de vocês me perguntam: 

  • Onde está este relatório de cobertura?

Esse Relatório de Cobertura está localizado no Google Search Console, mais precisamente em seu índice e quando você ler este artigo e colocar em prática será uma questão “sine qua non” para os motores de plantão.

Ora, se você quer que seu site/blog cresça, não saber Como indexar o site com o relatório de cobertura do Google é um dos altos erros que nós podemos cometer.

Como indexar o site com o relatório de cobertura do Google:

Nessa ferramenta incrível, a gigante da indexação nos faz entender lo seguinte:

  • Quais as URLs que foram rastreadas e indexadas;
  • Quais não foram enviadas, porém indexadas;
  • Erros de servidor e outras informações

Mas a “cereja do bolo” é sempre a melhor parte, ou nesse caso, uma das melhores informações que podemos subtrair.

Podemos também perceber o “porquê” os crawlers decidiram indexar determinados artigos que nem mesmo foram enviados – como e porque o mecanismo faz essa escolha.

Quando você seleciona os quatro quadros da opção “Cobertura”, mais parece um sinalizador da avenida. Tudo parece relativamente muito simples e intuitivo. Observe abaixo:

Como indexar o site com o Relatório de Cobertura do Google
  • Erro: apresentadas em vermelho indicando que estas páginas não estão indexando.
  • Validadas e com avisos: Apresentadas em amarelo e conforme a quantidade vai consumir um pouco de seu tempo, mas tudo tem a sua recompensa.
  • Válidas: As verdes são as mais lindas e nos deixa orgulhosos, pois estas páginas estão indexadas.
  • Excluídas: As de cor cinza mais parece um – elas foram excluídas.

Mas, um bom candidato a SEO não se rende facilmente, nem mesmo diante de 20,8 mil páginas excluídas conforme mostra a imagem acima.

Ainda que as explicações “guulguês” sejam meio confusas, ainda assim, verás que um blogueiro não foge à luta.

Nos resta vestir a pele de um SEO e fazer o que ele faria e vamos chegar lá.

O Impacto Negativo no Relatório de Cobertura de Índice:

Antes de prosseguirmos, precisamos admitir que algumas coisas (ou muitas) na vida devem ser enterradas porque estão erradas, mas, não de graça…

Precisamos aprender com elas e tirar o máximo de proveito, pois esses erros existiram para nos colocar na linha certa e é isso que eu fiz e o que vamos fazer.

Dito isso, devemos saber que as maiores vitórias dos grandes “SEO,s”, é a zona cinzenta das derrotas que os fizeram tão grandes e requisitados.

Mas minha intensão não é formar “SEO,S” e sim, não deixar os meros mortais como eu, refém daquilo que não podemos pagar.

Vamos então fazer um pacto de insistir conosco mesmo e vamos seguir o trabalho árduo obedecendo aos critérios de prioridades.

Selecione todo o semáforo (um de cada vez) e mãos à obra. Ao fazer isso, veja quais são as ponderações do Search Console abaixo e vai por etapa.

1. URL’s Excluídas no Search Console:

Url's excluídas no Relatório de Cobertura do Google

Vamos começar então com o último quadro, o de cor cinza e veja como está a situação no exemplo que estamos seguindo – são Dados do Search Google – Relatório de Cobertura – Excluídos, para que assim, a gente possa saber Como indexar o site com o relatório de cobertura do Google

Rastreada, mas não indexada no momento3.244
Página alternativa com tag canônica adequada7.239
Excluida pela tag “noindex”4.661
Página com redirecionamento3.873
Bloqueada pelo robots.txt1.155
Não encontrado (404)514
Cópia sem página canônica selecionada pelo usuário48
Detectada, mas não indexada no momento14
Erro soft 40408
Cópia, o Google e o usuário selecionaram uma página canônica diferente03

Como a coisa está feia, em? Você vai arregar e sair correndo, ou pedir um cafezinho enquanto vamos à batalha?

Rastreadas e Não Indexadas?

Observe no Relatório que aparecem 3.244 endereços que foram detectadas e vamos resolver ou morrer tentando essa situação, pois, um número desse, mostra um total desprezo pela otimização do site

Motivos que não foram indexadas:

  • Pode ser que seja um conteúdo fraco, 
  • Sem semântica, 
  • Conteúdo desatualizado, 
  • Artigos que não passaram no filtro das dezenas de atualizações que o Google já implantou,
  • Pode ser páginas de spam dentro do login administrador, e outras situações.

Curiosamente elas (as url’s) existem, foram percebidas pelos robôs do Google. Esses registros se deram por meio de links encontrados em outros sites, enviados pelo sitemap XML ou outras situações que vamos mencionar.

Estas url’s entraram na fila para serem indexadas, mas não conseguiram serem colocadas no índice de pesquisa. Isto mostra um grande problema e inteligentemente o Google percebe que sua estrutura não está adequada. 

Então, o Googlebot olha para o blog com cerca de 1.700 artigos escritos (que é o que estamos analisando), e pergunta-se:

– Como esse blogueiro dispõe mais de 3.000 url’s num blog com menos de 2.000 artigos?

E nós podemos ficar sem resposta ou fazer uma profunda análise para saber Como indexar o site com o relatório de cobertura do Google

Se os motores de indexação encontrou um endereço, ele vai tentar indexar, porém, por algum ou alguns dos vários motivos o Googlebot não achou o conteúdo digno de ser incluído no índice. 

Aqui, cabe uma reflexão:

Quantas páginas os robôs analisam no mundo inteiro todos os dias?
Quanto tempo os robôs ficam no seu site?
Ele entra, encontra navegação ou volta pelo mesmo link?
Ele é obrigado a ficar ali analisando, analisando em um loop infinito?

Não. Definitivamente não. É como se os crawlers dissessem: 

  • Tenho mais o que fazer.

Nós temos que resolver na medida do possível, todos os empecilhos existentes para que o Googlebot ao chegar para vasculhar seu site, não ficar derrapando em links inúteis, pois, ao contrário do que se pensa, ele tem horário a cumprir. 

A pergunta ainda continua… Como corrigir isso?

Revisando cada conteúdo das páginas ali encontradas e se perguntando: Essa página precisa existir?

Como Corrigir Url’s Rastreadas e Não Indexadas:

Para resolver essa questão, podemos oferecer 3 (três) medidas a serem tomas URGENTE

1º. O primeiro passo para saber Como indexar o site com o relatório de cobertura do Google, é fazer download do Relatório e analisar os endereços e os que estiverem corretos, os artigos bem escritos e dentro dos padrões faça o seguinte:

Você vai separar as url’s corretas das outras que não deveriam estar ali nesta relação

Agora, peça a indexação manualmente indo para a opção “Visão Geral” e colando estas url’s no campo “Inspecionar…” uma a uma e pedindo para testar e depois indexar, assim, você fica sabendo como indexar o site

No momento em que publico este artigo, você pode fazer com até 500 url’s por mês.

Invista seu tempo em uma correção de longo prazo para que a arquitetura do site (incluindo estrutura de URL’s, taxonomia do site e links internos) estejam 100% corretos

2º. O segundo passo para saber Como indexar o site com o relatório de cobertura do Google é ao perceber que as url’s são estranhas, tais como mostra no caso do exemplo desse blog e referenciada na imagem abaixo:

Relatório de cobertura de urls excluídas 2022 - Rastreada, mas não indexadas

Estes endereços contêm a página que está o artigo, também toda a parte interna do admin, acessos a informações que não poderiam estar ali – são endereços que realmente devem ser excluídos o mais rápido possível.

Se você tem certeza que estas páginas não deveriam estar ali e não podem ser artigos, o que se deve fazer é colocar o código 301 ou 410 nas URL’s.

3º. O terceiro passo, é quando se trata de artigos que precisam ser indexados, mas ainda não estão totalmente editados, estão fracos e precisam serem atualizados, nesse caso, você poderá colocar uma tag “noindex” até que o conteúdo seja completamente corrigido e assim, ao retirar a tag “noindex” dela, os robôs a indexarão.

No caso do exemplo do blog, observe que o Google está detectando url’s com número de páginas (…/page/38/?s). Isso é horrível, e também outras url’s dentro das páginas de administrador (…/wp-content/uploads/…).

Ao verificar o plugin Rank Math SEO percebi que algumas configurações haviam se perdido e por isso fiz novamente a configuração para que com o tempo possa sair do console.

Cópia (Duplicada) sem página canônica selecionada pelo usuário

Qual é a Causa?

Quando isso acontece é porque o Google olha para essa página como um conteúdo duplicado, mas o editor não qualificou ou marcou aquela página como canônica.

Como há uma discrepância, o Google toma a decisão de que ela não pode ser indexada porque seu status, embora pareça canônica, não foi marcada como tal

E assim, a excluiu da indexação ao passo que nós queremos o contrário, entender para saber como indexar o site.

Como corrigir url duplicada sem marcação canonical?

Nesse relatório devemos também verificar endereço por endereço marcando claramente com o links “rel=canônicos”.

Os plugins Yoast SEO e Rank Math SEO tem opções fáceis para deixa-las marcadas.

URL Duplicada e Enviada Não Selecionada como Canônica

Qual é a Causa?

Todas estes endereços estão na mesma qualificação que as url’s do parágrafo anterior, com uma diferença, neste caso, o usuário enviou para que o Google indexasse ao contrário das outras, que vieram por rastreamento iniciado pelo próprio Google.

Geralmente esse pedido de rastreamento feito pelo usuário, deve ter sido feito pelo arquivo XML (sitemap) que é sempre bom dar uma olhada como eles está sendo gerado.

Como corrigi-lo url duplicada enviadas no Relatório de Cobertura? 

Certifique-se de que em seu mapa XML esteja sendo gerado apenas endereços canônicos, ou seja, usando rel=links canônicos.

É muito trabalho? Sim, mas saber como indexar o site é a nossa tarefa

Cópia (Duplicada), o Google Escolheu Canônico Diferente do Usuário

Porque isso acontece?

Acontece quando nós oferecemos ao Google a página canônica através do link rel=canônico, mas os motores de busca escolhe uma outra página diferente.

Isso não parece justo já que o editor fez a sinalização, mas, o motor de busca tem seus motivos e tenta entregar um conteúdo mais próximo daquilo que o pesquisador precisa.

Como corrigi-lo páginas duplicadas escolhidas diferente?

Essa é uma prioridade alta. Temos que olhar a página marcada e ver se é essa mesma que precisamos emplacar.

Caso seja, deveremos fazer uma atualização nela ou então alterar o o link rel=canônico. 

Nessa altura convém dar uma otimizada na estrutura do blog para impor maior organização e fortalecer nas pesquisas ranqueando melhor e aos poucos saber Como indexar o site com o Relatório de Cobertura do Google