O Google está cada vez mais, melhorando suas ferramentas para webmasters, e anunciou hoje, 7 de junho, no blog Central do Webmaster, um novo recurso que cria relatórios de URLs com erros de rastreamentos “Soft 404″. Leia mais…
Olá, leitor do blog NuvemSEO.net, semana passada infelizmente ficamos sem atualização de posts aqui, devido à problemas técnicos de conexão, mas agora com tudo normalizado, vamos continuar firme!
Trata-se de ferramentas para nos ajudar a descobrir páginas com erros que podem ser 404 verdadeiros ou não, e consertá-las. Ou seja, um servidor responde com uma mensagem: “200 ok” (resposta para página retornada com sucesso), mas na realidade deveria retornar um error 404. É aí que nos prejudica tal erro.
O fato de não termos certeza sobre a exatidão do erro 404, pode trazer alguns probleminhas para nosso site, em se tratando de rastreamento dos robôs de busca, vejamos…
Quando um usuário faz uma requisição de uma página em um navegador web, ou quando o Googlebot executa o rastreamento de uma página, o servidor retorna um código de status HTTP como resposta àquela solicitação.
Os códigos de status fornecem informações sobre a situação daquela solicitação. Importante: Esse código também fornece ao Googlebot informações sobre o seu site e sobre a página solicitada.
Obs: Caso não queira ler toda a lista de códigos de respostas do servidor, vá para o final do artigo e leia mais sobre os Erros Soft 404!
Exemplos de códigos de status mais comuns:
- 200 – o servidor retornou a página com sucesso.
- 404 – a página solicitada não existe.
- 503 – o servidor está temporariamente indisponível.
Abaixo vai segue a lista completa dos códigos de status de HTTP
1xx (Resposta provisória)
Códigos de status que indicam uma resposta provisória e exigem que o solicitante realize uma ação para continuar.
| Código | Descrição |
|---|---|
| 100 (Continuar) | O solicitante deve continuar com a solicitação. O servidor retorna esse código para indicar que recebeu a primeira página de uma solicitação e que está esperando o restante. |
| 101 (Mudando protocolos) | O solicitante pediu ao servidor para mudar os protocolos e o servidor está reconhecendo a informação para, então, executá-la. |
2xx (Bem-sucedido)
Códigos de status que indicam que o servidor processou a solicitação com sucesso.
| Código | Descrição |
|---|---|
| 200 (Bem-sucedido) | O servidor processou a solicitação com sucesso. Em geral, isso indica que o servidor forneceu uma página que foi solicitada. Caso você veja esse status no seu arquivo robots.txt, o Googlebot recuperou o arquivo com sucesso. |
| 201 (Criado) | A solicitação foi bem-sucedida e o servidor criou um novo recurso. |
| 202 (Aceito) | O servidor aceitou a solicitação, mas ainda não a processou. |
| 203 (Informação não autorizável) | O servidor processou a solicitação com sucesso, mas está retornando informações que podem ser de outra fonte. |
| 204 (Sem conteúdo) | O servidor processou a solicitação com sucesso, mas não está retornando nenhum conteúdo. |
| 205 (Reconfigurar conteúdo) | O servidor processou a solicitação com sucesso, mas não está retornando nenhum conteúdo. Ao contrário da 204, esta resposta exige que o solicitante reconfigure o modo de exibição do documento (por exemplo, limpe um formulário para uma nova entrada). |
| 206 (Conteúdo parcial) | O servidor processou uma solicitação parcial GET com sucesso. |
3xx (Redirecionado)
Uma ação adicional é necessária para completar a solicitação. Esses códigos de status são usados frequentemente para redirecionamentos. O Google recomenda usar menos de cinco redirecionamentos para cada solicitação.
Use as Ferramentas para webmasters para ver se o Googlebot está com dificuldades ao rastrear as suas páginas redirecionadas. A página Erros de rastreamento em Diagnósticos lista os URLs que o Googlebot não conseguiu rastrear devido a erros de redirecionamento.
| Código | Descrição |
|---|---|
| 300 (Múltipla escolha) | O servidor tem muitas ações disponíveis com base na solicitação. O servidor pode escolher uma ação com base no solicitante (user-agent) ou apresentar uma lista para que o solicitante escolha uma ação. |
| 301 (Movido permanentemente) | A página solicitada foi movida permanentemente para um novo local. Quando o servidor retornar essa resposta (como uma resposta para uma solicitação GET ou HEAD), ele automaticamente direcionará o solicitante para o novo local. Você deve usar esse código para fazer com que o Googlebot saiba que uma página ou um site foi permanentemente movido para um novo local. |
| 302 (Movido temporariamente) | O servidor está respondendo à solicitação de uma página de uma localidade diferente, mas o solicitante deve continuar a usar o local original para solicitações futuras. Esse código é semelhante ao 301 com relação a uma solicitação GET ou HEAD, pois direciona automaticamente o solicitante para um local diferente. No entanto, você não deve usá-lo para informar ao Googlebot que uma página ou um site foi movido, porque o Googlebot continuará rastreando e indexando o local original. |
| 303 (Consultar outro local) | O servidor retornará esse código quando o solicitante precisar fazer uma solicitação GET separadamente para outro local para obter a resposta. Para todas as outras solicitações (com exceção de HEAD), o servidor direciona automaticamente para o outro local. |
| 304 (Não modificado) | A página solicitada não foi modificada desde a última solicitação. Quando o servidor retornar essa resposta, ele não retornará o conteúdo da página.
Você deverá configurar o servidor para retornar essa resposta (chamada de cabeçalho If-Modified-Since HTTP) quando uma página não tiver sido alterada desde a última vez em que o solicitante fez o pedido. Isso economiza a transmissão de informações e despesas gerais, pois o servidor pode informar ao Googlebot que uma página não foi alterada desde o último rastreamento. . |
| 305 (Utilizar proxy) | O solicitante poderá acessar a página solicitada utilizando um proxy. Quando o servidor retornar essa resposta, também indicará qual proxy o solicitante deverá usar. |
| 307 (Redirecionamento temporário) | O servidor está respondendo à solicitação de uma página de uma localidade diferente, mas o solicitante deve continuar a usar o local original para solicitações futuras. Esse código é semelhante ao 301 com relação a uma solicitação GET ou HEAD, pois direciona automaticamente o solicitante para um local diferente. No entanto, você não deve usá-lo para informar ao Googlebot que uma página ou um site foi movido, porque o Googlebot continuará rastreando e indexando o local original. |
4xx (Erro de solicitação)
Esses códigos de status indicam que provavelmente houve um erro na solicitação que impediu que o servidor a processasse.
| Código | Descrição |
|---|---|
| 400 (Solicitação inválida) | O servidor não entendeu a sintaxe da solicitação. |
| 401 (Não autorizado) | A solicitação requer autenticação. O servidor pode retornar essa resposta para uma página que necessita de login. |
| 403 (Proibido) | O servidor recusou a solicitação. Se você notar que o Googlebot recebeu esse código de status ao tentar rastrear páginas válidas do seu site (isso pode ser visto na página Rastreamento da web em Diagnósticosnas Ferramentas do Google para webmasters), é possível que o seu servidor ou host esteja bloqueando o acesso do Googlebot. |
| 404 (Não encontrado) | O servidor não encontrou a página solicitada. Por exemplo, o servidor retornará esse código com frequência se a solicitação for para uma página que não existe mais no servidor.
Se você não tiver um arquivo robots.txt no seu site e notar esse status na página robots.txt da guia “Diagnóstico” nas Ferramentas do Google para webmasters, esse será o status correto. No entanto, se você tiver um arquivo robots.txt e notar esse status, esse arquivo poderá estar nomeado incorretamente ou no local errado. Ele deve estar no nível superior do domínio e ter o nome robots.txt. Se você visualizar esse status para URLs que o Googlebot tentou rastrear (na página de erros HTTP da guia Diagnóstico), provavelmente o Googlebot seguiu um link inválido a partir de alguma outra página (que pode ser um link antigo ou apresentar erros de digitação). |
| 405 (Método não permitido) | O método especificado na solicitação não é permitido. |
| 406 (Não aceitável) | A página solicitada não pode responder com as características de conteúdo solicitadas. |
| 407 (Autenticação de proxy necessária) | Esse código de status é semelhante ao 401 (não autorizado), mas especifica que o solicitante deve autenticar usando uma proxy. Quando o servidor retornar essa resposta, também indicará qual proxy o solicitante deverá usar. |
| 408 (Tempo limite da solicitação) | O servidor atingiu o tempo limite ao aguardar a solicitação. |
| 409 (Conflito) | O servidor encontrou um conflito ao completar a solicitação. O servidor deve incluir informações sobre o conflito na resposta. O servidor pode retornar esse código em resposta a uma solicitação PUT que entre em conflito com uma solicitação anterior, além de uma lista de diferenças entre as solicitações. |
| 410 (Desaparecido) | O servidor retornará essa resposta quando o recurso solicitado tiver sido removido permanentemente. É semelhante ao código 404 (Não encontrado), mas às vezes é usado no lugar de um 404 para recursos que tenham existido anteriormente. Se o recurso foi movido permanentemente, você deve usar o código 301 para especificar o novo local do recurso. |
| 411 (Comprimento necessário) | O servidor não aceitará a solicitação sem um campo de cabeçalho “Comprimento-do-Conteúdo” válido. |
| 412 (Falha na pré-condição) | O servidor não cumpre uma das pré-condições que o solicitante coloca na solicitação. |
| 413 (Entidade de solicitação muito grande) | O servidor não pode processar a solicitação porque ela é muito grande para a capacidade do servidor. |
| 414 (o URI solicitado é muito longo) | O URI solicitado (geralmente um URL) é muito longo para ser processado pelo servidor. |
| 415 (Tipo de mídia incompatível) | A solicitação está em um formato não compatível com a página solicitada. |
| 416 (Faixa solicitada insatisfatória) | O servidor retorna esse código de status se a solicitação for para uma faixa não disponível para a página. |
| 417 (Falha na expectativa) | O servidor não pode cumprir os requisitos do campo “Expectativa” do cabeçalho da solicitação. |
5 (Erro no servidor)
Esses códigos de status indicam que o servidor teve um erro interno ao tentar processar a solicitação. Esses erros tendem a ocorrer com o próprio servidor, e não com a solicitação.
| Código | Descrição |
|---|---|
| 500 (Erro interno do servidor) | O servidor encontrou um erro e não pode completar a solicitação. |
| 501 (Não implementado) | O servidor não tem o recurso necessário para completar a solicitação. Por exemplo, o servidor poderá retornar esse código quando não reconhecer o método da solicitação. |
| 502 (Gateway inválido) | O servidor estava operando como gateway ou proxy e recebeu uma resposta inválida do servidor superior. |
| 503 (Serviço indisponível) | O servidor está indisponível no momento (por sobrecarga ou inatividade para manutenção). Geralmente, esse status é temporário. |
| 504 (Tempo limite do gateway) | O servidor estava operando como gateway ou proxy e não recebeu uma solicitação do servidor superior a tempo. |
| 505 (Versão HTTP incompatível) | O servidor não é compatível com a versão do protocolo HTTP usada na solicitação. |
Fonte da tabela: GWT
Erro Soft 404 no Webmaster tools
Os novos recursos de rastreamento de Erro Soft 404s do Webmaster tools do Google podem nos ajudar a encontrar páginas que exibem um código de resposta do servidor como “200 ok”, ou seja, a página foi retornada com sucesso mas, na verdade, teria que mostrar um “Error 404 not found”, pois a página não existe.
Para chegar ao relatório de erros providos pela ferramenta segue-se o caminho:
>Painel do Webmaster tools/Diagnóstico/Erros de rastreamento
Nas opções seguintes a “Mostrar URLs:” temos “Inacessíveis“, “Não encontrados 404” e “Restringido pelo arquivo robots.txt”.
Os erros 404 verdadeiros podem ser resolvidos de algumas maneiras como redirecionamentos 301, confecção de uma página 404 atraente e sugestiva ao conteudo do site, etc.
Agora no caso de respostas com mensagens de erros falsas, ou seja, incorretas, é aí que sofremos a desvantagem em relação ao rastreamento, uma vez que o Googlebot deixará de rastrear páginas importantes por causa do tempo perdido com tais páginas.
O Googlebot tem um tempo determinado para rastrear nossas páginas, e ele anda muito apressado, logo não deve se embaraçar com URLs com erros não é mesmo? Pois assim, uma página importante poderia ficar sem atualização no índice do crawler.
Entre no seu painel do Google Webmaster Tools e gere um relatório de seu site, logo verá algumas ou até vários URLs e poderá entender melhor o tipo de erro exibido pelo Google, e sugestões para resolvê-los.
Deixe um comentário aqui, para aprendermos mais sobre otimização de URLs e rastreamentos, será bem gratificante!
Obrigado pela visita!
Alvimar Olímpio
07/06/10


Nenhum comentário recebido(s)
Participe comentando!