Mesmo que você não seja um programador, ao carregar um site, você deve ter já visto na tela do seu computador estes códigos estranhos. Nesse post você vai aprender a como corrigir erro 404 e 500 e outros:
- error 404
- error 500
- redirect 301
- status 200
Mas o que esses códigos significam?
Ao carregar a página de um site, o navegador pode dar vários tipos de resposta que dão indicações sobre o estado da página e do seu site ou loja virtual.
Essas respostas são de 3 dígitos.
O Primeiro dígito identifica a categoria de resposta, os outros 2 dígitos dizem descrevem a resposta em si.
Principais ferramentas para analisar o seu site
- A plataforma gratuita Google Search Console dá uma panorâmica do seu site apontando os problemas encontrados.
- O SemRush também faz uma análise do seu site evidenciando os pontos que precisam de melhorias. É importante destacar que nem sempre o SemRush consegue rastrear todos os problemas.
- O Screaming Frog também faz uma varredura do seu site por inteiro e te entrega um relatório que você pode extrair em excel ou outro formato de planilha.
Mas para ter certeza que o crawler (motor de pesquisa) entre em cada cantinho do seu site, você tem que assegurar que ele não está bloqueando os robôs que o lê.
Por exemplo, o SemRush é um emulador de motor de pesquisa e não um motor de pesquisa em si.
Você tem que ter cuidado em configurar o seu site de forma que o motor emulador do SemRush consiga entrar em todos os lugares do site para uma análise correta.
Às vezes o SemRush chega a apontar erros que não existem de verdade, simplesmente porque o motor não teve acesso adequado ao seu site.
Como configurar o acesso aos motores de pesquisa
O acesso dos motores de pesquisa ao site é regulado pelo arquivo robots.txt. Esse é um arquivo de texto que fica na raiz do site e dá indicações aos ‘crawlers’ (robôs de busca) em quais páginas do site entrar, quais considerar para dar uma autoridade ao site, etc.
Essas indicações entram no que é chamado de ‘Robots Exclusion Protocol’ (protocolo de exclusão de robôs).
Para dar acesso adequado, precisa configurar oportunamente os seguintes arquivos:
- robots.txt – onde você indica o tipo de acesso que quer dar a qualquer tipo de crawler (o bot do motor de pesquisa). Para nós entendermos, é onde você insere as instruções noindex, disallow. Para ver como está configurado o robots.txt do seu site, basta digitar a URL: meu-site.com/robots.txt.
IMPORTANTE: obviamente meu-site.com é puramente para fim de exemplo. Precisa inserir o nome do seu site.
Assim verá uma lista de comandos configurados no seu robots.txt, ou seja, quais partes do seu site não estão sendo indexadas pelo Google (ou outro motor de pesquisa), entre outras informações.
Veja neste vídeo o que significa noindex, nofollow e disallow
- .htaccess – é um file na raiz do seu domínio para a comunicação direta com o servidor, aqui você configura, entre outras coisas, os redirecionamentos 301, 302, etc (veja mais na frente no artigo o que isso significa).
O ponto ‘.’ antes de htaccess não é um erro de digitação. Simplesmente significa que estamos falando de um file de comunicação com o servidor.
Voltamos às categorias de respostas e o tipo delas.
As categorias de respostas podem ser
- 5xx
- 4xx
- 3xx
- 2xx
5xx – o 5 na frente indica um erro do servidor
A resposta mais conhecida nessa categoria é a 500, que significa que tem um problema de acesso ao conteúdo no servidor.
Nesse caso, não adianta deixar o post super otimizado se primeiramente não for resolver o problema de resposta no servidor.
A causa mais comum desse tipo de erro é o tempo de resposta do servidor.
Isso pode acontecer porque você está compartilhando o acesso ao servidor com outros usuários e ao mesmo tempo. Nesse caso o Sistema Operacional do servidor não consegue lidar de forma eficiente com todas as demandas no mesmo lugar.
É como se no mesmo computador você quisesse entrar na mesma pasta de vários lugares, você vai abrindo a mesma pasta várias vezes, até que uma hora o sistema trava.
Nós mesmos passamos por essa experiência no site da NoTopo e resolvemos migrando o nosso site para o servidor da Hostgator para resolver o problema de resposta do servidor.
Outra solução poderia ser alugar um espaço individual no servidor.
Neste caso o tempo de resposta será ótimo, mas o custo bem mais alto por ter um espaço no servidor dedicado só a você. Essa solução é aconselhada para quem tem um site com muitos acessos por dia, então um compartilhamento do espaço no servidor pode prejudicar seriamente a performance do seu site e o seu SEO no geral.
2xx – o 2 na frente indica “ação solicitada pelo cliente foi recebida”
A resposta mais conhecida desta categoria é a 200, o que significa que está tudo ok, não precisa fazer nada.
Ideal seria ter um site em que todas as páginas deem resposta 200 ao carregar.
3xx – O navegador precisa tomar medidas adicionais para completar o pedido
O código mais conhecido dessa categoria é o redirecting 301.
Por exemplo, quando queremos deletar uma página ou não queremos que seja carregada pelo navegador, precisamos direcioná-la para outra página do site.
Para fazer isso você pode usar o comando 301 para redirecionamento definitivo, ou 302 para redirecionamento temporário.
Acho que hoje em dia poucas pessoas usam o 302, então vamos focar no 301.
Como configurar o comando Redirect 301
O comando redirect 301 pode ser configurado no arquivo .htaccess, se você tiver familiaridade com o seu servidor e FTP. Ou se seu site for em wordpress, você pode inserir este comando por meio de um simples plugin.
Nós gostamos de usar o plugin quick redirect. Nesse plugin você configura o redirecionamento diretamente dentro do dashboard do wordpress, sem precisar saber como funciona o código por trás.
Todavia, para quem quiser saber o comando a inserir no .htaccess, é o seguinte:
Redirect 301 /pagina-antiga www.site-novo.com/pagina-nova.
Como entender o código do Redirecting 301
- O comando diz: faça um redirecionamento definitivo da URL site-antigo.com/pagina-antiga até a nova página no novo site site-novo.com/pagina-nova;
- O site antigo pode ser o mesmo do site novo, caso você queira só redirecionar para uma página dentro do mesmo domínio;
- O domínio da pagina antiga não precisa ser mostrado, pois o .htaccess está na raiz do domínio antigo então só deste domínio se pode tratar. Por isso que o comando começa já com /pagina-antiga;
- O domínio da página nova precisa ser especificado, uma vez que o redirecionamento pode ser feito tanto para uma página no domínio atual quanto para uma página em outro domínio.
Depois de um tempo vale a pena avaliar se essas páginas que foram redirecionadas ainda estão indexadas no Google.
Se não estiverem mais indexadas no Google, você pode remover os redirecionamentos e deixar tudo mais em ordem.
Para ver se a sua página está indexada, vá no Google e digite:
Site:site-antigo.com/pagina-antiga
O comando site: é uma query direta no index do Google.
Se a página que você procura aparece como resultado, significa que ainda está indexada. É bom deixar o redirecionamento.
Se o Google não mostrar essa página nos resultados, é provável que a página não esteja mais indexada e você pode tentar apagar o comando 301.
Cuidado pois não há certeza 100% que essa URL não volte no index do Google. Pois caso tiver um link externo a essa página, ela poderia ser indexada novamente e você precisará novamente inserir um redirecionamento 301.
4xx – erro de cliente
A resposta mais conhecida é o erro 404.
Quem trabalha com SEO refere-se a ela simplesmente como: deu um 404.
E todo mundo vai entender do que se trata.
O erro 404 significa que a página não existe.
Essa é a resposta do navegador, ou seja, ele não encontra o conteúdo da URL que você carregou. Isso acontece principalmente se o conteúdo foi removido.
Conforme comunicação oficial do Google, o erro 404 não impacta de forma direta o seu SEO.
Todavia acreditamos que um número elevado de 404 terá consequências na otimização do seu site, pois você está usando o seu crawl-budget para conteúdo que não existe.
O crawl-budget é a quantidade de URL do seu site que o Google (ou outro motor de pesquisa) consegue acessar por dia.
Veja neste vídeo o que é exatamente o Crawl-budget de um Site e como ele é importante para o SEO.
Essa quantidade depende da autoridade do seu domínio. Então você entende que se tiver um alto número de 404 você está desperdiçando o seu crawl-budget para páginas inexistentes e pode acabar reduzindo a autoridade do seu site.
…mas o que significa indexação?
Quando o motor do Google entra no seu site, ele inseri as URL que visita no próprio database.
Esse database chama Index.
Uma página é indexada quando é inserida no database do Google.
Agora imagine se o Google entra e acha um monte de erros 404, ou seja, o conteúdo não existe?
Como disse a cima várias plataformas indicam esses erros.
O Google Search Console chega a mostrar quantas URLs são acessadas e quantas indexadas.
O que fazer com uma página que dá erro 404?
A primeira resposta, a mais rápida pode ser: faça um redirecionamento 301 e pronto.
Claro um redirecionamento 301 resolve a questão para o motor, pois quando ele tenta acessar a URL sem conteúdo, antes de carregá-la, vai diretamente para a redirecionada.
Mas tem um pouquinho mais que isso.
Nas plataformas de análise (como Google Search Console) você pode ver de onde veio o link que redirecionou a essa URL.
Todavia tem que ter um cuidado, pois nem sempre essas plataforma identificam os links externos que levam a essa URL com erro 404.
Por exemplo o Screaming Frog analisa só as páginas a partir de links internos, então se uma URL é apontada somente por links externos o Screaming Frog não vai conseguir pegar esse 404.
Já no Google Search Console você vai ter algumas indicações de links de plataformas que você mesmo gerencia (Pinterest, Linkedin, Facebook, etc).
Se você tem como alterar esses links, mais do que redirecionar o 404 para outra página, é melhor tirar mesmo esse link para uma página que não existe. Assim você deixa tudo limpinho.
Caso você não tenha como controlar esse link, pois vem de fontes externas, ai sim o redirect 301 é necessário.
Conclusão
Sempre mais estamos vendo como um trabalho de SEO não é só encher o site de palavras-chave. Antes de fazer isso precisamos passar pela fase higiênica do SEO, onde avaliamos as partes mais técnicas.
A análise de respostas ao carregamento das páginas é só uma parte dessa otimização higiênica, talvez chatinha, mas necessária.
Se quiser entender mais sobre esse tipo de análise ou se você teve uma experiência diferente ou quiser complementar e opinar esse artigo, deixe um comentário aqui embaixo.
Muito interessante o artigo, coisas assim é que valem a pena
a leitura!