Canonical URL Tag: Solução para Conteúdo duplicado e Redirect 301 via HTML – Parte 1

22 Comentários »

GoogleYahoo!MSN uniram forças na tentativa de melhorar a identificação e tratamento de conteúdos duplicados na web. Para tal, as três maiores empresas de Search do mundo acabaram de anunciar suporte a uma nova tag HTML: <link rel=”canonical” href=”URL” />. Na verdade, a tag em si não é nova. O que é novidade é o atributo rel=”canonical”.

Aprenda mais sobre Canonical URL Tag e outros aspectos de SEO no nosso curso presencial.

Funcionamento

Canonical URL Tag, a qual deve ser inserida no header de uma página HTML, possui uma estrutura simples, com apenas dois atributos: rel e href. O primeiro atributo é fixo e deve ter o valor “canonical”; já o href pode variar mas nada mais é do que a URL que você sugere aos buscadores como sendo a preferencial dentre as que contém conteúdo semelhante ou duplicado.

Ex: <link rel=”canonical” href=”https://www.seomaster.com.br/consultoria-seo.html” />

O exemplo acima informa ao Google, Yahoo! e MSN que a página onde a tag está inserida é uma cópia da página https://www.seomaster.com.br/consultoria-seo.html. Isto significa que todos os créditos, links e métricas atribuídos à página que possui a tag em questão devem ser passados para a página indicada no atributo “href”.

Em termos de SEO, o emprego do atributo rel=”canonical” é bastante similar à utilização do redirecionamento 301. Porém, existem algumas diferenças:

  1. A Canonical URL Tag serve apenas para os mecanismos de busca, isto é, não há o redirecionamento propriamente dito (mudança de URL) como acontece com o redirect 301;
  2. Esta tag não funciona para redirecionamentos entre páginas de diferentes domínios.

A presença de conteúdo duplicado pode gerar alguns problemas e dificuldades para os mecanismos de busca, como por exemplo:

  1. Desorientação na hora de atribuir os créditos (anchor text, PageRank, etc.) para uma única página ou dividir entre as várias URLs;
  2. Indecisão para definir qual página é a mais importante (ou original);
  3. Dificuldades na hora de decidir que páginas adicionar ou remover de suas bases e qual seria o resultado mais relevante para uma pesquisa.

Quando isto acontece, não só os mecanismos de busca são prejudicados, mas seu site também sofre prejuízos, pois perde rankings e, consequentemenre, recebe menos acessos dos buscadores. Para evitar tais problemas, você pode utilizar a Canonical URL Tag a fim de sugerir às ferramentas de busca qual seria a URL preferencial dentre todas aquelas com conteúdo igual ou semelhante.

Por exemplo, vamos supor que existam várias páginas com conteúdo semelhante ou duplicado e que a URL preferencial seja http://www.exemplo.com.br/produtos.php. Os motivos para que exista conteúdo duplicado podem ser vários, como:

  1. http://www.exemplo.com.br/produtos.php?sessionID=90329403 (identificadores de sessões de usuários)
  2. http://www.exemplo.com.br/produtos.php?source=4 (parâmetros de rastreamento)
  3. http://www.exemplo.com.br/produtos.php?categoria=promocao&ord=asc (parâmetros de categorias ou de ordenação)
  4. http://www.exemplo.com.br/print/produtos.php?categoria=promocao (páginas para impressão)

Para evitar problemas como estes, bastaria adicionar a tag canônica no cabeçalho das quatro URLs anteriores, definindo qual é a página preferencial dentre todas com conteúdo duplicado. Para este exemplo, a tag ficaria desta forma:

<link rel=”canonical” href=”http://www.exemplo.com.br/produtos.php” />

Sendo assim, os mecanismos de busca saberiam que todas as URLs acima são, na verdade, cópias de http://www.exemplo.com.br/produtos.php e passariam todos os créditos, antes distribuídos entre várias páginas, para uma única URL.

Obs: Vamos aguardar um pouco antes de implementar suporte à Canonical URL Tag no SEO Master Free Scanner. Afinal, importantes mudanças em termos de SEO como esta sempre sofrem alterações posteriores ao seu lançamento. Basta lembrar os casos do NoFollow e Sitemaps.

Para finalizar, não adianta sair por aí tentando redirecionar URLs que apresentem conteúdos diferentes, pois as Search Engines verificarão se as páginas são realmente semelhantes ou duplicadas, antes de aceitar a sugestão passada na Canonical Tag.

Se você gostou do nosso blog, assine o RSS ou então receba os posts por e-mail.

 

22 comentários para “Canonical URL Tag: Solução para Conteúdo duplicado e Redirect 301 via HTML – Parte 1

  1. Será que é um recurso válido para ser utilizado em páginas que apresentam o mesmo assunto, mas que não seja necessariamente uma página duplicada?
    É muito comum que apareça sites com mais de uma página que fala do mesmo assunto, e isso gera uma concorrência dentro do próprio site.
    Bom, como foi dito no post, acho que é muito cedo para utilizar, vamos esperar mais um pouco… abraço a todos.

  2. @Adm obrigado e volte sempre!

    @Flávio o fato de página diferentes apresentarem conteúdo parecido e disputarem as mesmas palavras-chave gera Keyword Canibalization e, neste caso, existem técnicas que podem ser usadas em tal situação: http://www.seomoz.org/blog/how-to-solve-keyword-cannibalization. Com relação a utilizar Canonical Tag para páginas não exatamente duplicadas, Google e cia dizem apenas que aceitam “pequenas diferenças”, porém ainda não sabemos quais as possibilidades e que quantidade podem ser apresentadas.

    Abraço.

  3. Parabéns pelo site, muito bom mesmo.
    Não sei se não achei, mas queria saber o seguinte aproveitando o post sobre redirect. O Free scanner aponta sempre a falta da palavra-chave na URL, no meu caso, estou testando a HOME, que seria uma “index.php”. Se eu criar uma index simples com apenas um redirect para uma página que contenha a palavra na URL, passa a ser uma técnica “válida”, isto é, ela já não é mais a primeira página e sim a segunds. Os buscadores seguem o redirect sem problemas?

    Obrigado

  4. @Fábio utilizando um Redirect 301 (nem pense em javascript), é possível que esta técnica tenha algum benefício em relação aos buscadores. Porém, pensando no usuário, tente manter suas URLs o mais simples possível, principalmente quando falamos da página principal de um site. Neste caso, sugiro a estrutura domínio + extensão apenas.

    Abraço

  5. Meu caso é parecido tinha uma url comum que fiz um redirecionamento 301 para uma mais amigável, porem a ferramenta para webmaster acusa conteúdo complicado do url simples para o novo url redirecionado, o canonical na página nova resolveria o problema? Obrigado.

  6. @edgar conteúdo complicado?! Não seria duplicado? ;] Se você fez o redirecionamento 301 da maneira correta, espere um pouco que o conteúdo duplicado não vai ser mais acusado.

    Grande abraço!

  7. Olá boa tare, o meu problema é que a google está procurando meu domínio com e sem o www, no caso estão sendo dois domínios e eu não sei como deixar só no www, será que é porque eu inscrevi meu blog em vários buscadores?

  8. Parabéns pelo post, mas ainda tenho uma dúvida!
    Meu site tem como página principal a /index.html, então posso acessá-la pela URL normal (http://meudominio/) e também com (http://meudominio/index.html). Ou seja, a página se repete (duplicado).

    Contudo munha dúvida é: coloquei na /index.html o rel=”canonical” href=”http://meudominio.com.br/”, está correto?

    Obrigado pela atenção desde já!

    1. Olá Hudson,

      nesse caso utilizamos o redirecionamento HTTP 301, pois é exatamente a mesma página com o mesmo conteúdo exibido em duas URLs diferentes.
      A canonical é para situações com páginas com conteúdos semelhantes, exibidos de forma diferente. Geralmente ela é mais utilizada em e-commerces, para as páginas de filtro/ordenação de produtos, ok?

      Até mais!

  9. meus amigo vc esta de parabéns custei intender, vc explica de um forma simples é inteligente…… show.!!!!!!!!!

  10. Meu caso pare que ainda não entrou em pauta.
    Fiz uma total modificação em meu site, plataforma, páginas e URL principal, era sem www alterei para com www no Google Webmaster Tools.
    Criei páginas parecidas até algumas com a mesma URL.
    Quando fui verificar no Google Webmaster Tools havia 313 erros 404 e vários com URLs apontando para a mesma página de formas diferentes decorrentes de ligar e desligar o ModRewrite do Apache. (DUMMIE)
    Exemplo1: blog/nome-da-pagina.html
    Exemplo2: index.php/blog1/item/nome-da-pagina

    O redirecionamento vou fazendo, isso não é problema, mas acontece que estou ficando com páginas com Titulo e Meta Description duplicados.

    Alguma solução para isso?

    Muito obrigado.

  11. E no caso de vários parâmetros em vários posts… matérias, tipo html?m=1 ou ?m=1&_escaped_fragment_= e tem muitas assim, aonde colocar a tag canonical?

  12. Tipo é um blog e não uma página de produtos e todos modificam o jeito da página original, e tem post que tem 6 parâmetros diferentes… e lá no ferramentas webmaster add parâmetros de url não funciona… então como faz?? pra achar só o post raiz e não essas “bifurcações” que deixam a página parecendo mobile no pc!!! Me ajudaaa pleaseeee

    1. Olá Lucy,

      A solução para esse tipo de problema vai depender da tecnologia que está usando utilizada para blog.
      Isso acontece porque a implementação do código vai variar em cada caso.

      Se o blog for WordPress, o plugin WordPress SEO by Yoast já resolve a maioria dos casos de canonical.

      De qualquer forma, a solução pensando em SEO é apontar o canonical para o post original.
      Poderia me informar um exemplo real onde apareçam muitos parâmetros na URL que altere o conteúdo do post?

  13. Olá Pessoal,

    Estou com uma dúvida muito parecida com a Lucy, vamos aos detalhes:

    Tenho um artigo publicado onde a palavra de cauda longa em foco é: “O que é PMI ou Project Management Institute”. Importante: era sobre isso que eu queria escrever.

    Entretanto, percebi pela análise do Google Adwords, que o termo de cauda longa “PMI Institute” tem muito mais pessoas pesquisando que o “O que é PMI”. Importante: gostaria de capturar parte dessas pesquisas do usuário para meu site.

    Logo, minha dúvida é sobre o que fazer:
    1) Criar outro artigo com a palavra de cauda longa “PMI Institute” com o mesmo conteúdo (99,5%) do artigo já existente e otimizá-lo para isso e, NÃO usar usar a URL Canonical;

    2) Criar outro artigo com a palavra de cauda longa “PMI Institute” com o mesmo conteúdo (99,5%) do artigo existente, usando essas palavras para fazer a otimização da página e, INSERIR a URL Canonical do artigo anterior, pois é para lá que eu gostaria de enviar os visitantes.

    Está certo o meu entendimento sobre o uso da URL Canonical?

    Obrigado e abraços,

  14. Pessoal… coloquei uma dúvida aqui fazem quase duas semanas e até agora não há publicação dela nem resposta…. Alguma previsão?
    Abraços,

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

SP São Paulo (11) 3042-2224
RJ Rio de Janeiro (21) 3942-5555 Travessa Domingos Cândido Peixoto, 501, Casa 1, Icaraí, Niterói-RJ