Cuando se ejecuta un sitio impulsado por datos o tiene otras razones por las que un documento puede estar duplicado, es importante decir a los motores de búsqueda qué copia es la copia original, o en la jerga, la copia «canónica». Cuando un motor de búsqueda indexa sus páginas puede decir cuando el contenido ha sido duplicado. Sin información adicional, el motor de búsqueda decidirá qué página satisface mejor las necesidades de sus clientes. Esto podría estar bien, pero hay muchos casos de motores de búsqueda que entregan páginas antiguas y anticuadas porque eligieron el documento equivocado como canónico.
Índice de contenidos
Cómo especificar la página canónica
Es muy fácil indicar a los motores de búsqueda la URL canónica con metadatos en los documentos. Ponga el siguiente HTML cerca de la parte superior de su
HEAD elemento en cada página que es not canónico:
Si tiene acceso a las cabeceras HTTP (como con .htaccess o PHP), también puede establecer la URL canónica en archivos que no tengan HTML
.
HEAD
, como un PDF. Para ello, defina las cabeceras de las páginas no canónicas de esta manera:
Link: < URL de la página canónica>;;
Cómo funciona la etiqueta canónica y cuándo no
Los metadatos canónicos se utilizan como una pista para que los motores de búsqueda sepan qué página es la maestra. Los motores de búsqueda utilizan esto para actualizar su índice para hacer referencia a la copia maestra como la copia principal, y cuando entregan los resultados de la búsqueda, entregan la página que creen que es canónica.
Pero la página canónica que especifique puede no ser la página que ofrecen los motores de búsqueda. Hay muchas razones por las que esto puede suceder:
- Si la URL que usted especifica no se encuentra, los motores de búsqueda intentarán encontrar la segunda URL más relevante para entregar
- Si el motor de búsqueda cree que su sitio ha sido pirateado para añadir una URL canónica falsa, no lo usarán (por supuesto, tendrá problemas mayores en ese caso)
- Si coloca el enlace en la etiqueta, o hay alguna razón para creer que la etiqueta
HEAD
no estaba cerrada. Esto se debe a que muchos sitios web permiten a los usuarios editar el contenido de la página (dentro del elemento
BODY
), y como chupar una referencia canónica encontrada no sería de confianza también.
Lo que la etiqueta Rel=Canónica no es
Mucha gente cree que si agrega
rel=canonical enlace a una página, entonces esa página será redirigida a la versión canónica, como por ejemplo con una redirección HTTP 301. Eso no es cierto. El enlace
rel=canonical
proporciona información a los motores de búsqueda, pero no afecta a la forma en que se muestra la página ni a la redirección a nivel de servidor.
El vínculo canónico es, en última instancia, sólo una pista. Los motores de búsqueda no tienen que honrarla. La mayoría de los motores de búsqueda se esfuerzan por respetar los deseos de los propietarios de las páginas, pero al final del día, los resultados de la búsqueda son lo que hacen, y si no quieren servir a su página canónica, no lo harán.
Cuándo usar el Enlace Canónico
Como dije anteriormente, usted debe usar el enlace en cada página duplicada que no sea canónica. Si usted tiene páginas que son similares, pero no idénticas, a veces tiene más sentido cambiar una de ellas para que sea más diferente, que para hacer una canónica. Está bien marcar dos páginas que no son absolutamente idénticas como canónicas. Deben ser similares, pero usted debe nunca simplemente apuntar todas las páginas a su página de inicio. Canónico significa que la página es la copia maestra de ese documento, no cualquier tipo de enlace maestro en su sitio.
Creo que es importante repetir la última parte – nunca debes apuntar todas tus páginas a tu página principal como la página canónica sin importar cuán tentado estés de hacerlo. Hacer esto, incluso por accidente, puede causar que todas las páginas que no son canónicas (es decir, todas las páginas que no son su página de inicio y que tienen la etiqueta
rel=canonical
link on it) para ser removido de los índices de los motores de búsqueda. Esto no es Google (o Bing o Yahoo! o cualquier otro motor de búsqueda) siendo malicioso. Están haciendo lo que les pediste que hicieran – considerando cada página como un duplicado de tu página de inicio y devolviendo todos los resultados a esa página. Entonces, a medida que los clientes se frustran al terminar en su página de inicio en lugar de en un documento más relevante, esa página será menos popular y caerá en los resultados de búsqueda. Incluso si arregla el problema, puede matar los resultados de la búsqueda durante meses y no hay garantía de que las clasificaciones de su sitio se recuperen.
No debe hacer una página canónica que haya sido excluida de la búsqueda por alguna razón (por ejemplo, con la etiqueta
noindex
meta tag o excluido por el archivo robots.txt). Para que un motor de búsqueda haga referencia a una página como canónica, debe ser capaz de hacer referencia a ella en primer lugar.
Buenos lugares para usar el
rel=canonical link include:
- Sitios con URLs dinámicas – Puede usarla para definir el formato de URL que prefiera
- Sitios de comercio electrónico, especialmente en listas de productos – Cuando sus clientes cambian los criterios de clasificación, esa nueva URL no necesita ser indexada
- Contenido sindicado: los editores que utilicen el contenido que usted escribió deben incluir el enlace
rel=canonical
en sus páginas que apuntan a su documento original
.
Cuándo no usar el Enlace Canónico
Su primera opción debería ser un 301 redireccionamiento. Esto no sólo le dice al motor de búsqueda que la URL de la página ha cambiado, sino que también lleva a la gente a la versión más actualizada (y me atrevería a decir, canonicol?) de la página.
No seas perezoso. Si está cambiando la estructura de su URL, utilice alguna forma de manipulación de encabezado HTTP (como .htaccess o PHP u otro script) para agregar los redireccionamientos 301 automáticamente. Si bien puede usar el comando
rel=canonical link, que no quita las páginas más antiguas. Y así cualquiera puede llegar a ellos en cualquier momento. De hecho, si un cliente tiene una página marcada y usted cambia la URL pero sólo actualiza los motores de búsqueda usando un enlace
rel=canonical
, ese cliente nunca verá la nueva página.
El
El enlace
rel=canonical
es una herramienta útil para sitios con mucho contenido duplicado. Al entender cómo funciona, usted puede utilizarlo de manera efectiva. Pero en última instancia, es una herramienta que fue lanzada por los motores de búsqueda para ayudarles a mantener actualizados sus índices de búsqueda. Si no mantiene sus servidores limpios y actualizados también, sus clientes se verán afectados y su sitio podría resultar dañado. Utilícelo de manera responsable.