Capítulo 3: Diseña un sitio que le guste a los buscadores

Guía de posicionamiento web en Google. Capítulo 3: Diseña un sitio que le guste a los buscadores

Los buscadores de Internet están limitados en como rastrean e interpretan el contenido de la web. Un buscador no ve la página de la misma manera que tu y yo. En este capítulo me enfocaré en los aspectos técnicos de como construir (o modificar) páginas para que estén bien estructuradas tanto para los motores de búsqueda como para las personas que las visitan.

Comparte esta sección de la guía con tus programadores y diseñadores de tal manera que todos los que estén involucrados en la construcción de un sitio estén sincronizados.

Contenido indexable

Tu contenido más importante debe estar en el formato HTML para así mejorar tu desempeño en los listados de los buscadores. Las imágenes, archivos Flash, applets de Java y demás contenido que no esté en HTML es usualmente ignorado por los rastreadores de los buscadores, a pesar de que cada día hay mayores avances tecnológicos para indexar estos elementos. La manera más fácil de asegurar que las palabras y frases que muestras a tus visitantes sean visibles a los buscadores es ponerlas en el formato HTML dentro de la página. Sin embargo, también hay otros métodos para especificar ciertos contenidos web de tal manera que los buscadores puedan encontrar esta información:

  1. Proporciona texto “ALT” en las imágenes: Asigna los atributos “alt” en HTML a tus archivos gif, jpg o png para darle una descripción al contenido visual.
  2. Complementa las cuadros de búsqueda con enlaces rastreables y de navegación.
  3. Complementa los plug-ins de Flash/Java con texto en la página
  4. Proporciona una transcripción para tu contenido de audio y video si quieres que las frases sean indexadas por los buscadores.

¿Cómo ver tu sitio de la misma manera que un buscador?

La mayoría de los sitios web tienen graves problemas con su contenido indexable. Siempre es una buena idea comprobar como se ve tu sitio una vez que lo hayas publicado. Para ver que elementos de tu contenido son visibles ante los buscadores puedes usar herramientas como el cache de Google y SEO-browser.com para ver que contenido es visible.

Los sitios basados en Flash probablemente no mostraran, prácticamente, nada de información respecto al sitio. Es por eso que no sólo es necesario tener buen SEO, también es muy importante comprobar como se ven tus imágenes y enlaces a los ojos de los buscadores.

Así se ve una imagen en un navegador normal
Así se ve una imagen en un navegador normal

 

Así ven tu sitio los buscadores
Así ven tu sitio los buscadores

Estructura rastreable de enlaces

Así como los buscadores necesitan ver el contenido para poder enumerar las páginas en sus índices masivos basados en palabras clave, también necesitan ver los enlaces para así poder encontrar el contenido. Una estructura rastreable de enlaces (una que le permita a los buscadores encontrar las vías hacia un sitio) es vital para encontrar todas las páginas de un sitio. Hay cientos de miles de sitios que cometen el error de estructurar su navegación de tal forma que los buscadores no pueden acceder a las páginas. Esto dificulta la habilidad de los buscadores para enumerar las páginas en sus índices.

Ve este ejemplo:

Estructura de enlaces

En el ejemplo de arriba, el buscador de Google ha encontrado la página A y ve los enlaces hacia las páginas B y E. Sin embargo, aunque C y D pueden ser páginas importantes en el sitio, el buscador no tiene manera de llegar a ellas (o incluso saber si existen). Esto es porque no hay enlaces directos que apunten a las páginas C y D. Para Google, estas páginas no existen. Aun si estas páginas tienen buen contenido, palabras claves enfocadas, y exista un buen marketing,  nada de esto importará si los rastreadores no pueden llegar a tus páginas.

Anatomía de un enlace

Anatomía de un enlace

Las etiquetas de los enlaces pueden contener imágenes, texto u otros objetos. Todos estos proporcionan un área dentro de la página en la que se le puede hacer click. Estos enlaces son los elementos de navegación originales del Internet, también conocidos como hipervínculos (hyperlinks).

En la imagen de arriba, la etiqueta “<a” indica el inicio del enlace. La ubicación del enlace le dice al navegador (y a los buscadores) hacia donde apunta el enlace. En este ejemplo, la dirección web (URL) http://econstante.wpengine.com es la referencia. Después sigue la porción visible del enlace (lo que ven los usuarios), comúnmente llamada ancla o anclaje (en inglés: anchor text) dentro del mundo del SEO. El ancla describe la página a la que se está apuntando. La etiqueta “</a>” cierra el enlace para prevenir que continúe hacia los demás elementos de la página.

Este es el formato más básico de un enlace. Los buscadores lo comprenden muy bien y saben que sus rastreadores deben agregar esta información en sus bases de datos. También le permite a los buscadores seguirlo para indexar los contenidos de la página a la que los enlaces apuntan.

Razones por las que los buscadores no encuentran algunas páginas

Formularios que requieren envío de información

Si requieres que tus usuarios completen un formulario en línea antes de acceder a cierto contenido, es muy probable que los buscadores nunca vean esas páginas protegidas. Algunos formularios pueden incluir un acceso protegido con contraseña o una encuesta. En cualquiera de estos casos, los rastreadores no intentarán enviar información a los formularios, así que cualquier contenido o enlace que sea accesible mediante un formulario será invisible para los buscadores.

Los robots no usan cuadros de búsqueda

Cuadro de búsqueda

Aunque esto está relacionado con el punto anterior, es un problema muy común que merece ser mencionado. Algunos webmasters piensan que si ponen un cuadro de búsqueda en su sitio, los buscadores podrán encontrar todo lo que los usuarios usualmente buscan. Desafortunadamente, los rastreadores no ejecutan búsquedas para encontrar contenido. Si haces esto, es muy posible que dejes muchas páginas sin acceso a los buscadores. En pocas palabras: si no hay forma de seguir tus enlaces, tus páginas pueden terminar en el anonimato.

Enlaces en JavaScript

Si usas JavaScript para crear enlaces, podrás ver que los buscadores: no rastrean tu enlace, o le dan poco peso a los enlaces que se encuentran dentro del código. Si quieres que los buscadores encuentren todo tu contenido siempre es mejor que uses HTML para crear estos enlaces.

Los enlaces fueron bloqueados mediante la etiqueta Meta Robots o el archivo robots.txt

La etiqueta Meta Robots y el archivo robots.txt permiten que el dueño del sitio restrinja el acceso a una página. En muchas ocasiones los webmasters no se dan cuenta que ciertas páginas de su sitio han sido bloqueados al usar esta etiqueta o el archivo robots.txt. Esto puede suceder cuando intentan bloquear el acceso de ciertos robots dañinos a su página y al final del día afectan la búsqueda de los rastreadores.

Frames o iframes

Técnicamente, los enlaces en los frames y los iframes son rastreables pero presentan problemas estructurales para los buscadores en términos de organización y seguimiento. A menos que seas un usuario avanzado con gran entendimiento técnico de como indexan y siguen los buscadores los enlaces en frames, te recomiendo que mejor te alejes de ellos.

Enlaces en Flash, Java y otros plug-ins

Flash y Java

Aunque esto ya fue repetido anteriormente, los buscadores no entienden el contenido dentro de los plug-ins como Flash o Java y por lo tanto no pueden rastrear los enlaces que se encuentren adentro.

Las páginas con cientos o miles de enlaces.

Los buscadores sólo rastrean una cierta cantidad de enlaces en una sola página. Esta restricción fue puesta para disminuir el spam y conservar los rankings.


rel=”nofollow”

Rel=”nofollow” puede ser usado con la siguiente sintaxis:

<a href="http://econstante.wpengine.com" rel="nofollow">Buscadores: No lo sigan</a>

Los enlaces pueden tener muchos atributos. Los buscadores ignoran la mayoría de estos atributos con la importante excepción del atributo rel=”nofollow”. En el ejemplo de arriba, al agregar este atributo le digo a los buscadores que no quiero que este enlace sea interpretado como un apoyo a la página. Es decir, no quiero ayudarle a que suba sus rankings.

Nofollow (que significa “do not follow”, en español: no lo sigas) le dice a los buscadores que no sigan un enlace (aunque algunos si lo hacen). El atributo de nofollow apareció como un método de detener los comentarios en blogs, libros de visitas y la inyección de spam mediante enlaces. En los últimos años se ha transformado en una manera de decirle a los buscadores que le quiten cualquier valor a ese enlace.

Algunos buscadores siguen el enlace aunque no le dan tanto peso en sus algoritmos para clasificar el enlace.

Entonces… ¿los enlaces “nofollow” son malos?

Aunque los enlaces nofollow no transmiten tanto valor como los enlaces normales, es recomendable que un sitio tenga enlaces nofollow apuntados hacia él. Esto hace que un sitio se vea real a los ojos de los buscadores pues muestra que tiene un perfil de enlaces naturales.

Google menciona que en la mayoría de los casos no siguen los enlaces nofollowy tampoco transfiere PageRank o el texto del enlace a través de su web. Esencialmente, al usar nofollow ocasionas que Google saque esos enlaces de su gráfica general de la web. En pocas palabras: los enlaces nofollow carecen de peso y son interpretados como texto HTML (como si los enlaces no existieran).

Bing & Yahoo: Bing tampoco toma los enlaces nofollow dentro de su gráfica. Sin embargo, sus rastreadores pueden utilizar los enlaces nofollow para descubrir nuevo contenido en la red. Ojo: de todas maneras no tienen valor alguno para los rankings.

Como usar y dirigir las palabras clave

Palabras clave

Las palabras clave son fundamentales para el proceso de búsqueda. Son los bloques que construyen el lenguaje y las búsquedas. De hecho, toda la ciencia de búsqueda y recuperación de información (incluídos los motores de búsqueda en la red como Google) se basa en las palabras clave. A medida que los buscadores rastrean e indexan los contenidos de las páginas alrededor de la web, estos le dan seguimiento a esas páginas en índices basados en palabras clave (es decir, no guardan cada página en una base de datos). Las compañías de búsqueda tienen millones de bases de datos pequeñas y cada una está enfocada en una palabra clave o en frases particulares que permiten a los buscadores recuperar los datos en una fracción de segundo.

Obviamente, si tu quieres que tu página tenga la posibilidad de que aparezca en los resultados debes asegurarte que uses palabras clave. Por ejemplo, si quieres aparecer en los resultados cuando alguien busque “perro” deberás asegurarte que la palabra “perro” sea parte del contenido rastreable de tu documento.

Domina las palabras clave

Las palabras clave determinan como te comunicas con los buscadores. Cuando ingresas palabras en un buscador, éste devuelve la información de acuerdo a las palabras que ingresaste. Factores como el orden de las palabras (“comida para vacas” vs “vacas para comida”), la ortografía, la puntuación y el uso de mayúsculas proporcionan información adicional a los buscadores para ayudarlos a obtener las páginas correctas y clasificarlas.

Los buscadores miden como son usadas las palabras clave en las páginas para determinar que tan relevante es un documento con respecto a una consulta. Una de las mejores formas de optimizar los resultados de una página es que te asegures que las palabras clave que quieres que sean rankeadas aparezcan en los títulos, textos y la metadata (las etiquetas Meta).

Por lo general, mientras más específicas sean tus palabras claves, reducirás la competencia para esa búsqueda. Por ejemplo, es más fácil competir si tu palabra clave es “100 años de soledad” (un término mucho más específico) que si tu palabra palabra clave es “libros” (una palabra clave con mucha competencia y muchos resultados).

No abuses de las palabras clave

Hay personas que han abusado de las palabras clave desde que iniciaron los buscadores en línea. En un principio era fácil rellenar todos los campos con palabras clave (el texto, los URLs, las etiquetas meta y los enlaces). Esto era posible porque los buscadores le daban mayor relevancia a aquellos sitios que tuvieran una gran cantidad de palabras claves relacionadas a la búsqueda. Los tiempos han cambiado y este tipo de prácticas pueden dañar más a tu sitio que beneficiarlo. A medida que los buscadores se han sofisticado, estos pueden analizar mejor los textos y encontrar de que se trata el tema del que escribes.

La mejor forma de usar las palabras clave es de una manera natural y estratégica. Por ejemplo, si tu página es acerca de la “Torre de Pisa” incluye contenido relevante como la historia de la torre, información de ésta o incluso hasta de hoteles en Pisa que se encuentren alrededor de esta torre. Si tratas de meter la palabra clave “Torre de Pisa” en un sitio de alimentos para gatos, tus esfuerzos para rankear “Torre de Pisa” serán un completo fracaso.

El punto de usar palabras claves no es estar en el puesto más alto de cada una de las palabras que uses. Se trata de posicionarse en los primeros lugares en aquellas palabras que la gente busca y encuentra lo que tu sitio proporciona.

SEO On-Page (SEO dentro de la página)

El uso de palabras clave todavía es parte de los algoritmos de los buscadores. Aquí te dejo el proceso que puedes usar para mejorar el SEO de tu página:

  • Usa la palabra clave en el título de tu página al menos una vez. Trata de mantener la palabra clave lo más cerca del principio del título.
  • Usa tu palabra clave al principio de tu página.
  • Usa la palabra clave al menos dos o tres veces (incluye variaciones) en el contenido de tu página.
  • Pon la palabra clave al menos una vez en el atributo “ALT” en alguna de las imágenes de la página. No sólo ayuda en las búsquedas, también es posible obtener tráfico cuando se hace una búsqueda de imagen.
  • Al menos una vez en la dirección de tu página (URL).
  • Al menos una vez en la descripción meta. Aviso: la descripción meta no influye en los rankings de los buscadores pero ayuda a atraer clicks de las personas que buscan. La descripción meta sirve como un previo a lo que viene en la página.

No uses las palabras clave en el anclaje de tus enlaces cuando las apuntes hacia otras páginas de tu sitio.


La etiqueta TITLE

Etiqueta Title

La etiqueta “Title” debe ser una descripción precisa y concisa del contenido de tu página. Es crítica para la experiencia del usuario y la optimización de la página web.

Sigue estos consejos a la hora de titular tu publicación:

Considera el tamaño

Los buscadores sólo muestran los primeros 65-75 caracteres de la etiqueta de Title en los resultados de búsquedas (si te pasas de tamaño mostrarán tres puntos suspensivos “…” para mostrar que el título fue cortado). Por lo general, este también es el límite permitido por la mayoría de los sitios de social media.

Incluye las palabras claves más importantes al principio

Tendrás más beneficio si las palabras claves se encuentran más cerca del título.

Toma en cuenta que tan legible y que impacto emocional provocas

Los títulos deben ser descriptivos y legibles. El título es la primera impresión e interacción con tu marca y debe de dar una impresión positiva lo antes posible.


Las etiquetas META

Las etiquetas meta sirven para otorgarle más información a los buscadores sobre tu sitio. Aquí te muestro algunas, así como una breve descripción de su uso:

Meta Robots

La etiqueta Meta Robots sirve para controlar la actividad de los rastreadores en tu página. Hay varias maneras en las que esta etiqueta se puede usar:

  • index/noindex le dice al buscador si la página debe ser rastreada y guardada en el índice. Si usas el parámetro “noindex” los buscadores excluirán la página del índice. Los buscadores asumen que pueden indexar todas las páginas, así que usar el valor “index” es innecesario.
  • follow/nofollow le dice al buscador si los enlaces de la página deben ser o no rastreados. Si usas el parámetro “nofollow” los buscadores harán caso omiso a los enlaces (no usarán los enlaces para descubrir otros enlaces ni para rankearlos) que se encuentran dentro de la página (es similar a usar rel=”nofollow” en los enlaces, sólo que esto afecta a la página completamente). Por default, los buscadores asumen que las páginas se pueden seguir.
    Ejemplo: <META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
  • noarchive se usa para restringir a los buscadores de guardar una copia de la página. Por default, los buscadores mantienen copias visibles de todas las páginas que han indexado.
  • nosnippet le informa a los buscadores que deben evitar mostrar un bloque descriptivo de texto a un lado del título y URL de la página en los resultados de búsqueda.
  • noodp/noydir son parámetros especializados que le dicen a los buscadores que no obtenga un bloque descriptivo del Open Directory Project o del directorio de Yahoo!.

Meta Description

La etiqueta de meta description existe para describir brevemente de que trata el contenido de la página. Los buscadores no usan las palabras clave en esta etiqueta para los rankings pero sirven como una manera de presentar el contenido de la página de una manera concisa.

Esta etiqueta hace la función del copy en el marketing de búsqueda. Esto significa que es la parte de los resultados que atrae a los lectores a tu sitio una vez que aparece en los rankings. Es extremadamente importante en la medida que una descripción completa e interesante creará un mayor porcentaje de clicks hacia tu página.

Las descripciones meta pueden ser del tamaño que quieras pero los buscadores cortarán tu descripción después de los 160 caracteres. Es recomendable no excederse de estos límites.

Si no existe la descripción meta, los buscadores crearán una descripción de otros elementos de la página que encuentren.

Etiquetas meta que no son tan importantes

Meta Keywords: Hace años la etiqueta meta keywords tenía valor, sin embargo, hoy en día esto ya no es útil para el posicionamiento web de tu sitio.

Meta Refresh, Meta Revisit-after, Meta Content-type, y otras etiquetas: Estas etiquetas tienen sus usos para el SEO pero son menos críticas para el proceso de optimización. Si quieres saber más detalles, revisa el sitio de Google Webmaster para encontrar más información.


Guía para la construcción de un buen URL

Ejemplo de un URL

Las URLs son las direcciones de los documentos en la red y son de gran valor para los buscadores. Aquí hay algunos puntos que debes considerar cuando crees la dirección de tus páginas:

Trata de ser exacto

Ponte en el lugar de tu usuario y ve tu dirección web. Si puedes predecir fácil y exactamente de que trata el contenido de tu página con solo ver el URL entonces vas por el camino correcto. No necesitas poner cada detalle en tu dirección pero trata de englobar la idea general de la página.

Entre más corta sea la dirección, mejor

Sí, una URL que sea descriptiva es importante pero trata de ser lo más conciso que puedas. Disminuye el tamaño de la dirección y harás que sea más fácil de copiar y pegar en blogs, e-mails, mensajes de texto. Además ayudará a que sea más visible en los resultados del buscador.

El uso de palabras clave es importante (sólo no te excedas)

Si tu página se enfoca en un término (o frase) específico, trata de incluirla en el URL. Sin embargo, no te excedas y trates de poner multiples palabras clave para mejorar tu SEO. Si haces esto es posible que los filtros de spam en los buscadores piensen que tratas de engañarlos y disminuyan tu posición en los rankings.

Haz tus direcciones estáticas

Las mejores direcciones web son aquellas que cualquiera puede leer y entender. Aquellas URLs que no tienen parámetros, números y símbolos.

Por ejemplo, si tu URL es http://econstante.wpengine.com/blog?id=123456 trata de utilizar alguna tecnología como mod_rewrite de Apache o el ISAPI_rewrite de Microsoft para conventirla en algo como http://econstante.wpengine.com/tutoriales/posicionamiento-web. Los parámetros en una dirección web pueden disminuir tu ranking e indexación.

Utiliza el guión para separar palabras

No todas las aplicaciones web entienden bien las separaciones como el guión bajo (_), el signo de más (+) o los espacios (que se transforman en %20). Mejor usa el guión (-) para separar las palabras en tu URL.


Canonical vs El Contenido Duplicado

Contenido duplicado

El contenido duplicado es uno de los problemas más grandes que puede tener un sitio. En los últimos años, los buscadores han atacado los sitios con poco contenido o contenido duplicado al disminuir sus rankings en las búsquedas.

La canonicalización pasa cuando hay dos o más versiones duplicadas de una página en distintos URLs. Esto es muy común con los Sistemas de Gestión de Contenido (Content Management Systems o CMS). Por ejemplo, cuando ofreces una versión regular de una página y una versión optimizada para ser impresa. El contenido duplicado incluso puede aparecer en múltiples sitios. Esto presenta un gran problema para los buscadores: ¿cuál versión del contenido deben mostrar en las búsquedas?

Los buscadores son exigentes respecto a las versiones duplicadas de un material individual. Para proporcionar la mejor experiencia a la persona que busca, raramente mostrarán piezas duplicadas de contenido y escogerán la versión que más se acerque a la original. Al final del día, el contenido duplicado aparecerá en las posiciones más bajas de los rankings.

La canonicalización es la práctica de organizar el contenido de tal manera que cada pieza tenga una y solamente una URL. Si dejas multiples versiones de un contenido en tu sitio web (o sitios) podrías confundir a los buscadores y estos no sabrán con exactitud cual es el contenido correcto.

En cambio, si tu tomas todas las páginas duplicadas y las redireccionas con el código 301 de HTTP, los buscadores entenderán que sólo hay una página que deben mostrar en los listados de tu sitio.

Cuando hay múltiples páginas con el potencial de posicionarse bien y son combinadas en una sola página dejan de competir entre ellas y, además, crean mayor relevancia y popularidad en conjunto. Esto impactará de manera positiva en tu habilidad de posicionarte en los buscadores.

¡La etiqueta canonical al rescate!

La etiqueta Canonical es otra manera de reducir el contenido duplicado en un sitio y canonicalizar una URL individual. Esto puede usarse a través de distintos sitios, de un URL en un dominio a una URL distinta en otro dominio distinto.

Usa la etiqueta canonical dentro de una página que contenga contenido duplicado. Apunta la etiqueta al URL principal que quieras posicionar.

Y ¿cómo funciona?

<link rel="canonical" href="http://econstante.wpengine.com/tutoriales"/>
Esta etiqueta le dice a los buscadores que la página en cuestión debe ser tratada como si fuera una copia de la URL http://econstante.wpengine.com/tutoriales y que todos los enlaces y las métricas que tenga deben aplicarse a esa URL en específico.

Para hacerlo más concreto:

imagina que creas una página para que se vea mejor impresa:

http://econstante.wpengine.com/imprimir/disenar-un-sitio-que-le-guste-a-los-buscadores

y es prácticamente idéntica a esta página que ves en este momento:

http://econstante.wpengine.com/tutoriales/disenar-un-sitio-que-le-guste-a-los-buscadores

Para evitar que Google o Bing piensen que la versión para imprimir es una página duplicada (y por lo tanto compita en los rankings contra esta página) usaría la etiqueta canonical.

Desde la perspectiva de un SEO, la etiqueta Canonical es similar al redireccionamiento 301 en HTTP. En esencia, le dices a los buscadores que distintas páginas deben considerarse como una (así como el 301) pero con la ventaja de no tener que redireccionar a los visitantes a una nueva URL.

 Regresa al capítulo 2 de la guía de posicionamiento web en GoogleContinúa al capítulo 4 de la guía posicionamiento web en Google

Regresa al principio de la guía de posicionamiento web en Google