WordPress: Crear sitemap

¿qué es un sitemap?

Un sitemap es un archivo .xml que se aloja en una URL de tu site que, aunque es pública, lo más normal es que sólo la visiten los bots de los distintos buscadores ( Google a la cabeza, por supuesto) y algún que otro freak en busca de errores para ponerte colorado.

Este archivo tiene una sintaxis propia muy bien definida para que funcione correctamente pero, en esencia, es eso, una página de tu site en un formato .xml especial.

¿para qué sirve un sitemap.xml?

Este archivo debería reflejar los últimos cambios que se han hecho en los artículos de tu blog, site corporativo, tienda virtual o lo que tengas presente, con una serie de consideraciones, las más importantes son:

  • La primera de ellas es que los cambios los debemos presentar en orden cronológico inverso, es decir, el último cambio en tu site debe aparecer el primero.
  • La segunda es que deben aparecer todos los cambios que has hecho en las URLs, no sólo por el orden de publicación.
  • La tercera es que debe seguir una sintaxis con elementos obligatorios y opcionales

¿Por qué es tan importante?

Como bien sabrás, el bot de Google es un bichito realmente ocupado y cuando entra en tu site para ver tu contenido nuevo lo único que hace es seguir enlaces y, cuanto más fácil le ofrezcas el contenido nuevo, más va a aprovechar su tiempo en tu site y eso siempre te conviene.

Pues bien, cuando el bot de Google entra en tu blog (o lo que sea tu proyecto), el camino más probable que sigue es el siguiente:

  • Primero va a tu página de robots.txt para ver qué puede indexar y qué no.
  • Si eres listo, la última línea de tu robots.txt será un enlace al sitemap, que el bot de Google seguirá a pies juntillas.
  • Una vez el bot de Google entra en el sitemap.xml, seguirá la primera URL, que es el último cambio en tu blog, si no tiene la información, la escaneará y la guardará.
  • Seguirá este proceso hasta un contenido que esté duplicado.
  • Y luego se irá con la información fresquita para casa, listo para indexarla.

Si no lo hace así, tendrá que empezar a seguir enlaces en la home y las probabilidades de que se lleve contenido antiguo y deje contenido nuevo son altas y habrás conseguido dos cosas:

  • Ralentizar la indexación del contenido nuevo de tu site, cosa que no te interesa.
  • Hacer perder el tiempo al bot de Google, cosa que te interesa aún menos.

¿Qué elementos debe tener un sitemap?

Como te comenté más arriba se dividen en dos bloques distintos:

  1. Por un lado, las etiquetas obligatorias.
  2. Por otro lado, las opcionales.

Theme switcher

¡Cómo crear el sitemap perfecto de tu página web paso a paso! Actualizado

Sergio Ramírez LópezApr 20, 20177 min read

¡Cómo crear el sitemap perfecto de tu página web paso a paso! Actualizado

Hay dos opciones por las que llegaste a este artículo: o bien no sabes lo que es y quieres informarte para crear un sitemap a la perfección, o bien, ya tienes uno creado, pero no está funcionando como debería.

No te culpo, de hecho, la mayoría de los sitemaps que ves por ahí están directamente mal realizados, por eso hoy en este artículo quiero darte las claves para que entiendas realmente para qué sirve, cómo funciona y, lo más importante: Cómo puedes crear un sitemap.xml que te dé todo su potencial.

Dicho esto, vamos a ir empezando.

Antes de nada, ¿qué es un sitemap?

Un sitemap es un archivo .xml que se aloja en una URL de tu site que, aunque es pública, lo más normal es que sólo la visiten los bots de los distintos buscadores ( Google a la cabeza, por supuesto) y algún que otro freak en busca de errores para ponerte colorado.

Este archivo tiene una sintaxis propia muy bien definida para que funcione correctamente pero, en esencia, es eso, una página de tu site en un formato .xml especial, ni más, ni menos.

Muy bien, ¿para qué sirve un sitemap.xml?

En realidad, para ti no sirve de nada, pero le es de mucha utilidad al buscador y, en este caso, es lo que importa.

Este archivo debería reflejar los últimos cambios que se han hecho en los artículos de tu blog, site corporativo, tienda virtual o lo que tengas presente, con una serie de consideraciones, las más importantes son:

  • La primera de ellas es que los cambios los debemos presentar en orden cronológico inverso, es decir, el último cambio en tu site debe aparecer el primero.
  • La segunda es que deben aparecer todos los cambios que has hecho en las URLs, no sólo por el orden de publicación.
  • La tercera es que debe seguir una sintaxis con elementos obligatorios y opcionales que veremos un poquito más adelante.

¿Por qué es tan importante?

Como bien sabrás, el bot de Google es un bichito realmente ocupado y cuando entra en tu site para ver tu contenido nuevo lo único que hace es seguir enlaces y, cuanto más fácil le ofrezcas el contenido nuevo, más va a aprovechar su tiempo en tu site y eso siempre te conviene.

Pues bien, cuando el bot de Google entra en tu blog (o lo que sea tu proyecto), el camino más probable que sigue es el siguiente:

  • Primero va a tu página de robots.txt para ver qué puede indexar y qué no.
  • Si eres listo, la última línea de tu robots.txt será un enlace al sitemap, que el bot de Google seguirá a pies juntillas.
  • Una vez el bot de Google entra en el sitemap.xml, seguirá la primera URL, que es el último cambio en tu blog, si no tiene la información, la escaneará y la guardará.
  • Seguirá este proceso hasta un contenido que esté duplicado.
  • Y luego se irá con la información fresquita para casa, listo para indexarla.

Si no lo hace así, tendrá que empezar a seguir enlaces en la home y las probabilidades de que se lleve contenido antiguo y deje contenido nuevo son altas y habrás conseguido dos cosas:

  • Ralentizar la indexación del contenido nuevo de tu site, cosa que no te interesa.
  • Hacer perder el tiempo al bot de Google, cosa que te interesa aún menos.

Vamos, que la accesibilidad de los buscadores a tu proyecto está en juego.

Poca broma.

Con análisis de backlinks

estudia tus perfiles de backlinks y los de la competencia¡Prueba ahora! →

ADS illustration

¿Qué elementos debe tener un sitemap?

Como te comenté más arriba se dividen en dos bloques distintos:

  1. Por un lado, las etiquetas obligatorias.
  2. Por otro lado, las opcionales.

Vamos a ver las más importantes:

Etiquetas obligatorias

Sólo son tres y muy sencillas:

  1. La primera de ellas es que debe comenzar por la etiqueta <urlset> y la etiqueta de cierre será siempre </urlset>.
  2. La segunda es que cada URL debe tener la etiqueta <url>, así separamos una página de otra.
  3. La tercera, cada dirección URL debe tener la etiqueta <loc>.

Con estas tres simples cosas puedes tener un sitemap correctamente realizado.

Etiquetas opcionales (y muy recomendable)

Pero claro, si quieres hacer las cosas muy, muy bien puedes darle más información al buscador con otras tres etiquetas:

  1. Podemos decirle a Google la última modificación de cada URL (en la etiqueta <loc>) con el operador <lastmod>.
  2. Podemos decirle a Google cada cuánto tiempo cambia una URL con la etiqueta <changefrec>, pero ya te digo que Google pasa bastante de esto, porque tiene sus propios registros de cambio.
  3. Podemos darle a Google una escala de prioridades de indexación gracias a la etiqueta <priority>, pero ya te digo que Google va a hacer poco caso de esta etiqueta también.

¿Cómo crear un sitemap de forma automática?

Para instalarlo lo tienes realmente fácil, sólo debes ir, dentro de la barra de administración de tu WordPress a la parte de “ Plugins” y “Añadir nuevo”.

Una vez instalado debes ir a “Ajustes” y “XML Sitemap”, ahí tienes todas las opciones del plugin, de las que te dejo una muestra.

Si nos indica el error

Vamos a los ajustes y desmarcamos

En las opciones básicas debes marcar todas salvo la última, que sólo sirve para que ofrezcas tus estadísticas al plugin, el resto lo normal es que te vayan bien como están.

El siguiente bloque se llama “Páginas adicionales”, esto se usa para subdominios, landing pages huérfanas y cosas por el estilo, lo normal es que lo debas dejar vacío.

AGREGAR ARCHIVOS Y FOTOS SIUA

El tercer bloque se llama “Prioridad del artículo”, entre lo que pasa Google de la etiqueta y para lo que sirve, mi consejo es que lo dejes en la primera opción: “No utilizar el cálculo de prioridad automático”, aunque realmente da bastante igual.

El cuarto bloque es importante, se llama “Contenido del sitemap”, aquí debes marcar sólo:

  • Incluir la página principal.
  • Incluir artículos.
  • Incluir páginas estáticas.
  • Y la última opción, Incluir la fecha de última modificación.

El resto sólo te van a aportar ruido y contenido duplicado.

Quinto bloque: «Elementos excluidos». Salvo excepción, déjalos vacíos.

Sexto bloque: «Frecuencias de cambio», según lo ves en esta imagen:

Y con esto tendrás el sitemap.xml perfecto del todo, te dejo una imagen de cómo quedaría y te cuento un poquito más al respecto:

Como puedes ver el listado del sitemap no es en sí un listado de los últimos cambios puestos uno detrás de otro, es algo un poquito más sofisticado:

En realidad lo que te queda es un listado de cambios por mes y, si pinchas en cada URL, te dará los cambios de ese mes tan sólo.

Esto se hace así por dos cosas:

  • El último cambio permanece arriba del todo, que es el fin último del sitemap.
  • Sirve para eliminar las pocas probabilidades que tenía Google de confundir el sitemap con una granja de enlaces, penalizado por Penguin (sí, muy pocas veces, pero pasaba).

¿Cómo subir tu sitemap a Google Webmaster Tools?

a tienes tu sitemap.xml, cosa que no está mal, pero si lo subes a Webmaster Tools te va a quedar el círculo completo, y eso es lo que quieres, ¿verdad?

Antes de que sigas, si quieres saber más acerca de GWT hace poco realicé un megatutorial que puedes encontrar siguiendo el enlace del inicio de esta frase.

Para subir el sitemap lo tienes muy sencillo, los pasos son estos:

  • Ve a tu cuenta de Google Webmaster Tools.
  • En el menú izquierdo, ve a “Rastreo” y luego “Sitemaps”.
  • Ahí, en la parte superior “Añadir o Probar Sitemap”.
  • Completa la URL, que en la mayoría de los casos sería “sitemap.xml”.
  • Deja que Google indexe todo tu contenido muy contento.